AI视频生成技术又一里程碑
智东西8月22日消息,据VentureBeat 8月20日报道,专注于3D内容生成技术的AI初创公司Luma AI发布了Dream Machine 1.5。该版本提高了AI视频生成效果,在逼真度、运动追踪及prompt理解等方面有所提升。此次升级距Dream Machine首次面世已过去2个月。
Dream Machine能够在120秒内生成包含120帧的高质量视频。用户只需简单输入相关提示,点击生成按钮,系统便会在1至2分钟内完成视频渲染。工具目前对所有公众开放,每个用户每月有30次的免费生成额度,但生成结果不可商用。
Luma AI当日在社交平台X上宣布:“Dream Machine 1.5来了!它的文生视频、图生视频效果都得到了提升,prompt理解更为精准,自定义文本渲染能力也得到了改良!”
值得注意的是,新版本尤其增强了渲染文本的能力,这是AI视频生成技术一直面临的难题。这个进步为动态标题序列、动画标识设计和演示幻灯片制作等任务开辟了新的可能性。
体验地址:https://lumalabs.ai/dream-machine/creations
一、会3D文字渲染、能理解阿拉伯语,视频生成只需2分钟
一直关注AI领域的平面设计师@aziz4ai在社交平台X上分享了Dream Machine 1.5的应用实例,展示了该模型在创造复杂视觉效果方面的能力。在其中一个实例中,该模型生成了“彩虹色液体3D文本”,以“LUMA”字样呈现,展现出流畅且精致的视觉效果。
▲@aziz4ai用Dream Machine 1.5生成的彩虹色液体3D文本“LUMA”
此外,Dream Machine 1.5在处理非英文prompt方面取得了进步。在@aziz4ai分享的另一个应用实例中,prompt使用了阿拉伯语输入,其中包含一个要求:一个男人在木板上切肉,然后将这些肉块以电影化手法变成“每日现切”(“يحضر يوميا”)字样。
▲@aziz4ai用Dream Machine 1.5生成的阿拉伯语字样
生成的视频很好地将阿拉伯语文字融进了画面,既展现了Dream Machine 1.5的文本渲染能力,也体现了它的多语言处理能力(Multilingual Processing)。
此次模型优化还提升了视频生成速度,约2分钟即可生成一段长达5秒钟的高清视频。这一效率提升,尤其适用于需要快速生成大量视频作品的内容创作者和市场营销人员。
二、业界率先公测,已积累大量用户反馈
尽管AI视频生成领域的竞争日益激烈,但Luma AI将产品开放公测的策略使其脱颖而出。
相较而言,OpenAI的Sora虽然拥有强大性能,但自今年2月16日公布以来仍处于内测阶段,仅供部分合作伙伴使用,这种排他性限制了它的实际测试和应用。另一方面,快手的可灵于今年6月6日推出、7月24日全面开放内测,短时间内便获得了众多关注。
而Luma AI的Dream Machine早在6月12日就开放了公测,因而积累了庞大的用户基础,并收集了大量的应用反馈。这使得Luma AI能够针对各类实际应用场景进行模型优化。结合广大用户反馈和实际应用数据,Luma AI得以解决具体的用户痛点,并进一步增强大部分用户最需要的功能。
一些行业分析师认为,开放公测能催生更为稳定可靠且功能丰富的AI视频工具。来自各行各业的用户创作的内容,为Luma AI提供了丰富的数据集,使得其模型迭代速度有机会超过内测的模型。
诚然,这种公测策略也带来了挑战。随着AI视频生成变得越来越普及,如何防止滥用,如深度伪造和误导性内容,成为了行业面临的主要难题。尤其需要强有力的监控机制以及伦理规范加以约束。Luma AI对此尚未明确表明立场。
结语:愈演愈烈的AI视频生成大战
自Sora发布以来,国内外的视频生成新模型新工具密集发布。据统计,仅国内,当前便有约20家公司推出了自研AI视频模型。
前有快手可灵发布后1个月就实现3次重大升级,后有Luma AI 2个月迭代Dream Machine新版本……尽管有飞快的更新速度,AI视频生成仍面临着可生成长度过短、画面形变等问题。在越来越卷的赛道上,谁将成为最后赢家?
来源:VentureBeat
文章来源微信公众号“智东西”(ID:zhidxcom),作者“智东西”
发评论,每天都得现金奖励!超多礼品等你来拿
登录 后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则