视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

2024-07-31 阅读 63 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

01 新增动漫风格、角色一致性更稳定

本次上线版本中新增了角色一致性、动漫风格等特色能力。

万物皆可二次元

在风格维度上，目前市面上的 AI 视频工具大多局限于写实风格或源于现实的想象。Vidu 除了能实现常见的写实等多元风格外，还新增动漫风格。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

在图生视频功能中，一些工具尽管也支持动漫图的上传，但常常出现画面崩坏、动幅小的问题。Vidu 的生成效果具备风格一致性，画面流畅。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

原图

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

Vidu 效果

角色一致性

Vidu 还有一项功能——角色一致性（Charactor To Video）。

在「图生视频」板块中上传图片，Vidu 支持首帧图和角色图两种选择。首帧图就是常见的图生视频功能，会实现基于首帧画面的连续生成。

后者则是角色一致性生成，用户可上传人像图或者自定义的角色图，之后通过文字描述，指定该角色的场景和动作等。

比如上传一张埃隆·马斯克的照片，通过输入描述词，就可以变身超级英雄钢铁侠。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

角色图

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

Prompt：Elon Musk wearing Iron Man armor, with a city night scene in the background

用户使用角色一致或图生视频功能，可以玩转「梗图」、「表情包」，甚至助力梦想实现。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

实测案例：原图（作为角色参考图）

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

Prompt：一个帅哥在变身成为奥特曼，画出正在变身的过程, 从一个普通人，变成完整的奥特曼

（作为人像图参考）

02 语意理解更准确，

官方声称生成速度业界最快

语义理解

Vidu 能够理解提示词中的字母、数字等，并且能够生成文字特效。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

prompt：一块生日蛋糕，上面插着蜡烛，蜡烛是数字「32」的形状

另外，Vidu 能够理解和表达第一人称、延时摄影等镜头语言，视频可控性提高。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

Prompt：Capture the journey of a single rose bud as it blossoms into full bloom agAInst a plain, black background. The time-lapse photography isolates the rose, emphasizing its delicate transitions from tight bud to an open, vibrant flower.

动态一致

在涉及复杂场景的视频中，Vidu 能够将运动主体与场景做较好分离，将前后景别分离开。画面中非重点物体的动态较少，画面主体动态完整，画面的真实感更强。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

大幅度、精准的动作有助于更好地表现情节和人物情绪，但是动作幅度一旦变大，画面容易崩坏。一些视频模型为保证流畅性会牺牲动幅。

相比之下，在一些主体动作幅度较大的场景中，Vidu 的动态画面流畅。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

画面质感

Vidu 能生成风格片段，比如科幻、西部和浪漫等类型电影。在构图、叙事、光影等方面，AI 能达到十分接近电影级的画面标准。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

另外，经典影片中极具标志性的视觉效果，Vidu 都能模仿和再现。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

《银翼杀手》中的赛博朋克氛围的未来城市夜景

Vidu 能够生成影视级特效画面，如弥漫的烟雾、炫目的炫光效果、爆炸场面等。

「在传统的影视制作中，特效的投入往往是一个巨大的数字，像一般爆炸特效镜头通常需要花几十万」，国内某资深特效总监说。用过 Vidu 后，他表示 Vidu 生成的爆炸生成效果已经非常接近影视制作的水准，这很令人吃惊。

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

生成速度业界最快

AI 视频工具还有个重要指标——推理速度。

目前，市面上的主流 AI 视频工具在生成 4 秒左右的视频片段时，用户通常需要等待 1 到 5 分钟，甚至更长。例如，Runway 最新推出的 Gen-3 工具需要 1 分钟来完成 5s 视频生成，而可灵需要 2-3 分钟。Vidu 将这一等待时间缩短至仅需 30 秒（可真实实测），速度比业内最快水平的 Gen-3 还要再快一倍。

Vidu 这次的更新版本带来了更丰富顺滑的创作体验，在视频生成领域，用户又多了一个选择。未来的视频模型竞争，只会越来越卷。

文章来源于“Founder Park”，作者“Founder Park”

小扎老黄亲密换衣炉边对谈！小扎竟破防爆粗，老黄自曝第一批Blackwell已出炉

关联网址

关联标签

#AI #大模型

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3661 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

184 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

155 用户在看

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

01

新增动漫风格、角色一致性更稳定

万物皆可二次元

角色一致性

02

语意理解更准确，

官方声称生成速度业界最快

语义理解

动态一致

画面质感

生成速度业界最快

小扎老黄亲密换衣炉边对谈！小扎竟破防爆粗，老黄自曝第一批Blackwell已出炉

英伟达黄仁勋：生成式AI的下一波浪潮是“物理AI”

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3661 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

184 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

155 用户在看

视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

01

新增动漫风格、角色一致性更稳定

万物皆可二次元

角色一致性

02

语意理解更准确，

官方声称生成速度业界最快

语义理解

动态一致

画面质感

生成速度业界最快

小扎老黄亲密换衣炉边对谈！小扎竟破防爆粗，老黄自曝第一批Blackwell已出炉

英伟达黄仁勋：生成式AI的下一波浪潮是“物理AI”

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿