Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

2024-02-24 阅读 8 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

SD3来了，CEO剧透更多隐藏功能

全新的Stable Diffusion效果有多好，再给大伙奉送一些。

当然，所有出图均来自官方，比如StabilityAI媒体负责人：

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

不得不说，文字效果实在最为吸人眼球，各种形式都能呈现得相当清楚和“应景”。

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

而看到上面这幅图，不得不想到“Midjourney尴尬亮相学术界：为生物学论文乱配图”一事——有了SD3之后，我们是不是可以制作非常专业的学术配图了？

除了这些，SD3的“酒精水墨画”也相当别出心裁：

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

动漫风格：

again，你可以在上面加清晰的文字了。

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

由于目前需要排队申请，大伙还不好实际测试摸底。

不过有机智的网友已经用相同的提示词喂给了Midjourney（v 6.0）。

比如开头的那张“红苹果与黑板字”（prompt：cinematic photo of a red apple on a table in a classroom, on the blackboard are the words “go big or go home” written in chalk）

最终Midjourney给出的结果如下：

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

从这组对比来看，可以说是高下立判——SD3无论是文字拼写还是质量、色彩协调性等方面都更胜一筹。

就在今天，CEO Emad今天还剧透了SD3的更多新功能。

例如简单文字精准控制图像中每一个元素，包括替换、删除。

最绝的是身后背景都能直接换成水族缸……甚至无缝转视频，毫无改动痕迹。

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

除此之外，还有3D视图。这些全部都由SD3完成。

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

技术方面，目前，模型可选择的参数范围在800M到8B。

详细的技术报告还未公布，官方目前只透露主要结合了扩散型transformer架构以及flow matching。

前者实际上同Sora一样，附上的技术论文正是22年William Peebles同谢赛宁合写的DiT。

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

DiT首次将Transformer与扩散模型结合到了一起，相关论文被ICCV 2023录用为Oral论文。

在该研究中，研究者训练了潜在扩散模型，用对潜在 patch进行操作的 Transformer 替换常用的 U-Net 主干网络。他们通过以Gflops衡量的前向传递复杂度来分析扩散 Transformer (DiT) 的可扩展性。

而后者flow matching同样也是来自22年，由Meta AI以及魏茨曼科学研究所的科学家完成。

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

他们提出了基于连续归一化流（CNFs）的生成模型新范式，以及flow matching的概念，这是一种基于回归固定条件概率路径的矢量场的免模拟CNFs的方法。结果发现使用带有扩散路径的flow matching，可以训练出来的模型更稳健和稳定。

不过最近看了这么多视频生成进展，也有网友表示：

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

你觉得呢？

One More Thing

除此之外，也就在前一天，他们的视频产品Stable Video正式开放公测。

基于SVD1.1（Stable Video Diffusion 1.1），人人可用。

主要支持文生视频和图生视频两个功能。

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

参考链接：

[1]https://stability.ai/news/stable-diffusion-3

[2]https://arxiv.org/abs/2212.09748

[3]https://arxiv.org/abs/2210.02747

[4]https://twitter.com/pabloaumente/status/1760678508173660543

文章来自于微信公众号“量子位”（ID: QbitAI)，作者 “白交、丰色”

国产大模型，不会开启“烧钱游戏”

关联网址

关联标签

#AI

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

2824 用户在看

AI写作网站自动的生成文章可以用吗？

137 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

74 用户在看

“如何选择最佳AI写作工具？这些秘诀一定要知道！”

63 用户在看

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

SD3来了，CEO剧透更多隐藏功能

One More Thing

国产大模型，不会开启“烧钱游戏”

谷歌Gemini生图功能紧急关闭，口碑一夜塌房，Yann LeCun：我早就知道

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

2824 用户在看

AI写作网站自动的生成文章可以用吗？

137 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

74 用户在看

“如何选择最佳AI写作工具？这些秘诀一定要知道！”

63 用户在看

Stable Diffusion 3更多隐藏功能曝光：文字可更改图片细节

SD3来了，CEO剧透更多隐藏功能

One More Thing

国产大模型，不会开启“烧钱游戏”

谷歌Gemini生图功能紧急关闭，口碑一夜塌房，Yann LeCun：我早就知道

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿