目录
Stable Diffusion 3是什么?
Stable Diffusion 3 是由Stability AI推出的最新文本到图像模型,模型参数范围从 800M 到 8B,可适配不同类型设备,并称是迄今为止“最强大的文本到图像模型”。
Stable Diffusion 3 采用了类似Sora的新架构Diffusion Transformer ,结合了新技术 Flow Matching ,大大提高了多主题提示、图像质量、拼写能力的性能。
这个模型在多主题提示、图像质量和拼写能力方面有了显著的性能提升,特别擅长处理包含多个主题的复杂提示,能够生成更加精细和逼真的图像。
非常大的变化是,提示词支持使用自然语言了。例如下面的示例:
Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy.
提示词:史诗般的动漫艺术作品,一个巫师在夜晚的山顶上向黑暗的天空施放了一个宇宙咒语,上面写着“Stable Diffusion 3”,由五颜六色的能量组成。
Stable Diffusion 3生成图片示例
以下是官方发布的生成示例,确实在多主题提示、图像质量上有很大的提升。
Stable Diffusion 3适用人群
Stable Diffusion 3适用于需要快速、高效地从文本生成高质量图像的个人、开发者和企业。无论是艺术家寻求灵感、开发者构建应用程序,还是企业需要生成独特的视觉内容,Stable Diffusion 3都提供了一个强大的工具。
如何使用Stable Diffusion 3?
目前Stable Diffusion 3处于早期预览版,需要申请内测资格,点此申请加入候补名单。
申请通过后,官方会通过电子邮件通知并邀请你访问Stable Diffusion 3的 Discord 服务器体验。
了解更多信息,请前往官方博客:https://stability.ai/news/stable-diffusion-3