Stability AI发布Stable Diffusion 3.5:高度可定制且免费开源的图像生成模型

今日,Stability AI推出了其最新的图像生成模型——Stable Diffusion 3.5。这一版本包括多个模型变体,如Stable Diffusion 3.5 Large和Stable Diffusion 3.5 Large Turbo,并将在10月29日发布Stable Diffusion 3.5 Medium。这些模型具有高度的可定制性,能够在消费类硬件上运行,并在宽松的Stability AI Community License下免费用于商业和非商业用途。

Stable Diffusion 3.5展示了Stability AI在图像生成领域的最新突破。其中,Stable Diffusion 3.5 Large拥有80亿个参数,具备卓越的质量和依从性,非常适合1 MP分辨率的专业用例。而Stable Diffusion 3.5 Large Turbo则是该模型的精简版本,只需4个步骤即可生成高质量图像,速度远超Stable Diffusion 3.5 Large。

 

即将发布的Stable Diffusion 3.5 Medium则拥有25亿个参数,采用了改进的MMDiT-X架构和训练方法,旨在“开箱即用”地在消费类硬件上运行。这个模型在质量和易于定制之间取得了平衡,能够生成分辨率在0.25到2 MP之间的图像。

 

为了提供灵活的构建基础,开发团队在模型中集成了Query-Key Normalization,稳定了模型训练过程并简化了进一步的微调和开发。然而,这种设计也带来了一些权衡,例如同一提示在不同种子下的输出可能会发生更大变化,这有意保留了基本模型中更广泛的知识库和不同样式。

 

特别值得一提的是,Stable Diffusion 3.5在以下方面表现出色:

可定制性:用户可以轻松微调模型以满足特定创意需求,或基于自定义工作流程构建应用程序。

高效性能:模型经过优化,可在标准消费类硬件上运行,无需高配置,尤其是Stable Diffusion 3.5 Medium和Stable Diffusion 3.5 Large Turbo型号。

多样化输出:模型能够生成代表世界多样性的图像,而不仅仅是某一类型的人,具有不同的肤色和特征,无需大量提示。

多功能风格:能够生成各种风格和美学的图像,如3D、摄影、绘画、线条艺术等几乎任何可以想象的视觉风格。

此外,分析表明Stable Diffusion 3.5 Large在快速依从性方面领先市场,在图像质量方面可与更大的型号相媲美。Stable Diffusion 3.5 Large Turbo在同尺寸模型中提供了最快的推理时间,同时保持了极具竞争力的图像质量和快速依从性。而Stable Diffusion 3.5 Medium则在快速粘附和图像质量之间取得了平衡,成为高效、高质量性能的首选。

 

 

关于Stability AI Community License,该许可证允许个人和组织免费将模型用于非商业用途,包括科学研究。对于年收入低于100万美元的初创公司、中小型企业和创作者,也可以免费将模型用于商业目的。同时,使用者可以保留对生成媒体的所有权,不受限制性许可的影响。

您现在可以从Hugging Face下载Stable Diffusion 3.5 Large和Stable Diffusion 3.5 Large Turbo,并在GitHub上下载推理代码。Stable Diffusion 3.5 Medium将于10月29日正式发布并提供下载。

版权声明:
作者:绘梦拾光
链接:https://www.diysq.com/?p=7788
来源:绘梦拾光原创
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>
文章目录
关闭
目 录