SD3.5模型详细测评!Stability.AI 发布 SD3.5 Large 模型,能否逆风翻盘超越FLUX?

原文链接:全网最详细图文测评!Stability.AI 发布 SD3.5 Large 模型,能否逆风翻盘超越FLUX? (chinaz.com)

SD3.5 的前世今生

6 月的时候,Stability AI发布了 Stable Diffusion 3 Medium,但是在在 FLUX 发布后 SD3 基本沦为弃子,由于各方面都被 FLUX 吊打,加上Stability AI 的霸王条款让 SD3 口碑直线下滑。这次官方吸取了教训,进一步开发了 3.5 版本,并且承诺SD3.5 即为构建者和创作者提供可广泛访问、尖端且在大多数用例中免费的工具

模型特点

就在几小时前,Stability AI 正式发布了 Stable Diffusion 3.5「large」版本。

这次更新有两大显著特点:

① 模型风格多样性提升,用户可通过修改提示词调取更多的图像风格

② 图像生成的 AI 质感降低,在光影和材质上更加自然,使生成的图像更具真实感

这次Stability AI 共发布了两个版本: Large 版本和 Large Turbo 版本

官方声称还有个 Medium 版本将在 10 月 29 号发布

目前两个版本的介绍:

  • Stable Diffusion 3.5 Large:该基本模型具有 80 亿个参数,具有卓越的质量和及时的依从性,是 Stable Diffusion 系列中最强大的。此型号非常适合 1 MP 分辨率的专业用例。

  • Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large 的精简版本只需 4 个步骤即可生成具有出色快速粘附性的高质量图像,使其比 Stable Diffusion 3.5 Large 快得多。

下图是官方提供的模型对比,可以看出美学不如 FLUX.1Dev,提示词遵循是目前最好的。

image.png

所以我们就测试一下 SD3.5 的水平到底如何,通过对比 FLUX 看看能否逆风翻盘重回 AI 绘图领域的巅峰

更详细的介绍在官方发布页:Stable Diffusion 3.5 — Stability AI

在线体验

Large 在线体验:https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

Turbo 在线体验:https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo

模型下载

Large 下载:https://huggingface.co/stabilityai/stable-diffusion-3.5-large

Turbo 下载:https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo

第一次下载的需要填一份联系信息才能下载

image.png

模型使用

我们下载官方提供的示例工作流和模型,模型放在 ComfyUI\models\checkpoints 中

image.png

把工作流拖入 ComfyUI 中,如果有缺失节点就安装缺失节点。如果之前有用过SD3的小伙伴应该是都安装过这些节点的。

image.png

我们需要加载三个 Clip 模型,没有的小伙伴可以在这里下载:https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main/text_encoders

下载完放在ComfyUI\models\clip 文件夹中

想追求最好的效果可以把 T5xxl 换成 FP16 版本的

image.png

出图效果

SD3.5 的出图非常占显存即使是 4090 24G 显存也非常容易被跑满,正常跑一张 1024*1024 的图大概要 40s

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

总结

通过上图的对比可以说是各有优缺点

SD3.5这里人物的手还是有问题,可能开发团队也知道这些问题,所以藏手的情况会比FLUX更明显一点

优点是SD3.5出图有时候更写实,FLUX对皮肤的绘制一般都比较油腻,SD3.5比较细腻更真实一点

长文本和提示词遵循的效果我觉得两者都差不多

美学方面有时候SD3.5会更好一些

性能方面SD3.5不如FLUX,出图比FLUX久显存占用还更多

不过目前FLUX生态更完善,所以短时间SD3.5应该还是超越不了FLUX的

### Stable Diffusion 3.5 Large Model Information #### 特性和性能提升 Stable Diffusion 3.5大型模型版本引入了一系列改进,旨在提高生成图像的质量和多样性。该模型通过增加网络层数量以及调整各层内部结构来实现更精细的特征捕捉能力[^1]。 #### 条件化机制的应用 对于有条件生成的任务而言,Stable Diffusion 3.5不仅支持基于类别的条件输入,还能够接受更加复杂的提示信息作为指导信号。这意味着用户可以通过提供详细的文本描述或其他形式的数据来精确控制最终输出的内容风格与主题方向[^2]。 #### 训练优化策略 为了使如此庞大的架构得以有效训练并保持高效推理速度,在设计上采取了多种措施以减少计算资源消耗。例如,在每一个模块、每一层乃至每一步扩散操作中都应用到了ToMe技术来进行参数共享或剪枝处理;同时探索不同的设计方案组合寻找最优配置方案[^3]。 #### 图像合成效率 得益于其独特的隐空间工作模式,即使是在高分辨率场景下也能维持较快的速度表现。相比于传统像素级迭代方法来说,这种方式能够在较短时间内完成高质量图片创作过程,并允许使用者灵活设置步数参数来自定义渲染精度[^4]。 ```python from diffusers import StableDiffusionPipeline pipeline = StableDiffusionPipeline.from_pretrained('stabilityai/stable-diffusion-3-large') image = pipeline(prompt="A beautiful landscape painting", num_inference_steps=75).images[0] ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值