Stable Diffusion 是用于图像生成的开放权重 AI 模型之一。与通过在线 API 提供的 Midjourney 或 DALL-E 不同,此模型可以使用您的显卡下载并在本地运行。功能更强大、内存更大的 GPU 可实现更快的图像生成和更高分辨率的输出。然而,情况并非总是如此,因为通过高级机器学习库进行优化和加速可以显着加快这一过程。
稳定性,AI 的 Stable Diffusion 3 Medium 是文本到图像生成的最先进(也是目前最受期待的)模型之一。它既不是 Stability AI 正在开发的最小模型也不是最大的模型,因为这个模型有 20 亿个参数(还计划有 800M 和 8B 版本);因此它被称为中等。用户现在可以下载 SD3 模型并将其用于非商业目的,而那些无法访问的人可以使用 Stability AI 的在线工具。

新 SD3 模型的主要优点是通过改进照片真实感获得更高质量的图像。它还能够根据更复杂的提示生成图像,并理解元素组合、空间关系、动作和样式。
新模型的主要特点之一是改进了排版。以前,这是一种简单的方法,可以确定图像是由 AI 生成还是手动创建的。这不会再那么容易了,因为它现在可以生成各种样式的文本,而且大多数时候,它不会出现错别字。根据这个例子,它比我少错别字(使用 StableSwarm 和 RTX 4090 生成):
Stability AI 一直在与 NVIDIA 和 AMD 合作,为两家 GPU 供应商提供特定于硬件的优化。对于 NVIDIA 来说,这包括使用 TensorRT 的能力,它可以将性能提高 50%。这适用于所有 GeForce RTX GPU。但是,请注意,需要一个特殊的 TensorRT 模型,该模型尚未发布。
对于 AMD,Stability AI 承诺为 AMD APU、GPU 甚至数据中心 Instinct MI300X GPU 提供优化的推理。AMD硬件不需要下载任何特殊型号。
如果您想下载和使用新模型,请查看Reddit上由 Stability AI 员工编写的指南。
相关文章
网友评论(共有 0 条评论)