一、概括
Stability AI 的开源图像生成模型 Stable Diffusion,简称SD。Stable Diffusion 是一个文本至图像的模型,它能让数十亿人在几秒钟内创建出令人赞叹的艺术品。在速度和质量方面,它都有所突破,这意味着它能在消费者级别的 GPU 上运行……这能够让研究人员和……公众在各种条件下运行,使图像生成技术走向大众。
官网地址:Stability.Ai
github地址:GitHub - Stability-AI/stability-sdk: SDK for interacting with stability.ai APIs (e.g., stable diffusion inference)
二、简介
Stable Diffusion 基于名为潜在扩散模型(latent diffusion models,LDMs)的图像生成技术。与其他的流行的图像合成方法不同,如生成对抗网络(generative adversarial networks,GANs)和DALL-E使用的自动回归技术,LDMs 通过在一个潜在表示空间中迭代“去噪”数据来生成图像,然后将表示结果解码为完整的图像。LDM 是由Ludwig Maximilian University of Munich的机器视觉与学习(Machine Vision and Learning)研究组开发的,并在最近的 IEEE / CVF 计算机视觉和模式识别会议(Computer Vision and Pattern Recognition Conference)上发表的一篇论文中进行了阐述。在今年早些时候,InfoQ 曾经报道过谷歌的Imagen模型,它是另一个基于扩散的图像生成 AI。
Stable Diffusion 模型支持多种操作。与 DALL-E 类似,它能够根据所需图像的文本描述,生成符合匹配该描述的高质量图像。它还可以根据一个简单的草图再加上所需图像的文本描述,生成一个看起来更逼真的图像。Meta AI 最近发布了名为Make-A-Scene的模型,具有类似的图像至图像的功能。
三、使用方法
官方提供两种模式使用和协作。需要注册使用。高质量的服务需要付费。
1、公开测试版
测试版访问地址:DreamStudio
2、研究者
研究者访问申请地址:Research and Academia — Stability.Ai
4、我个人使用介绍截图参考:
在下方输入文字:
中文:在明媚的午后,一个美丽的小女孩,在清澈的湖水边荡秋千,脸上带着微笑
英文:In the bright afternoon, a beautiful little girl, swinging by the clear lake, with a smile on her face
如下图:
例子:
例子:
例子:
可以下载,生产图片后,点击右上角下载按钮进行下载: