词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!
| 来源 | 可选 — 通过 hermes skills install official/mlops/stable-diffusion 安装 |
| 路径 | optional-skills/mlops/stable-diffusion |
| 版本 | 1.0.0 |
| 作者 | Orchestra Research |
| 许可证 | MIT |
| 依赖项 | diffusers>=0.30.0, transformers>=4.41.0, accelerate>=0.31.0, torch>=2.0.0 |
| 平台 | linux, macos, windows |
| 标签 | Image Generation, Stable Diffusion, Diffusers, Text-to-Image, Multimodal, Computer Vision |
Pipeline (orchestration)
├── Model (neural networks)
│ ├── UNet / Transformer (noise prediction)
│ ├── VAE (latent encoding/decoding)
│ └── Text Encoder (CLIP/T5)
└── Scheduler (denoising algorithm)Text Prompt → Text Encoder → Text Embeddings
↓
Random Noise → [Denoising Loop] ← Scheduler
↓
Predicted Noise
↓
VAE Decoder → Final Image| Pipeline | 用途 |
|---|---|
StableDiffusionPipeline | 文本到图像(SD 1.x/2.x) |
StableDiffusionXLPipeline | 文本到图像(SDXL) |
StableDiffusion3Pipeline | 文本到图像(SD 3.0) |
FluxPipeline | 文本到图像(Flux 模型) |
StableDiffusionImg2ImgPipeline | 图像到图像 |
StableDiffusionInpaintPipeline | Inpainting |
| Scheduler | 步数 | 质量 | 适用场景 |
|---|---|---|---|
EulerDiscreteScheduler | 20-50 | 良好 | 默认选择 |
EulerAncestralDiscreteScheduler | 20-50 | 良好 | 更多变化 |
DPMSolverMultistepScheduler | 15-25 | 优秀 | 快速、高质量 |
DDIMScheduler | 50-100 | 良好 | 确定性生成 |
LCMScheduler | 4-8 | 良好 | 极速生成 |
UniPCMultistepScheduler | 15-25 | 优秀 | 快速收敛 |
| 参数 | 默认值 | 说明 |
|---|---|---|
prompt | 必填 | 目标图像的文本描述 |
negative_prompt | None | 图像中需要避免的内容 |
num_inference_steps | 50 | 去噪步数(越多质量越好) |
guidance_scale | 7.5 | Prompt 遵循程度(通常为 7-12) |
height, width | 512/1024 | 输出尺寸(8 的倍数) |
generator | None | 用于可复现性的 Torch generator |
num_images_per_prompt | 1 | 批量大小 |
| ControlNet | 输入类型 | 适用场景 |
|---|---|---|
canny | 边缘图 | 保留结构 |
openpose | 姿态骨架 | 人体姿态 |
depth | 深度图 | 3D 感知生成 |
normal | 法线图 | 表面细节 |
mlsd | 线段 | 建筑线条 |
scribble | 粗略草图 | 草图到图像 |