请注意,本文编写于 80 天前,最后修改于 80 天前,其中某些信息可能已经过时。
目录
1. Smoothed Energy Guidance(平滑能量引导)
2. Semantic CFG(S-CFG)
3. Perturbed Attention Guidance(扰动注意力引导)
4. CFG Scheduler(CFG调度器)
5. Multi-Concept T2I-Zero
6. Seek for Incantations
在 Stable Diffusion WebUI 中,Incantations 是一组旨在提升图像质量和提示词遵循性的算法扩展。
ps:由于这部分参数太多了,这篇就先不进行太过详细的介绍了,后续如果觉得哪部分比较好用,再单独出文章记录吧。
以下是各个功能模块的粗略介绍:
1. Smoothed Energy Guidance(平滑能量引导)
通过对中间块层的自注意力进行高斯模糊,减少能量曲率,从而提高输出图像的质量。
- SEG Blur Sigma:控制高斯模糊的标准差值,影响模糊程度。
- Start Step:指定开始应用平滑能量引导的步骤。
- End Step:指定停止应用平滑能量引导的步骤。
2. Semantic CFG(S-CFG)
动态地根据语义区域调整分类器自由度(CFG)引导的强度,以提高图像与文本的对齐度。
- SCFG Scale:调整语义CFG的缩放因子,影响引导强度。
- SCFG R:控制交叉注意力图的细化程度,值越高,内存和计算需求越大。
- Rate Min:CFG缩放的最小比例。
- Rate Max:CFG缩放的最大比例。
- Clamp Rate:限制CFG缩放的最大值。
- Start Step:指定开始应用S-CFG的步骤。
- End Step:指定停止应用S-CFG的步骤。
3. Perturbed Attention Guidance(扰动注意力引导)
通过对注意力图进行扰动,增强采样质量,作为对分类器自由度(CFG)的补充或替代方法。
- Use Saliency-Adaptive Noise Fusion:启用改进的CFG与PAG结合的方法。
- PAG Scale:控制PAG对生成图像的影响强度。
- PAG Start Step:指定开始应用PAG的步骤。
- PAG End Step:指定停止应用PAG的步骤。
4. CFG Scheduler(CFG调度器)
在指定的噪声区间内约束CFG的使用,允许在不显著改变构图的情况下使用较高的CFG水平。
- CFG Interval:设置CFG的使用区间。
- Clamp-Linear:线性调度的参数。
- PCS:另一种调度方法的参数。
- PAG Active:启用或禁用PAG功能。
- PAG Scale:控制PAG的影响强度。
5. Multi-Concept T2I-Zero
通过仅调整文本嵌入来处理多概念的文本到图像生成,无需修改模型结构。
- Delimiter:用于分隔不同概念的标记。
- Word Replacement:替换特定词汇的策略。
- Gamma:控制相似度的阈值。
- Start Step:指定开始应用多概念T2I-Zero的步骤。
- End Step:指定停止应用多概念T2I-Zero的步骤。
6. Seek for Incantations
通过提示词工程优化,提升文本到图像的扩散合成的准确性。
- Prompt Optimization:优化提示词的策略。
- Delimiter:用于分隔不同部分的标记。
- Word Replacement:替换特定词汇的策略。
- Gamma:控制相似度的阈值。
- Start Step:指定开始应用Seek for Incantations的步骤。
- End Step:指定停止应用Seek for Incantations的步骤。
通过合理配置上述参数,用户可以在使用 Stable Diffusion WebUI 时,获得更高质量的图像生成效果。
本文作者:DingDangDog
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA
许可协议。转载请注明出处!