2025-02-10
AI
00
请注意,本文编写于 80 天前,最后修改于 80 天前,其中某些信息可能已经过时。

目录

1. Smoothed Energy Guidance(平滑能量引导)
2. Semantic CFG(S-CFG)
3. Perturbed Attention Guidance(扰动注意力引导)
4. CFG Scheduler(CFG调度器)
5. Multi-Concept T2I-Zero
6. Seek for Incantations

在 Stable Diffusion WebUI 中,Incantations 是一组旨在提升图像质量和提示词遵循性的算法扩展。

ps:由于这部分参数太多了,这篇就先不进行太过详细的介绍了,后续如果觉得哪部分比较好用,再单独出文章记录吧。

以下是各个功能模块的粗略介绍:

1. Smoothed Energy Guidance(平滑能量引导)

通过对中间块层的自注意力进行高斯模糊,减少能量曲率,从而提高输出图像的质量。

  • SEG Blur Sigma:控制高斯模糊的标准差值,影响模糊程度。
  • Start Step:指定开始应用平滑能量引导的步骤。
  • End Step:指定停止应用平滑能量引导的步骤。

2. Semantic CFG(S-CFG)

动态地根据语义区域调整分类器自由度(CFG)引导的强度,以提高图像与文本的对齐度。

  • SCFG Scale:调整语义CFG的缩放因子,影响引导强度。
  • SCFG R:控制交叉注意力图的细化程度,值越高,内存和计算需求越大。
  • Rate Min:CFG缩放的最小比例。
  • Rate Max:CFG缩放的最大比例。
  • Clamp Rate:限制CFG缩放的最大值。
  • Start Step:指定开始应用S-CFG的步骤。
  • End Step:指定停止应用S-CFG的步骤。

3. Perturbed Attention Guidance(扰动注意力引导)

通过对注意力图进行扰动,增强采样质量,作为对分类器自由度(CFG)的补充或替代方法。

  • Use Saliency-Adaptive Noise Fusion:启用改进的CFG与PAG结合的方法。
  • PAG Scale:控制PAG对生成图像的影响强度。
  • PAG Start Step:指定开始应用PAG的步骤。
  • PAG End Step:指定停止应用PAG的步骤。

4. CFG Scheduler(CFG调度器)

在指定的噪声区间内约束CFG的使用,允许在不显著改变构图的情况下使用较高的CFG水平。

  • CFG Interval:设置CFG的使用区间。
  • Clamp-Linear:线性调度的参数。
  • PCS:另一种调度方法的参数。
  • PAG Active:启用或禁用PAG功能。
  • PAG Scale:控制PAG的影响强度。

5. Multi-Concept T2I-Zero

通过仅调整文本嵌入来处理多概念的文本到图像生成,无需修改模型结构。

  • Delimiter:用于分隔不同概念的标记。
  • Word Replacement:替换特定词汇的策略。
  • Gamma:控制相似度的阈值。
  • Start Step:指定开始应用多概念T2I-Zero的步骤。
  • End Step:指定停止应用多概念T2I-Zero的步骤。

6. Seek for Incantations

通过提示词工程优化,提升文本到图像的扩散合成的准确性。

  • Prompt Optimization:优化提示词的策略。
  • Delimiter:用于分隔不同部分的标记。
  • Word Replacement:替换特定词汇的策略。
  • Gamma:控制相似度的阈值。
  • Start Step:指定开始应用Seek for Incantations的步骤。
  • End Step:指定停止应用Seek for Incantations的步骤。

通过合理配置上述参数,用户可以在使用 Stable Diffusion WebUI 时,获得更高质量的图像生成效果。

本文作者:DingDangDog

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!