ComfyUI PuLID 描述
PuLID 精准的人脸嵌入用于文本到图像生成
PuLID 是什么?
PuLID(Pure and Lightning ID customization)是一种用于文本到图像生成模型中无需调整的身份(ID)定制的新方法。它旨在将特定 ID(例如人脸)嵌入到预训练的文本到图像模型中,而不会破坏模型的原始能力。这允许生成特定人物的图像,同时仍然能够使用文本提示修改属性、样式、背景等。
PuLID 包含两个关键组件:
- 一个"Lightning T2I"分支,在标准扩散分支的同时,在几个去噪步骤内快速生成以 ID 为条件的高质量图像。这使得能够计算准确的 ID 损失以提高生成面孔的保真度。
- 有无 ID 调节的 Lightning T2I 路径之间的对比对齐损失。这指示模型如何嵌入 ID 信息而不污染模型原有的提示遵循和图像生成能力。
PuLID 如何工作
PuLID 的架构由传统的扩散训练分支和新颖的 Lightning T2I 分支组成:
- 在扩散分支中,PuLID 遵循标准的扩散训练过程,即迭代去噪。ID 条件从目标训练图像中裁剪。
- Lightning T2I 分支利用最近的快速采样方法,仅在4个去噪步骤中生成以 ID 提示为条件的高质量图像,从纯噪声开始。
- 在 Lightning T2I 分支内,构建了两条路径——一条仅以文本提示为条件,另一条以 ID 和文本提示为条件。这些路径的 UNET 特征使用对比损失对齐:
- 语义对齐损失确保模型对文本提示的响应在有无 ID 调节下相似。这保留了模型原有的提示遵循能力。
- 布局对齐损失在 ID 插入前后保持生成图像布局的一致性。
- Lightning T2I 分支能够在生成的面部嵌入和真实 ID 嵌入之间计算准确的 ID 损失,因为它产生干净的去噪输出面部。这提高了生成 ID 的保真度。
如何使用 ComfyUI PuLID
要在 ComfyUI PuLID 工作流中将 ID 自定义应用于模型,需要在"Apply PuLID"节点中设置几个关键参数:
"Apply PuLID"必需输入:
- model: 用特定 ID 自定义的基础文本到图像扩散模型。这通常是一个预训练的模型,如 Stable Diffusion。
- pulid: 加载的 PuLID 模型权重,定义 ID 信息如何插入基础模型。可以训练不同的 PuLID 权重文件,以优先考虑 ID 保真度或保留模型的原始生成风格。
- eva_clip: 加载的 Eva-CLIP 模型,用于从 ID 参考图像中编码面部特征。Eva-CLIP 生成有意义的面部特征嵌入。
- face_analysis: 加载的 InsightFace 模型,用于识别和裁剪 ID 参考图像中的面部。这确保只编码相关的面部特征。
- image: 描绘要插入模型的特定 ID 的参考图像。可以提供同一身份的多个图像以改善 ID 嵌入。
- method: 选择 ID 插入方法,可选"fidelity"、"style"和"neutral"。"fidelity"优先考虑与 ID 参考的最大相似度,即使生成质量下降。"style"侧重于保留模型原有的生成能力,ID 保真度较低。"neutral"平衡两者。
- weight: 控制 ID 插入的强度,从0(无效果)到5(极强)。默认为1。权重越高,ID 保真度越好,但可能会覆盖模型原有的生成。
- start_at: 开始应用 PuLID ID 自定义的去噪步骤(百分比从0到1)。默认为0,从第一个去噪步骤开始 ID 插入。可以增加以在去噪过程的后期开始 ID 插入。
- end_at: 停止应用 PuLID ID 自定义的去噪步骤(百分比从0到1)。默认为1,一直应用 ID 插入直到去噪结束。可以减少以在最终去噪步骤之前停止 ID 插入。
"Apply PuLID"可选输入:
- attn_mask: 可选的灰度掩码图像,用于空间控制 ID 自定义的应用位置。掩码的白色区域接收完全的 ID 插入效果,黑色区域不受影响,灰色区域接收部分效果。用于将 ID 局部化到仅面部区域。
"Apply PuLID"输出:
- MODEL: 应用了 PuLID ID 自定义的输入模型。这个定制模型可用于 ComfyUI 的其他节点进行图像生成。生成的图像将描绘 ID,同时仍可通过提示控制。
调整这些参数可以微调 PuLID ID 插入,以实现 ID 保真度和生成质量之间的理想平衡。通常,权重为1,方法为"neutral"提供可靠的起点,然后可以根据结果进行调整。start_at 和 end_at 参数提供了进一步控制 ID 在去噪中何时生效的能力,还可以通过 attn_mask 选项将效果局部化。
欲了解更多信息,请访问
免费加入群聊,免费获得全球最大最全的工作流和AI工具库
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
-
免费下载或者VIP会员资源能否直接商用?本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
-
提示下载完但解压或打开不了?最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。
-
找不到素材资源介绍文章里的示例图片?对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
-
付款后无法显示下载地址或者无法查看内容?如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理
-
购买该资源后,可以退款吗?源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源