音频反应遮罩扩展惊艳动画

2024-10-17 技术教程 0 0 2

详情介绍
常见问题

ComfyUI Audioreactive Mask Dilation 描述

通过赋予您的主题（例如舞者）一个随节奏同步扩展和收缩的动态光环，创建惊艳的视频动画。使用这个工作流程可以处理单个或多个主题，如示例中所见。

如何使用音频反应遮罩扩展工作流程：

在输入部分上传一个主题视频
选择最终视频的所需宽度和高度，以及输入视频中应跳过的帧数使用 'every_nth'。您还可以使用 'frame_load_cap' 限制要渲染的总帧数。
填写正面和负面提示。设置批量帧时间以匹配您希望场景转换发生的时间。
为每个默认的 IP 适配器主题遮罩颜色上传图像：
1. 红色 = 主题（舞者）
2. 黑色 = 背景
3. 白色 = 白色音频反应扩展遮罩
在 'Models' 部分加载一个好的 LCM 检查点（我使用 Machine Delusions 的 ParadigmLCM）。
1. 使用模型加载器下方的 Lora 堆叠器添加任何 loras
点击队列提示

输入

将您想要的主题视频上传到加载视频（上传）节点。
使用左上角的两个输入调整输出宽度和高度。
every_nth 设置是否使用每隔一帧、每隔三帧等（2 = 每隔一帧）。默认设置为 1。
skip_frames 用于跳过视频开头的帧。（100 = 跳过输入视频的前 100 帧）。默认设置为 0。
frame_load_cap 用于指定应加载的输入视频的总帧数。测试设置时最好保持较低（例如 30 – 60），然后在渲染最终视频时增加或设置为 0（无帧数上限）。
右下角的数字字段显示有关上传的输入视频的信息：总帧数、宽度、高度和 FPS，从上到下。
如果您已经生成了主题的遮罩视频，请取消静音 'Upload Subject Mask' 部分并上传遮罩视频。可选地静音 'Segment Dancer' 部分以节省一些处理时间。
有时分割的主题可能不完美，请使用右下角的预览框检查遮罩质量。如有必要，可以在 'Florence2Run' 节点中调整提示以定位不同的身体部位，如 'head'、'chest'、'legs' 等，看看是否能获得更好的结果。

提示

使用批量格式设置正面提示：
- 例如 '0': '4k, masterpiece, 1girl standing on the beach, absurdres', '25': 'HDR, sunset scene, 1girl with black hair and a white jacket, absurdres', …
负面提示是正常格式，如有需要可添加嵌入。

音频处理

该部分从输入视频中提取音频，提取干音（低音、鼓声、主唱等），然后将其转换为与输入视频帧同步的标准化振幅。
amp_control = 振幅可以变化的总范围。
amp_offset = 振幅可以达到的最小值。
- 例如：amp_control = 0.8 和 amp_offset = 0.2 意味着信号将在 0.2 和 1.0 之间变化。
有时鼓声干音包含了歌曲的实际低音音符；预览每个干音以确定哪个最适合您的遮罩。
使用图表清晰了解该干音在视频整个持续时间内的信号变化情况。

扩展遮罩

每个彩色组对应将由其生成的扩展遮罩的颜色。
使用以下节点设置扩展遮罩的最小和最大半径及其形状：

形状：'circle' 是最精确的，但生成时间较长。准备进行最终渲染时设置此项。'square' 计算速度快但不太精确，最适合测试工作流程和决定 IP 适配器图像。
max_radius：振幅值为最大（1.0）时遮罩的半径（以像素为单位）。
min_radius：振幅值为最小（0.0）时遮罩的半径（以像素为单位）。
如果您已经生成了复合遮罩视频，可以取消静音 'Override Composite Mask' 组并上传它。建议绕过扩展遮罩组以节省处理时间。

模型

使用一个好的 LCM 模型作为检查点。我推荐 Machine Delusions 的 ParadigmLCM。
使用模型合并堆栈将多个模型合并在一起，以获得各种有趣的效果。确保启用的模型的权重总和为 1.0。
可选地指定 AnimateLCM_sd15_t2v_lora.safetensors，权重较低（0.18），以进一步增强最终效果。
使用模型加载器下方的 Lora 堆叠器添加任何额外的 Loras。

AnimateDiff

设置一个不同的 Motion Lora 而不是我使用的（LiquidAF-0-1.safetensors）
增加/减少 Scale 和 Effect 浮点数以增加/减少输出中的运动量。

IP 适配器

在这里，您可以指定用于渲染每个扩展遮罩背景以及视频主题的参考图像。
每组的颜色表示其目标的遮罩：

红色、绿色、蓝色：

主题遮罩参考图像。

黑色：

背景遮罩图像，上传背景的参考图像。

白色、黄色、洋红色、青色：

扩展遮罩参考图像，为使用的每种颜色扩展遮罩上传参考图像。

ControlNet

该工作流程使用了 5 个不同的 controlnets，包括 AD、Lineart、QR Code、Depth 和 OpenPose。
所有输入到 controlnets 的数据都是自动生成的
您可以选择取消静音 'Override ' 组来覆盖 Lineart、Depth 和 Openpose controlnets 的输入视频，如下所示：

建议您在覆盖时也静音 'Generate' 组以节省处理时间。

提示：

绕过 Ksampler 并开始渲染您的完整输入视频。一旦所有预处理器视频生成完毕，保存它们并上传到相应的覆盖。之后在测试工作流程时，您将无需等待每个预处理器视频单独生成。

采样器

默认情况下，HiRes Fix 采样器组将静音以节省测试时的处理时间
我建议在尝试扩展遮罩设置时绕过采样器组以节省时间。
在最终渲染时，您可以取消静音 HiRes Fix 组，这将放大并为最终结果添加细节。

输出

有两个输出组：左侧是标准采样器输出，右侧是 HiRes Fix 采样器输出。

关于作者

Akatz AI：

网站：
http://patreon.com/Akatz
https://civitai.com/user/akatz
https://www.youtube.com/@akatz_ai
https://www.instagram.com/akatz.ai/
https://www.tiktok.com/@akatz_ai
https://x.com/akatz_ai
https://github.com/akatz-ai

联系方式：

电子邮件：akatz.hello@gmail.com

免费加入群聊，免费获得全球最大最全的工作流和AI工具库

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

免费下载或者VIP会员资源能否直接商用？

本站所有资源版权均属于原作者所有，这里所提供资源均只能用于参考学习用，请勿直接商用。若由于商用引起版权纠纷，一切责任均由使用者承担。更多说明请参考 VIP介绍。
提示下载完但解压或打开不了？

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量，若小于网盘提示的容量则是这个原因。这是浏览器下载的bug，建议用百度网盘软件或迅雷下载。若排除这种情况，可在对应资源底部留言，或联络我们。
找不到素材资源介绍文章里的示例图片？

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材，文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买，且本站不负责(也没有办法)找到出处。同样地一些字体文件也是这种情况，但部分素材会在素材包内有一份字体下载链接清单。
付款后无法显示下载地址或者无法查看内容？

如果您已经成功付款但是网站没有弹出成功提示，请联系站长提供付款信息为您处理
购买该资源后，可以退款吗？

源码素材属于虚拟商品，具有可复制性，可传播性，一旦授予，不接受任何形式的退款、换货要求。请您在购买获取之前确认好是您所需要的资源

下载

免费下载

立即下载

包含资源: (1个)
最近更新: 2024-10-17
节点数: [db:Nodes1]

下载遇到问题？可联系客服或反馈

音频反应遮罩扩展 惊艳动画

如何使用音频反应遮罩扩展工作流程：

输入

提示

音频处理

扩展遮罩

模型

AnimateDiff

IP 适配器

红色、绿色、蓝色：

黑色：

白色、黄色、洋红色、青色：

ControlNet

采样器

输出

关于作者

相关文章

Stable Diffusion 3 (SD3) 文本到图像

外绘 扩展图像

FLUX LoRA 训练

IPAdapter Plus (V2) 注意力蒙版 图像转视频

免费获取会员

音频反应遮罩扩展惊艳动画

外绘扩展图像

IPAdapter Plus (V2) 注意力蒙版图像转视频