在 Reddit 上看到一个关于 MiaoshouAI Tagger 的帖子,并尝试了他们的工作流程,这是基于此,所以核心的功劳归于他们,这里有一个链接:https://raw.githubusercontent.com/miaoshouai/ComfyUI-Miaoshouai- Tagger/refs/heads/main/examples/miaoshouai_tagger_flux_hyper_lora_caption_switch_workflow.png 核心通过删除图像来操作在加载和调整大小节点中,并设置是否要调整大小的切换,左侧“注释”旁边的绿色节点有一个“真/假”切换。对于 Img2Img 将其设置为 true,对于 Txt2Img 将其设置为 false,其右侧有 2 个浮动节点,用于为两个节点设置降噪。字幕生成器使用自动下载的 LLM,并且是 Florence2 的微调。它创建自然语言 T5 提示和标签样式剪辑 l 提示。当然必须修补并添加一些东西:强制剪辑以便可以卸载到 CPU,剪辑文本编码需要更长的时间,但由于 Flux Dev 的大小为 23GB,因此值得保留显存
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。