如果你还在使用wd14,那没有什么问题,很好,但显然还不够好,ollama llava&Joy Caption的伴随问题很明显,尤其是Joy Caption的VRAM缓存使用情况,所以..这是刚刚发布的PromptGen v1.5 PromptGen是基于Microsoft Florence2基础模型进行训练的,因此模型大小只有1G,可以光速生成字幕,并且使用更少的VRAM,我将其与FLUX GGUF Q4、CLIP-GmP-ViT-L搭配使用-14,因为我听说它可以更好地处理长剪辑。 PromptGen v1.5 可以在 1 个模型下以 5 种不同模式处理图像标题:danbooru 样式标签、一行图像描述、结构化标题、详细标题和混合标题,每种模式都处理提示工作中的特定场景。 【来看看区别>>>>拉图在这里]工作流程插件和模型主要来自MiaoshouAI和xlabs Huggingface链接:https://huggingface.co/MiaoshouAI/Florence-2-base-PromptGen-v1.5 ComfyUI妙手A

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。