https://github.com/kijai/ComfyUI-Florence2 https://huggingface.co/microsoft/Florence-2-base 这是使用最新的 Microsoft/Florence-2 模型 Florence 实现各种视觉处理任务的方法-2 是一种高级视觉基础模型,它使用基于提示的方法来处理各种视觉和视觉语言任务。 Florence-2 可以解释简单的文本提示来执行字幕、对象检测和分割等任务。它利用我们的 FLD-5B 数据集(包含 1.26 亿张图像中的 54 亿个注释)来掌握多任务学习。该模型的序列到序列架构使其能够在零样本和微调设置中表现出色,被证明是一个有竞争力的视觉基础模型。因为它是如此简单易用,所以我必须推荐给大家尝试一下。欢迎来到我的频道 https://

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。