PDFTo幻灯片(PDFToSlides in )-workflowi 智绘流光

此工作流程的目的：PDF 文件的 OCR/Summerize/DrawingPics。 1. 使用 ComfyUI-Document 阅读英文 PDF 文件（现已在管理器中） 2. 进行 OCR 并汇总文档内容，输出为文本 3. 将文本转换为图像生成提示。 4.使用SD3生成图像并与文本结合，输出1920×1080图像（看起来像演示文稿）。摘要使用 Ollama，OCR 功能使用 Florence2。该工作流程可以从 arXiv 读取 PDF，对其进行总结，并生成伴随摘要的图像。然而，此工作流程并不适合科学学术论文，因为此类论文中的图像（如另一幅图像中的 SD3 论文）是由 SD3 随机生成的。摘要内容可以是中文。通过修改提示以要求中文摘要和文本布局（将每行更改为 24 个字符，字体大小更改为 30），您可以在资产中实现此目的。如果文档是包含文本的 PDF 而不是扫描的 PDF，ComfyUI-Document 可能会很糟糕

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

PDFTo幻灯片(PDFToSlides in )

相关文章

SUPIR – 基本工作流程 v1.0(SUPIR – Basic Workflow v1.0)

基本IP适配器(Basic IPAdapter)

Flux ControlNet Upscaler 与 Florence2（支持 GGUF）(Flux ControlNet Upscaler with Florence2 (GGUF Supported))

vid2vid-vid&ipadapter 如此快速的视频渲染(vid2vid-vid&ipadapter So fast video rendering )

免费获取会员