工作流程 让视频角色说出任何话。通过克隆语音,生成TTS,使视频面孔说话(唇形同步) flow1.1:音频生成器(单语言) flow1.2:音频生成器(跨语言) flow2:MuseTalk(输入生成的音频文件路径和原始视频) MuseTalk 的软件环境有点棘手。在这里推荐使用 cuda11.8 的环境: torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pip install –no-cache-dir -U openmim mim install mmengine mim install “mmcv==2.0.1 “mim安装“mmdet==3.2.0”mim安装“mmpose==1.1.0”

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。