链接https://pan.quark.cn/s/7bd031fbef99OmniVoice是一款最先进的大规模多语言零样本文本到语音TTS模型支持超过600种语言。该模型基于一种新颖的扩散语言模型架构能够以卓越的推理速度生成高质量语音并支持语音克隆和声音设计。超广语言覆盖支持600语言零样本TTS中覆盖最广。零样本语音克隆仅需3–10秒参考音频无需训练即可复刻音色质量顶尖。自由语音设计用文本指令控制性别、年龄、音高、口音/方言、耳语等无需参考音。极速推理RTF低至0.025比实时快40倍适合批量与实时场景。精细发音控制支持笑声/叹气等非语言标记支持拼音/音标强制纠音。架构简洁高效扩散语言模型结构兼顾音质、速度与扩展性。易用部署一键启动Web UI已经制作好了离线整合包给大家使用大家有需要的可以试试。完全开源GitHub开源可本地部署已经可以本地离线运行了、二次开发与商用友好。PS:支持如下方言陕西话、河南、四川话、贵州话、云南话、桂林话、济南话、石家庄话、甘肃话、宁夏话、青岛话、东北话适用设备电脑软件
覆盖600+语种方言声音克隆TTS
链接https://pan.quark.cn/s/7bd031fbef99OmniVoice是一款最先进的大规模多语言零样本文本到语音TTS模型支持超过600种语言。该模型基于一种新颖的扩散语言模型架构能够以卓越的推理速度生成高质量语音并支持语音克隆和声音设计。超广语言覆盖支持600语言零样本TTS中覆盖最广。零样本语音克隆仅需3–10秒参考音频无需训练即可复刻音色质量顶尖。自由语音设计用文本指令控制性别、年龄、音高、口音/方言、耳语等无需参考音。极速推理RTF低至0.025比实时快40倍适合批量与实时场景。精细发音控制支持笑声/叹气等非语言标记支持拼音/音标强制纠音。架构简洁高效扩散语言模型结构兼顾音质、速度与扩展性。易用部署一键启动Web UI已经制作好了离线整合包给大家使用大家有需要的可以试试。完全开源GitHub开源可本地部署已经可以本地离线运行了、二次开发与商用友好。PS:支持如下方言陕西话、河南、四川话、贵州话、云南话、桂林话、济南话、石家庄话、甘肃话、宁夏话、青岛话、东北话适用设备电脑软件