▎网站介绍:一个文字转语音工具,支持 300 多种语言和口音,提供语速和语调的调节功能,支持最长 100,000 字符的文本输入。
用户只需输入文本,选择语音引擎(如 Edge TTS、OpenAI TTS)和语音人物,即可快速合成高质量语音,并生成 MP3 文件保存下载。
▎网站网址:点击打开
▎网站介绍:一个文本、小说智能转语音解决方案,支持将 10 万字以上的小说一键转为有声书,完全免费,无时长、无字数限制。
支持一键生成语音和字幕、AI 智能推荐配音、自定义多角色配音、自定义调整语速、音调等参数,并且在生成前可试听效果。
▎网站网址:点击打开
#GitHub #TTS
🗣 Orpheus TTS - 开源文本转语音系统
▎项目介绍:一个开源 TTS 系统,基于 Llama-3b 架构构建,旨在生成自然、有情感的语音,接近人类发音水平,支持多种语言。
支持零样本语音克隆、情感控制、低延迟流式处理、无 GPU 推理,适用于语音助手、有声读物、教育培训等多种应用场景。
▎项目地址:点击打开
▎项目介绍:一个开源 TTS 系统,基于 Llama-3b 架构构建,旨在生成自然、有情感的语音,接近人类发音水平,支持多种语言。
支持零样本语音克隆、情感控制、低延迟流式处理、无 GPU 推理,适用于语音助手、有声读物、教育培训等多种应用场景。
▎项目地址:点击打开
#GitHub #TTS
🗣 F5-TTS - 上海交大开源超逼真声音克隆 TTS
▎项目功能:文本转语音
▎项目介绍:一款基于流匹配的全非自回归文本到语音转换系统,零样本,支持声音克隆、速度控制、控制语音情感表现、长文本合成、中英文多语言合成,并支持商用。
不需要复杂的设计如持续时间模型、文本编码器和音素对齐,能够快速训练并实现实时因素(RTF)0.15 的推理速度,显著优于当前基于扩散的 TTS 模型。
F5-TTS 在公共的 100K 小时多语言数据集上进行训练,展现出高自然性和表现力的零样本能力、无缝代码切换能力和速度控制效率。
▎项目地址:点击打开
🗣 F5-TTS - 上海交大开源超逼真声音克隆 TTS
▎项目功能:文本转语音
▎项目介绍:一款基于流匹配的全非自回归文本到语音转换系统,零样本,支持声音克隆、速度控制、控制语音情感表现、长文本合成、中英文多语言合成,并支持商用。
不需要复杂的设计如持续时间模型、文本编码器和音素对齐,能够快速训练并实现实时因素(RTF)0.15 的推理速度,显著优于当前基于扩散的 TTS 模型。
F5-TTS 在公共的 100K 小时多语言数据集上进行训练,展现出高自然性和表现力的零样本能力、无缝代码切换能力和速度控制效率。
▎项目地址:点击打开
▎项目功能:AI 视频配音/翻译工具
▎项目介绍:一个智能视频多语言AI配音和翻译工具,它融合了 YouDub-webui 的灵感,并在此基础上进行了拓展和优化。
致力于提供更加多样化和高质量的配音选择,通过集成 Linly-Talker 的数字人对口型技术,为用户带来更加自然的多语言视频体验。
▎项目地址:点击打开