Skip to content

基于SparkTTS、OrpheusTTS等模型,提供高质量中文语音合成与声音克隆服务。

Notifications You must be signed in to change notification settings

HuiResearch/FlashTTS

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation


FlashTTS

基于 SparkTTS、OrpheusTTS、MegaTTS 3 等先进模型,FlashTTS 提供高质量的中文语音合成与零样本声音克隆服务。借助简洁直观的 Web 界面,您可以快速生成自然逼真的人声,满足配音、阅读、无障碍、虚拟角色等多元场景需求。

如果 FlashTTS 对你有帮助,欢迎留下一个 ⭐ Star!

✨ 功能亮点

功能 说明
🚀 多后端推理加速 支持 vllmsglangllama‑cppmlx‑lm 等多种高性能推理引擎
🎯 高并发 动态批处理与异步队列,轻松应对大流量请求
🎛️ 全参数控制 可调节音调、语速、温度、情感标签等
📱 轻量部署 基于 FastAPI,一条命令即可启动;最小依赖
🔊 长文本合成 支持超长文本,保持连续音色一致
🔄 流式 TTS 边生成边播放,降低等待,提高交互体验
🎭 多角色对话 同文本多角色合成,适合剧本配音
🎨 现代化前端 适配Web端

🖼️ 前端示例

FastTTS.mp4

🔈 语音演示

下列 Demo 展示了 FlashTTS 在不同模型与角色上的克隆效果。

SparkTTS 模型

Donald Trump en

Donald Trump zh

trump-en.webm
trump-zh.webm

哪吒

李靖

nezha.webm
default.webm

余承东

徐志胜

default.webm
default.webm

MegaTTS 3 模型

蔡徐坤

太乙真人

default.webm
default.webm

OrpheusTTS (zh) 模型

长乐

白芷

default.webm
default.webm

快速使用

建议在 python 3.8 - 3.12 环境中使用 pip 安装 flashtts

pip install flashtts

详细安装步骤,请参考:installation.md

⚡ 推理速度

测试环境:A800 GPU · 模型:Spark-TTS‑0.5B · 测试脚本:speed_test.py

场景 引擎 设备 音频长度 (s) 推理耗时 (s) RTF
短文本 llama‑cpp CPU 7.48 6.81 0.91
短文本 torch GPU 7.18 7.68 1.07
短文本 vllm GPU 7.24 1.66 0.23
短文本 sglang GPU 7.58 1.07 0.14
长文本 llama‑cpp CPU 121.98 117.83 0.97
长文本 torch GPU 113.70 107.17 0.94
长文本 vllm GPU 111.82 7.28 0.07
长文本 sglang GPU 117.02 4.20 0.04

RTF < 1 表示实时合成。

⚙️ 使用提示

  1. SparkTTS 权重需使用 bfloat16float32float16 会报错。
  2. 若遇到长时间空白音,可将 repetition_penalty 调高 (> 1.0)。
  3. OrpheusTTS 支持在文本中插入 <tag> 控制情感,标签见 orpheus_engine.pyLANG_MAP
  4. 出于安全考虑,MegaTTS 3 未公开 WaveVAE 编码器,请参考官方说明下载:参考音频

🤝 鸣谢

⚠️ 免责声明

FlashTTS 仅供学术研究、教育与合法用途,如无障碍辅助、个性化语音合成等。请勿将其用于欺诈、冒充、深度伪造等违法场景。违者自行承担法律与道德责任。

License

本项目沿用 Spark‑TTS 的协议,详情参见 LICENSE

Star History

Star History Chart

About

基于SparkTTS、OrpheusTTS等模型,提供高质量中文语音合成与声音克隆服务。

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published