ChatTTS 是一个专门为对话场景设计的文本到语音模型,支持中英文,能生成自然流畅的对话语音。这个项目提供了基础模型和高级控制方法,可以用来生成带有情感和语调变化的语音。用户可以通过基础代码快速上手,也可以根据需要进行高级定制。
该模型经过超过10万小时的训练,公开版本在 HuggingFace 上提供了一个4万小时预训练的模型,但没有针对任何特定任务或应用场景进行微调。用户可以直接使用这个模型,也可以根据自己的需求,在特定领域的数据上对模型进行进一步微调。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
广告设计插画印刷画廊