neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

Spark-baidu09TTS – AI文本转语音工具,支持中英零样本语音克隆

Spark-baidu09TTS – AI文本转语音工具,支持中英零样本语音克隆

Spark-TTS 是SparkAudio 团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具, 无需额外的生成模型,直接从 LLM 预测的编码中重建音频,实现零样本文本到语音的转换。Spark-TTS 支持中英双语,具备跨语言合成能力,可通过参数调整(如性别、音调、语速)生成虚拟说话者的声音,满足多样化需求。
18 0 2025-08-30
Muyan-baidu09TTS – 开源文本转语音模型,零样本语音合成

Muyan-baidu09TTS – 开源文本转语音模型,零样本语音合成

Muyan-TTS 是为播客场景设计的开源文本转语音(TTS)模型。模型预训练超过10万小时的播客音频数据,能实现零样本语音合成,无需大量目标说话人的语音数据可生成高质量语音。模型支持说话人适配,进行个性化语音定制。
16 0 2025-08-30