VoxInstruct – 清华推出的开源语音合成技术,支持多语言和跨语言合成 VoxInstruct 是由清华大学开源的语音合成技术,能根据人类语言指令生成高度符合用户需求的语音。系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到更广泛的人类指令到语音任务。 20 0 2025-08-31