M2UGen – 腾讯联合国立大学推出多模态音乐理解和生成框架 M2UGen是先进的多模态音乐理解和生成框架,由腾讯PCG ARC实验室与新加坡国立大学联合推出。结合了大型语言模型(LLM)的能力,能处理包括文本、图像、视频和音频在内的多模态输入,生成相应的音乐。 22 0 2025-08-29