neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

复旦等发布AnyGPT：任意模态输入输出，图像、音乐、文本、语音都支持

复旦等发布AnyGPT：任意模态输入输出，图像、音乐、文本、语音都支持

复旦等发布AnyGPT：任意模态输入输出，图像、音乐、文本、语音都支持

最近，OpenAI 的视频生成模型 Sora 爆火，生成式 AI 模型在多模态方面的能力再次引起广泛关注。

现实世界本质上是多模态的，生物体通过不同的渠道感知和交换信息，包括视觉、语言、声音和触觉。开发多模态系统的一个有望方向是增强 LLM 的多模态感知能力，主要涉及多模态编码器与语言模型的集成，从而使其能够跨各种模态处理信息，并利用 LLM 的文本处理能力来产生连贯的响应。

16 0 2025-09-03

‹‹ 1 ››

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

控制面板

您好，欢迎到访网站！
查看权限

搜索

最近发表