开源模式_拜读未来科技摆渡人生

开源多模态SOTA再易主，19B模型比肩GPT-4v，16G显存就能跑

开源多模态SOTA模型再易主！

Hugging Face开发者大使刚刚把王冠交给了CogVLM2，来自大模型创业公司智谱AI。

CogVLM2甚至在3项基准测试上超过GPT-4v和Gemini Pro，还不是超过一点，是大幅领先。

1 0 2025-09-08

最强开源多模态生成模型MM-Interleaved：首创特征同步器

过去几个月中，随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出，「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩目的焦点。

18 0 2025-09-03

完全透明开源的共情语音大模型，三阶段训练，四大模块实现端到端对话 - 紫东太初联合长城汽车开源OpenS2S

完全透明开源的共情语音大模型，三阶段训练，四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力，但它们的技术体系完全闭源。

现在，紫东太初团队联合长城汽车AI Lab直接把整个技术栈都开源了，推出完全透明开源的端到端共情语音语言大模型OpenS2S。

完全透明开源的共情语音大模型，三阶段训练，四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

18 0 2025-09-02

StarVector – 开源多模态视觉语言模型，支持图像和文本到 SVG 生成

StarVector 是开源的多模态视觉语言模型，ServiceNow Research、Mila - Quebec AI Institute 和 ETS Montreal 联合开发，专注于将图像和文本转换为可缩放矢量图形（SVG）代码。模型采用多模态架构，能同时处理图像和文本信息，直接在 SVG 代码空间中操作，生成标准的、可编辑的 SVG 文件。

19 0 2025-08-31

‹‹ 1 ››

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30