neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

开源多模态SOTA再易主,19B模型比肩GPT-4v,16G显存就能跑

开源多模态SOTA再易主,19B模型比肩GPT-4v,16G显存就能跑

开源多模态SOTA再易主,19B模型比肩GPT-4v,16G显存就能跑

开源多模态SOTA模型再易主!


Hugging Face开发者大使刚刚把王冠交给了CogVLM2,来自大模型创业公司智谱AI


CogVLM2甚至在3项基准测试上超过GPT-4v和Gemini Pro,还不是超过一点,是大幅领先。

1 0 2025-09-08
开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?

开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?

开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中,他盘点分析了 4 月份发布的四个主要新模型:Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。他还通过一篇论文探讨了 DPO 和 PPO 的优劣之处。之后,他分享了 4 月份值得关注的一些研究成果。

11 0 2025-09-06
StarVector – 开源多模态视觉语言模型,支持图像和文本到 SVG 生成

StarVector – 开源多模态视觉语言模型,支持图像和文本到 SVG 生成

StarVector 是开源的多模态视觉语言模型,ServiceNow Research、Mila - Quebec AI Institute 和 ETS Montreal 联合开发,专注于将图像和文本转换为可缩放矢量图形(SVG)代码。 模型采用多模态架构,能同时处理图像和文本信息,直接在 SVG 代码空间中操作,生成标准的、可编辑的 SVG 文件。
18 0 2025-08-31
Morphik – 开源的多模态检索增强生成工具

Morphik – 开源的多模态检索增强生成工具

Morphik 是开源的多模态检索增强生成(RAG)工具,专为处理高技术性和视觉内容丰富的文档设计。支持对图像、PDF、视频等多种格式的文档进行搜索,采用 ColPali 等技术,能理解文档中的视觉内容。
23 0 2025-08-30