
开源模型突破原生多模态大模型性能瓶颈,上海AI Lab代季峰团队出品
开源模型突破原生多模态大模型性能瓶颈,上海AI Lab代季峰团队出品
原生多模态大模型性能瓶颈,迎来新突破!
上海AI Lab代季峰老师团队,提出了全新的原生多模态大模型Mono-InternVL。
与非原生模型相比,该模型首个单词延迟最多降低67%,在多个评测数据集上均达到了SOTA水准。

开源模型突破原生多模态大模型性能瓶颈,上海AI Lab代季峰团队出品
原生多模态大模型性能瓶颈,迎来新突破!
上海AI Lab代季峰老师团队,提出了全新的原生多模态大模型Mono-InternVL。
与非原生模型相比,该模型首个单词延迟最多降低67%,在多个评测数据集上均达到了SOTA水准。

开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?
深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中,他盘点分析了 4 月份发布的四个主要新模型:Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。他还通过一篇论文探讨了 DPO 和 PPO 的优劣之处。之后,他分享了 4 月份值得关注的一些研究成果。

开源模型是智商税?这话真的就一定对吗
关于大模型开源还是闭源的争论,看起来还要持续很久。继今年4月举行的Create 2024百度AI开发者大会上,百度创始人李彦宏宣称,“开源模型会越来越落后”。
紧接着互联网圈大佬中另一个经常谈论AI的周鸿祎则表示,“我是一直相信开源的力量,至于说网上有些名人胡说八道,你们别被忽悠了。”


开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了
又有新的开源模型可以用了。
从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5,因此它也被认为是一种「非常接近 GPT-4」的开源选项。

开源大模型王座易主,谷歌Gemma杀入场,笔记本可跑,可商用
与 Gemini 采用同源技术的开放模型。
刚刚,谷歌杀入开源大模型。
开源领域大模型,迎来了重磅新玩家。

开源全能图像模型媲美GPT-4o!理解生成编辑同时搞定,解决扩散模型误差累计问题
OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。
开源的MLLMs和扩散模型已经过大规模预训练,其从零开始训练统一任务,不如取长补短,将MLLMs的语言建模能力,与扩散模型的像素级图像建模能力,进行有机的结合。
基于这个思路,ModelScope团队提出可同时完成图像理解、生成和编辑的统一模型

开源模型穷途末路?Stability AI欠下1亿美元,四处找钱寻求「卖身」
曾经创造出Stable Diffusion系列模型的Stability AI,目前面临前所未有的财务危机。
这个曾经有10亿美元估值,却只有180名员工的明星初创公司正在考虑出售,并积极与潜在买家接触。

开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1,“新趋势已显而易见”
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——
Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。