
图灵奖得主LeCun加盟AI芯片黑马Groq,估值28亿挑战英伟达!
图灵奖得主LeCun加盟AI芯片黑马Groq,估值28亿挑战英伟达!
英伟达又双叒迎来强劲挑战者了。
成立于2016年的初创公司Groq在最新一轮融资中筹集了 6.4 亿美元,由 BlackRock Inc. 基金领投,并得到了思科和三星投资部门的支持。

图灵奖得主LeCun加盟AI芯片黑马Groq,估值28亿挑战英伟达!
英伟达又双叒迎来强劲挑战者了。
成立于2016年的初创公司Groq在最新一轮融资中筹集了 6.4 亿美元,由 BlackRock Inc. 基金领投,并得到了思科和三星投资部门的支持。

AIGC爆火,第一家要倒下的大模型企业出现了?
商业化是最终难题
就在OpenAI的Sora爆火,Google的Gemini发布之际,国内大模型企业开始倒在了商业化黎明前。
2月21日,知名AI创业公司竹间智能突然宣布因业务需求减少,给公司带来了严重的现金流压力和挑战,停工停产6个月。

AI学习机暴利真相:6000元收割家长,课程成本仅30元?
AI大潮席卷而来,越来越多人想体会科技进步带来的升级与便利。然而不少商家却存在夸大其词,盲目神话AI功能的情况,利用家长们的知识盲区兜售AI产品。
来自北京的赵明(化名),近期自认栽了个跟头——花费近6000元为三年级孩子购置的AI学习机,宣传的“AI精准辅导”“一对一伴学”功能与实际严重不符,仅用了一个月就“吃土”了。事实上,多数家长都很难逃出学习机的困扰。小红书平台上,与学习机相关的笔记多达131万篇,关联词条中不乏:学习机到底是不是智商税、学习机有没有必要买等话题。

RAG终极框架!港大开源RAG-Anything:统一多模态知识图谱
最近,由香港大学黄超教授团队发布的开源项目「一体化的多模态RAG框架」RAG-Anything,有效解决了传统RAG的技术局限,实现了「万物皆可RAG」的处理能力。
RAG-Anything的核心技术创新在于构建了统一的多模态知识图谱架构,能够同时处理并关联文档中的文字内容、图表信息、表格数据、数学公式等多种类型的异构内容,解决了传统RAG系统仅支持文本处理的技术限制,为多模态文档的智能理解提供了新的技术方案。

AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题
豆包大模型1.6惊艳亮相,成为国内首款多模态SOTA模型,256k对话窗口,深度思考最长上下文。它不仅能看会想,还能动手操作GUI,国内最有潜力考清北。
还得是字节,一下子能掏出这么多好东西。
就在刚刚,火山引擎原动力大会上发布的豆包大模型1.6,是国内各家SOTA模型中首个多模态模型,也是国内首个支持256k上下文长度的思考模型。

和梁朝伟同获港科荣誉博士,黄仁勋与沈向洋对谈Scaling Law、后训练、机器人和爱情
11 月 23 日,香港科技大学举行了今年度的学位颁授典礼。英伟达创始人和 CEO 黄仁勋又新增一个荣誉工程学博士头衔,与他一同获得荣誉博士学位的还有著名影星梁朝伟、2013 年诺贝尔化学奖得主 Michael Levitt、菲尔兹奖得主 David Mumford。


独家 | 国产算力软件服务商清程极智再获过亿元融资

摘要:

在对齐 AI 时,为什么在线方法总是优于离线方法?
在线和离线对齐算法的性能差距根源何在?DeepMind实证剖析出炉
在 AI 对齐问题上,在线方法似乎总是优于离线方法,但为什么会这样呢?近日,Google DeepMind 一篇论文试图通过基于假设验证的实证研究给出解答。


ACL首届博士论文奖公布,华人学者李曼玲获荣誉提名
昨晚,自然语言处理顶会 ACL 公布了今年的一个特别奖项 —— 计算语言学博士论文奖。
这个奖项是今年新增的,获奖者是来自美国华盛顿大学的 Sewon Min。她的博士论文题为「Rethinking Data Use in Large Language Models(重新思考大型语言模型中的数据使用)」。

腾讯混元悄悄开源3D大模型2.0,开源社区真的过年了。
疯了,全都疯了。
昨天一天时间,来了N个大货:
早上MiniMax上线TTS,字节上线AI编程Trae;下午字节全量上线豆包实时语音;晚上DeepSeek开源R1性能直接对标OpenAI o1,然后Kimi的k1.5直接正面硬刚。
这感觉就是一波撒完,直接回家过年了。。。
昨天的余温还没过,今天下午,腾讯混元又悄悄开了个闭门发布会,作为混元的老基友,我自然是受邀参加期期不落。

AI不应该把所有桌子都掀了
今天关于大模型的狂热里充满了各种误解。
其中最深入人心的一个,就是“AGI” (Artificial General Intelligence,通用人工智能)马上就要实现,而实现的方式是由一个全知全能的模型,解决你自己现在都不知道还需要去解决的某个无比重要的任务。实现的载体就是一个比人还聪明的对话框。

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级
论文共同第一作者张金涛、黄浩峰分别来自清华大学计算机系和交叉信息研究院,论文通讯作者陈键飞副教授及其他合作作者均来自清华大学计算机系。
大模型中,线性层的低比特量化已经逐步落地。然而,对于注意力模块,目前几乎各个模型都还在用高精度(例如 FP16 或 FP32)的注意力运算进行训练和推理。并且,随着大型模型需要处理的序列长度不断增加,Attention(注意力运算)的时间开销逐渐成为主要开销。

Deep Render表示其AI视频压缩技术将“拯救互联网”

Deep Render是一家利用AI解决数十年之久的计算机压缩问题的初创公司。它开发了纯人工智能视频压缩技术,据称可以将视频文件大小缩小 5 倍,目标是提高 50 倍。

情感分析的终极形态:全景式细粒度多模态对话情感分析基准PanoSent
罗盟,本工作的第一作者。新加坡国立大学(NUS)人工智能专业准博士生,本科毕业于武汉大学。主要研究方向为多模态大语言模型和 Social AI、Human-eccentric AI。

用好视觉Attention局部性,清华、字节提出Token Reorder,无损实现5倍稀疏、4比特量化
近年来,随着视觉生成模型的发展,视觉生成任务的输入序列长度逐渐增长(高分辨率生成,视频多帧生成,可达到 10K-100K)。与输入序列长度呈平方复杂度的 Attention 操作,成为主要的性能瓶颈(可占据全模型的 60-80% 的开销),有明显的效率优化需求。注意力的稀疏化(Sparse Attention)与低比特量化(Attention Quantization)为常用的 Attention 优化技巧,在许多现有应用中取得优秀的效果。然而,这些方法在视觉生成模型中,在低稠密度(<50%)与低比特(纯 INT8/INT4)时面临着显著的性能损失,具有优化的需求。