neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?

参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?

参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?

多模态 AI 系统的特点在于能够处理和学习包括自然语言、视觉、音频等各种类型的数据,从而指导其行为决策。近期,将视觉数据纳入大型语言模型 (如 GPT-4V) 的研究取得了重要进展,但如何有效地将图像信息转化为 AI 系统的可执行动作仍面临挑战。


4 0 2025-09-08
GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况

GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况

GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况

推测解码(Speculative Decoding)是谷歌等机构在 2022 年发现的大模型推理加速方法。它可以在不损失生成效果前提下,获得 3 倍以上的加速比。GPT-4 泄密报告也提到 OpenAI 线上模型推理使用了它。针对如此妙的方法,香港理工大学、北京大学、MSRA 以及阿里共同推出了一篇关于推测解码的综述, 帮助读者了解推测解码的前世今生和应用情况,值得一读。

15 0 2025-09-04
GPT、DeepSeek们可算把对话记录还给我了!

GPT、DeepSeek们可算把对话记录还给我了!

GPT、DeepSeek们可算把对话记录还给我了!

OpenAI 有个反常规的设定,


他们将我生成的图片整理成一个画廊,但是点开图片并没有跳回到当时对话的选项,只能在这张图的基础上修改。


这也是很多AI目前的交互通病,


我和他们的对话正在丢失。


GPT、DeepSeek们可算把对话记录还给我了!

17 0 2025-09-03
GPT-4搞不定的图推理,港科大7B模型搞定|KDD2024

GPT-4搞不定的图推理,港科大7B模型搞定|KDD2024

GPT-4搞不定的图推理,港科大7B模型搞定|KDD2024

大模型执行图推理任务,我们是希望大模型仅仅给出结果,还是在给出准确答案的同时,输出详细的推理过程?


先来看GPT-4的表现:


给出了一个非常简短且错误的答案

19 0 2025-09-02