neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

迈向多语言医疗大模型:大规模预训练语料、开源模型与全面基准测试

迈向多语言医疗大模型:大规模预训练语料、开源模型与全面基准测试

迈向多语言医疗大模型:大规模预训练语料、开源模型与全面基准测试

本文的主要作者来自上海交通大学和上海人工智能实验室智慧医疗联合团队,共同第一作者为上海交通大学博士生邱芃铖和吴超逸,共同通讯作者为上海交通大学人工智能学院王延峰教授和谢伟迪副教授,这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。

8 0 2025-09-07
大模型对语言有自己的理解!MIT论文揭示大模型“思维过程” - ICML 24

大模型对语言有自己的理解!MIT论文揭示大模型“思维过程” - ICML 24

大模型对语言有自己的理解!MIT论文揭示大模型“思维过程” | ICML 24

大模型对现实世界,可以形成自己的理解!


MIT的一项研究发现,随着模型能力越强,它对现实的理解可能不仅是简单模仿。


比如大模型没有闻过气味,是否就意味着它不能理解气味?


研究发现,它可以自发模拟一些概念,方便理解。

13 0 2025-09-05
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其效率问题。


16 0 2025-09-02