neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

人大高瓴-华为诺亚:大语言模型智能体记忆机制的系列研究

人大高瓴-华为诺亚:大语言模型智能体记忆机制的系列研究

人大高瓴-华为诺亚:大语言模型智能体记忆机制的系列研究

近期,基于大语言模型的智能体(LLM-based agent)在学术界和工业界中引起了广泛关注。对于智能体而言,记忆(Memory)是其中的重要能力,承担了记录过往信息和外部知识的功能,对于提高智能体的个性化等能力至关重要。中国人民大学高瓴人工智能学院与华为诺亚方舟实验室聚焦大语言模型智能体的记忆能力,在该领域的研究早期,形成了一套完整的包括综述论文、数据集和工具包的研究体系,致力于推动该领域的发展。

16 0 2025-09-04
LLaDA – 人大高瓴AI联合蚂蚁推出的扩散大语言模型

LLaDA – 人大高瓴AI联合蚂蚁推出的扩散大语言模型

LLaDA(Large Language Diffusion with mAsking)是中国人民大学高瓴AI学院李崇轩、文继荣教授团队和蚂蚁集团共同推出的新型大型语言模型,基于扩散模型框架而非传统的自回归模型(ARM)。LLaDA基于正向掩蔽过程和反向恢复过程建模文本分布,用Transformer作为掩蔽预测器,优化似然下界实现生成任务。
25 0 2025-08-29