北大科研团队_拜读未来科技摆渡人生

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

随着大语言模型（LLM）能力的快速迭代，传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征，例如价值观、性格和社交智能？如何建立更全面、更可靠的 AI 评估体系？北京大学宋国杰教授团队最新综述论文（共 63 页，包含 500 篇引文），首次尝试系统性梳理答案。

北大团队发布首篇大语言模型心理测量学系统综述：评估、验证、增强

21 0 2025-09-02

Finedefics 是北京大学彭宇新教授团队推出的细粒度多模态大模型，提升多模态大语言模型（MLLMs）在细粒度视觉识别（FGVR）任务中的表现。模型通过引入对象的细粒度属性描述，基于对比学习对齐视觉对象与类别名称的表示，解决了传统模型中视觉对象与细粒度子类别未对齐的问题。

19 0 2025-08-29