
自动化、可复现,基于大语言模型群体智能的多维评估基准Decentralized Arena来了
自动化、可复现,基于大语言模型群体智能的多维评估基准Decentralized Arena来了
Maitrix.org 是由 UC San Diego, John Hopkins University, CMU, MBZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners,以及 MMToM-QA 评测(ACL 2024 Outstanding Paper Award)。
16
0
2025-09-03