neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

SuperGPQA – 豆包大模型联合 M-baidu09A-baidu09P 开源的知识推理基准测试集

SuperGPQA – 豆包大模型联合 M-baidu09A-baidu09P 开源的知识推理基准测试集

SuperGPQA 是字节跳动豆包大模型团队联合 M-A-P 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科覆盖不全、题目质量存疑和评测维度单一的问题,基于专家与大语言模型协同构建,确保题目的高质量和高难度。
19 0 2025-08-31