neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

SimpleQA – OpenAI开源的新基准，用于评估前沿模型的事实准确性

SimpleQA是OpenAI推出的基准测试，用在评估大型语言模型回答简短、寻求事实问题的能力。SimpleQA包含4326个问题，每个问题设计为只有一个正确答案，易于评分”。SimpleQA挑战性强，即使是最先进的大模型如o1-preview和Claude Sonnet 3.5的准确率也不到50%。

27 0 2025-08-30

DualPipe – DeepSeek 开源的双向流水线并行技术

DualPipe 是DeepSeek开源的创新的双向流水线并行技术，主要用于提升大规模深度学习模型的训练效率。核心思想是将模型的训练过程分为两个独立的管道——前向计算管道和反向计算管道，并行执行。

27 0 2025-08-28

‹‹ 1 ››

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

控制面板

您好，欢迎到访网站！
查看权限