
OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!
OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

18
0
2025-09-04

OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

