neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

BrowseComp – OpenAI 开源的 AI Agent 网络浏览能力基准

BrowseComp – OpenAI 开源的 AI Agent 网络浏览能力基准

BrowseComp 是 OpenAI 开源的用于评估 AI Agent网络浏览能力的基准测试。包含 1266 个极具挑战性的问题，覆盖电影、科学与技术、艺术、历史、体育、音乐、电子游戏等多个领域。需要 AI Agent在互联网上搜索并匹配复杂约束条件，例如找出特定的足球比赛或电视剧角色等。

23 0 2025-08-28

‹‹ 1 ››

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

控制面板

您好，欢迎到访网站！
查看权限

搜索

最近发表