neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

CodeElo – 阿里 Qwen 团队推出评估 LLM 编程能力的基准测试

CodeElo – 阿里 Qwen 团队推出评估 LLM 编程能力的基准测试

CodeElo 是用于评估大型语言模型（LLMs）在编程竞赛级别代码生成能力的基准测试工具。通过与人类程序员的 Elo 评级系统进行比较，来衡量 LLMs 的编程水平。工具从 CodeForces 平台选择题目，按比赛分区、难度级别和算法标签进行分类，确保问题的多样性和代表性。

22 0 2025-08-28

‹‹ 1 ››

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

控制面板

您好，欢迎到访网站！
查看权限

搜索

最近发表