neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

无情戳穿“长上下文”大模型的虚标现象——


英伟达新研究发现,包括GPT-4在内的10个大模型,生成达到128k甚至1M上下文长度的都有。


但一番考验下来,在新指标“有效上下文”上缩水严重,能达到32K的都不多。


19 0 2025-09-02