WebWalker – 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具 WebWalker是阿里巴巴自然语言处理团队开发的用于评估和提升大型语言模型(LLMs)在网页浏览任务中性能的工具。通过模拟网页导航任务,帮助模型更好地处理长上下文信息。 21 0 2025-08-31