
AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体
AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体
迈向通用人工智能(AGI)的核心目标之一就是打造能在开放世界中自主探索并持续交互的智能体。随着大语言模型(LLMs)和视觉语言模型(VLMs)的飞速发展,智能体已展现出令人瞩目的跨领域任务泛化能力。
而在我们触手可及的开放世界环境中,图形用户界面(GUI)无疑是人机交互最普遍的舞台。想象一下 --- 你的 AI 不仅能看懂屏幕,还能像人一样主动探索界面、学习操作,并在新应用里灵活应对,这不再是幻想!
17
0
2025-09-04