neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

Agent Q – MultiOn公司推出的AI智能体,可以自我学习进化

admin|
24

Agent Q是MultiOn公司联合斯坦福大学推出的自监督代理推理和搜索框架。Agent Q融合了引导式蒙特卡洛树搜索(MCTS)、AI自我批评和直接偏好优化(DPO)等技术,使AI模型能通过迭代微调和基于人类反馈的强化学习进行自我改进。Agent Q在网页导航和多步任务执行中展现出色性能,在OpenTable真实预订任务中,将成功率从18.6%提升至95.4%,标志着AI在自主性和复杂决策能力上的重大突破。

(图片来源网络,侵删)
(图片来源网络,侵删)