微软亚洲研究院近日推出名为UI-Evol的新组件,旨在应对计算机使用AI智能体在图形用户界面操作中面临的“知识-行动鸿沟”问题。当前智能体虽能获取高准确率指令,任务成功率却不足一半,且行为不稳定。UI-Evol通过“回溯”与“审校”两阶段机制,记录并优化智能体的实际操作轨迹,动态对齐外部知识与真实界面环境。实验显示,集成该组件后,基于GPT-4o等模型的智能体在OSWorld基准测试中任务成功率...
网页链接微软亚洲研究院近日推出名为UI-Evol的新组件,旨在应对计算机使用AI智能体在图形用户界面操作中面临的“知识-行动鸿沟”问题。当前智能体虽能获取高准确率指令,任务成功率却不足一半,且行为不稳定。UI-Evol通过“回溯”与“审校”两阶段机制,记录并优化智能体的实际操作轨迹,动态对齐外部知识与真实界面环境。实验显示,集成该组件后,基于GPT-4o等模型的智能体在OSWorld基准测试中任务成功率...
网页链接
精彩评论