WPS AI表格Agent登顶SpreadsheetBench榜单,超越Microsoft、OpenAI

新浪科技06-18 16:23

  新浪科技讯 6月18日下午消息,全球电子表格自动化领域权威基准SpreadsheetBench公布最新榜单,WPS AI表格Agent(Seed 2.0)以73.46%登顶Full 912(全量榜单) ,位列全球第一,超越Google、Microsoft、OpenAI、Anthropic 等国际知名科技公司旗下产品,还首次超越该榜单设定的人类专家基准线。这意味着WPS AI处理复杂表格任务的能力,已经跨越了一个关键门槛。

  SpreadsheetBench是业界衡量表格AI实战能力的权威基准,它源自2024年发表于AI顶级学术会议NeurIPS的研究论文。该基准包含912个来自真实Excel论坛的实际问题,其中42.7%的表格含非标准结构,35.7%含多表格,还涉及颜色、跨工作表等复杂操作。换句话说,它考的不是AI会不会“读表格”,而是AI能不能像人一样,理解任务意图、把结果做出来。论文发布时测定的Excel专家人类基线为71.33%,此后也被视为衡量AI表格能力的重要参照。

  据悉,此次登顶的WPS AI(Seed 2.0),是金山办公基于自研表格AI基座Qingqiu Agent打造的业务Agent。今年5月,Qingqiu Agent已在SpreadsheetBench Verified 400(专家精标榜单)以94.75%的成绩登顶;此次Full 912(全量榜单)再度夺冠,首次超越71.33%的人类专家基准线,实现了从基座能力到产品能力的完整跑通。(文猛)

海量资讯、精准解读,尽在新浪财经APP

责任编辑:宋雅芳

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法