AI办公的“最后一公里”有多远?商汤跨过的3大关卡

雷峰网2025-12-26

什么是办公Agent的“硬本领”与“真壁垒”? ”             

作者丨徐晓飞

编辑丨林觉民

眼下,AI办公智能体正在迎来最热切的期待与审视

2024“大模型吞噬软件”论断震惊全球科技圈,让人们不得不正视:传统软件正在被以大模型为核心的新形态所颠覆。

而这一新形态最直接的体现便是以自主决策、任务闭环为核心的智能体。它推动生产力工具从功能堆砌转向任务驱动,把人从繁杂的软件操作中解放出来,打通人与任务间的最后一公里

这场革新中,办公领域因数字化渗透最深、场景最广、离生产力一线最近,成了变革的核心试验场,也承载着人们的热切与审视:智能体在办公场景的核心价值是什么?何为可用好用的智能体?从可用好用的跨越,又需要哪些关键技术与经验支撑?

上周,商汤科技举行了2025产品发布周。重新定义AI原生办公”——“办公小浣熊3.0”为行业带来了新范本。

01

什么是AI办公的“核心诉求”?

事实上,传统办公模式长期受制于软件驱动” 的桎梏,因为其底层逻辑是: 人要去适配工具、迁就工具

比如,职场人需在多款软件间频繁切换,手动完成数据录入、格式调整、信息同步等重复性工作,工作流被切割成一个个碎片化的操作环节。一个完整的任务往往要跨越多个平台,不仅消耗大量时间成本,也容易因人为操作失误而导致效率损耗。

这种模式下,工具成了“核心”,人反而成了被动的操作者,大量的创造力与决策价值都被繁琐的流程稀释掉了。这也是传统办公场景下长久存在的隐痛。

AI办公智能体正在改变这种现状。

但人们发现,不少产品距离用户期待的好用” 还有不小差距。用户曾向雷峰网反馈:在一些国外技术论坛里,有不少乍一看让人眼前一亮的 Aha moment 产品,但实际体验下来却效果一般。

02

从“可用”到“好用”,至少要突破三大关卡

人们想要一款好用AI办公智能体,但丰满的理想下,现实情况往往很复杂。

互联网公司市场部经理李萌对此感触颇深。她们的市场团队每天要对接五花八门的信息——既有销售端传来的Excel数据,又有活动策划的Word方案,还有客户投诉的聊天截图,甚至是竞品分析的PDF报告。

最头疼的就是做营销复盘时,得把Excel里的数据、微信里的客户反馈、PPT里的活动亮点全凑到一起,光是整理素材就要耗大半天。

之前用AI帮忙做复盘,文件一杂、信息一乱,它就抓不住重点,要么只罗列数据没结论,要么漏了关键的客户意见,根本达不到直接用的程度。李萌无奈

商汤小浣熊3.0进行市场活动复盘分析

在不少C端用户眼里,以往的AI办公产品同样存在不够好用的现象。

过去的AIPPT,总离直接落地差口气——生成的往往只是文字堆砌的初稿,没有清晰的逻辑框架,还缺少适配的图表和配图。

比如要准备一份新产品宣讲PPT,即便提供了产品数据、客户需求、竞品分析等信息,AI也只是简单罗列内容,既梳理不出层层递进的逻辑,也不会自动将数据转化为直观图表。

最终输出的PPT,还需要用户花大量时间调整结构、优化版式、补充素材,无法直接拿去使用,跨不过最后一公里的交付门槛。

类似的情况还有很多。

这时候,“好用”的AI办公“搭子”到底应该是什么样的?

李萌在使用了小浣熊3.0这款办公智能体后,有了自己的答案。

在月增长复盘场景下,面对李萌团队的困境,小浣熊能读懂深层需求,自动拆解任务整合 Excel 数据、分析报告等多源资料,直接输出含数据图表、结论明确的复盘报告和完整 PPT,李萌稍作确认即可直接使用,省去繁琐打磨。

商汤小浣熊3.0进行月度增长复盘并完成总结PPT

PPT交付场景下,小浣熊构建了一套多模态智能体创作引擎,把PPT制作从帮着排版直接拉到了自己能做的水平。

它能吃透用户零散信息背后的真实需求,规划好完整结构,直接生成PPT——绝非简单文字堆砌,而是已统筹好大纲、版式,还会自动匹配图片、生成图表,最终交付专业且可直接讨论的成品。同时小浣熊3.0还具备类似人的 记忆” 机制,能记住用户的偏好和风格,让后续的输出更贴合用户个人习惯。

商汤小浣能3.0进行PPT生成和制作

而针对用户经常出差、路上使用电脑不便的场景,商汤小浣熊3.0还将在近期推出移动端APP,让用户在手机上也能延续电脑端的工作流程,变成一个永远在线的口袋助理

而这种从听懂“指令”到理解“任务”,从给个“草稿”到交付“成果”,从困在“单点”到融入“全域”工作流,正是近期商汤小浣熊从2.0升级3.0版本实现的三大能力跃迁

而这背后并非单纯的技术迭代,也包含了对办公本质的深度思考。

商汤科技小浣熊负责人贾安亚告诉雷峰网,在研发之初,团队就在思考:什么是大模型时代的 AI 办公?我们到底想做一个什么样的 AI

我们的答案非常明确:第一,我们不做冷冰冰的工具,而是要做能帮你进入工作心流的伙伴。第二,我们不做博眼球的demo,而是扎根用户的真实场景,解决真问题。

正是基于这思考,过去两年间,小浣熊从1.03.0一路走来,不断升级。

03

什么才是AI办公智能体的“真壁垒”?

雷峰网对比发现,与市面上部分AI办公智能体相比,小浣熊3.0的优势体现在以下三点:

一是,超强的理解与数据分析能力。最早的小浣熊1.0版本——国内首个数据分析智能体其擅长的就是做复杂的多模态数据分析,并且得到不错的市场反馈。小浣熊3.0更支持了百万级数据量处理,及多模态多源数据分析。

其二,100分的成果交付能力。小浣熊3.0依托商汤日日新Agentic RL(智能体强化学习)技术实现了端到端复杂任务规划与闭环能力。尤其它建立更好的交互反馈与人机协作模式,让所有过程、结果都可编辑,实现了可控输出,让95分的成果升级100分交付。

第三移动端APP上线后,更补全了最后一块跨平台处理的拼图。让它能更好地实现全流程一站式办公,融入企业工作流。

这其中,小浣熊 3.0 依托的商汤日日新Agentic RL商汤科技在模型底层技术上的重要突破。

我们去年大部分时间专注于数据分析,在单模态与多模态领域实现突破;今年上半年则聚焦复杂任务,深耕推理、拆解能力及智能体技术,完成了重大突破。贾安亚透露。

具体来说, Agentic RL解决了三大核心技术挑战:

一是会一步步琢磨的长程推理。

面对图片、文字、文档这些杂乱的多类数据,"小浣熊"不再是简单的模式匹配,而是拥有了像思维链一样的自主规划能力,能把一个模糊的分析目标(比如做一份产品销售分析),拆成整理数据提炼关键信息做图表验证结论等几十个清晰步骤,还能一直记住前后逻辑,不跑偏。

二是,每一步都自我检查的价值对齐。

不同于在多模态分析的每一步中,无论是提取PPT文件的页面数据,还是编写一段Python分析代码,Agentic RLReward系统都会实时评估当前步骤动作的价值。

目前主流的强化学习仅对最终结果进行奖励,而小浣熊引入了细粒度的过程监督——不管是从PPT里提数据,还是写一段分析代码,每做完一步都会实时打分,判断这步做得对不对、有没有用。

这使得模型具备了一定的自我反思能力,对于中间步骤出现偏差,它能进行自我修正并重新规划计划,大幅降低了模型的幻觉率。

三是,环境交互与闭环进化。

简单来说,小浣熊在处理任务时,会不断和数据工具互动,根据反馈调整做事方法(比如这次图表做反了,下次就自动修正)。这种机制让模型能够从错误中学习,实现推理能力的端到端的持续进化。

此外,针对PPT生成场景,小浣熊3.0专门研发了多模态智能体创作引擎,通过解耦内容与样式,实现高质量、可直接交付的自主创作。

而小浣熊3.0能做到这些,背后还有着更深层次的壁垒支撑。

贾安亚告诉雷峰网,在AI办公智能体的进化上,单点技术优势难以持久,小浣熊真正的核心优势,是技术层、产品层、落地方案执行层联动的组织化系统工程能力,而这背后是商汤十多年的沉淀。

比如,小浣熊兼具 B两端属性,其中 To B 属性方面,就依托了商汤在 To B 场景十年的深耕与积累,再加上小浣熊自身过去两年间服务 300 多万个人用户与 1000 多家企业用户的实践,教育版、金融版、政务版等等沉淀出了一套成熟的To BTo C 系统工程方法论,这一点尤为关键。

因为眼下AI原生办公已经成为生产力基建,它不再是工具的简单叠加,而是以用户核心任务为轴心,彻底重构流程、释放生产力的效率革命。

这种背景下,从单一办公工具升级为支撑企业数字化转型的办公平台,尤其是支撑国产化办公基础设施,扛起服务者、基建者的使命,也成为中国AI企业的重要担当。

以商汤为代表的企业正以行动践行这一方向。

为积极响应国产化的需求,小浣熊已经实现了从模型到硬件的全链路国产化适配,后续还会陆续推出国产化的AI PCAI box,适配更多场景。贾安亚补充道。

//

近期热门文章

之江实验室薛贵荣:当AI开始做科研,我看到了大语言模型的天花板丨GAIR 2025


郭毅可院士:AI带来“知识通胀”,击碎了传统教育的“前提假设”丨GAIR 2025


云大厂半年复盘:GPU业绩暴增、国内云攻守各异、外资云持续调整

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法