AI办公的“最后一公里”有多远？商汤跨过的3大关卡_老虎社区_美港股上老虎

AI办公的“最后一公里”有多远？商汤跨过的3大关卡

雷峰网2025-12-26

“什么是办公Agent的“硬本领”与“真壁垒”？ ”

作者丨徐晓飞

编辑丨林觉民

”.png

眼下，AI办公智能体正在迎来最热切的期待与审视。

2024年“大模型吞噬软件”论断震惊全球科技圈，让人们不得不正视：传统软件正在被以大模型为核心的新形态所颠覆。

而这一“新形态”最直接的体现便是以“自主决策、任务闭环”为核心的智能体。它推动了生产力工具从“功能堆砌”转向“任务驱动”，把人从繁杂的软件操作中解放出来，打通人与任务间的“最后一公里”。

这场革新中，办公领域因数字化渗透最深、场景最广、离生产力一线最近，成了变革的核心试验场，也承载着人们的热切与审视：智能体在办公场景的“核心价值”是什么？何为“可用”与“好用”的智能体？从“可用”到“好用”的跨越，又需要哪些关键技术与经验支撑？

上周，商汤科技举行了2025产品发布周。重新定义“AI原生办公”——“办公小浣熊3.0”为行业带来了新范本。

什么是AI办公的“核心诉求”？

事实上，传统办公模式长期受制于“软件驱动” 的桎梏，因为其底层逻辑是： “人要去适配工具、迁就工具”。

比如，职场人需在多款软件间频繁切换，手动完成数据录入、格式调整、信息同步等重复性工作，工作流被切割成一个个碎片化的操作环节。一个完整的任务往往要跨越多个平台，不仅消耗大量时间成本，也容易因人为操作失误而导致效率损耗。

这种模式下，工具成了“核心”，人反而成了被动的操作者，大量的创造力与决策价值都被繁琐的流程稀释掉了。这也是传统办公场景下长久存在的隐痛。

AI办公智能体正在改变这种现状。

但人们发现，不少产品距离用户期待的“好用” 还有不小差距。有用户曾向雷峰网反馈：“在一些国外技术论坛里，有不少乍一看让人眼前一亮的 Aha moment 产品，但实际体验下来却效果一般。”

从“可用”到“好用”，至少要突破三大关卡

人们想要一款“好用”的AI办公智能体，但“丰满的理想”下，现实情况往往很复杂。

互联网公司市场部经理李萌对此感触颇深。她们的市场团队每天要对接五花八门的信息——既有销售端传来的Excel数据，又有活动策划的Word方案，还有客户投诉的聊天截图，甚至是竞品分析的PDF报告。

最头疼的就是做营销复盘时，得把Excel里的数据、微信里的客户反馈、PPT里的活动亮点全凑到一起，光是整理素材就要耗大半天。

“之前用AI帮忙做复盘，文件一杂、信息一乱，它就抓不住重点，要么只罗列数据没结论，要么漏了关键的客户意见，根本达不到直接用的程度。”李萌无奈道。

商汤小浣熊3.0进行市场活动复盘分析

在不少C端用户眼里，以往的AI办公产品同样存在不够好用的现象。

“过去的AI做PPT，总离直接落地差口气——生成的往往只是文字堆砌的初稿，没有清晰的逻辑框架，还缺少适配的图表和配图。”

比如要准备一份新产品宣讲PPT，即便提供了产品数据、客户需求、竞品分析等信息，AI也只是简单罗列内容，既梳理不出层层递进的逻辑，也不会自动将数据转化为直观图表。

最终输出的PPT，还需要用户花大量时间调整结构、优化版式、补充素材，无法直接拿去使用，跨不过“最后一公里”的交付门槛。

类似的情况还有很多。

这时候，“好用”的AI办公“搭子”到底应该是什么样的？

李萌在使用了小浣熊3.0这款办公智能体后，有了自己的答案。

在月度增长复盘场景下，面对李萌团队的困境，小浣熊能读懂深层需求，自动拆解任务，整合 Excel 数据、分析报告等多源资料，直接输出含数据图表、结论明确的复盘报告和完整 PPT，李萌稍作确认即可直接使用，省去繁琐打磨。

商汤小浣熊3.0进行月度增长复盘并完成总结PPT

在PPT交付场景下，小浣熊构建了一套多模态智能体创作引擎，把PPT制作从“帮着排版”直接拉到了“自己能做”的水平。

它能吃透用户零散信息背后的真实需求，规划好完整结构，直接生成PPT——绝非简单文字堆砌，而是已统筹好大纲、版式，还会自动匹配图片、生成图表，最终交付专业且可直接讨论的成品。同时小浣熊3.0还具备类似人的 “记忆” 机制，能记住用户的偏好和风格，让后续的输出更贴合用户个人习惯。

商汤小浣能3.0进行PPT生成和制作

而针对用户经常出差、路上使用电脑不便的场景，商汤小浣熊3.0还将在近期推出移动端APP，让用户在手机上也能延续电脑端的工作流程，变成一个永远在线的口袋助理。

而这种从听懂“指令”到理解“任务”，从给个“草稿”到交付“成果”，从困在“单点”到融入“全域”工作流，正是近期商汤小浣熊从2.0升级到3.0版本后实现的“三大能力跃迁”。

而这背后并非单纯的技术迭代，也包含了对办公本质的深度思考。

商汤科技小浣熊负责人贾安亚告诉雷峰网，在研发之初，团队就在思考：“什么是大模型时代的 AI 办公？我们到底想做一个什么样的 AI？”

“我们的答案非常明确：第一，我们不做冷冰冰的工具，而是要做能帮你进入“工作心流”的伙伴。第二，我们不做博眼球的demo，而是扎根用户的真实场景，解决真问题。”

正是基于这一思考，过去两年间，小浣熊从1.0到3.0一路走来，不断升级。

什么才是AI办公智能体的“真壁垒”？

雷峰网对比发现，与市面上大部分AI办公智能体相比，小浣熊3.0的优势体现在以下三点：

一是，超强的理解与数据分析能力。最早的小浣熊1.0版本——国内首个数据分析智能体，其擅长的就是做复杂的多模态数据分析，并且得到了不错的市场反馈。小浣熊3.0更支持了百万级数据量处理，及多模态多源数据分析。

其二，100分的成果交付能力。小浣熊3.0依托商汤日日新Agentic RL（智能体强化学习）技术实现了端到端复杂任务规划与闭环能力。尤其它建立更好的交互反馈与人机协作模式，让所有过程、结果都可编辑，实现了可控输出，让95分的成果升级100分交付。

第三，移动端APP上线后，更补全了最后一块跨平台处理的拼图。让它能更好地实现全流程一站式办公，融入企业工作流。

这其中，小浣熊 3.0 依托的商汤日日新Agentic RL是商汤科技在模型底层技术上的重要突破。

“我们去年大部分时间专注于数据分析，在单模态与多模态领域实现突破；今年上半年则聚焦复杂任务，深耕推理、拆解能力及智能体技术，完成了重大突破。”贾安亚透露。

具体来说， Agentic RL解决了三大核心技术挑战：

一是会“一步步琢磨”的长程推理。

面对图片、文字、文档这些杂乱的多类数据，"小浣熊"不再是简单的模式匹配，而是拥有了像“思维链”一样的自主规划能力，能把一个模糊的分析目标（比如“做一份产品销售分析”），拆成“整理数据→提炼关键信息→做图表→验证结论”等几十个清晰步骤，还能一直记住前后逻辑，不跑偏。

二是，每一步都“自我检查”的价值对齐。

不同于在多模态分析的每一步中，无论是提取PPT文件的页面数据，还是编写一段Python分析代码，Agentic RL的Reward系统都会实时评估当前步骤动作的价值。

目前主流的强化学习仅对最终结果进行奖励，而小浣熊引入了细粒度的过程监督——不管是从PPT里提数据，还是写一段分析代码，每做完一步都会实时“打分”，判断这步做得对不对、有没有用。

这使得模型具备了一定的自我反思能力，对于中间步骤出现偏差，它能进行自我修正并重新规划计划，大幅降低了模型的幻觉率。

三是，环境交互与闭环进化。

简单来说，小浣熊在处理任务时，会不断和数据工具互动，根据反馈调整做事方法（比如这次图表做反了，下次就自动修正）。这种机制让模型能够从错误中学习，实现推理能力的端到端的持续进化。

此外，针对PPT生成场景，小浣熊3.0专门研发了多模态智能体创作引擎，通过解耦内容与样式，实现高质量、可直接交付的自主创作。

而小浣熊3.0能做到这些，背后还有着更深层次的壁垒支撑。

贾安亚告诉雷峰网，在AI办公智能体的进化上，单点技术优势难以持久，小浣熊真正的核心优势，是技术层、产品层、落地方案执行层联动的组织化系统工程能力，而这背后是商汤十多年的沉淀。

比如，小浣熊兼具 B、C 两端属性，其中 To B 属性方面，就依托了商汤在 To B 场景十年的深耕与积累，再加上小浣熊自身过去两年间服务 300 多万个人用户与 1000 多家企业用户的实践，有教育版、金融版、政务版等等，沉淀出了一套成熟的To B、To C 系统工程方法论，这一点尤为关键。

因为眼下AI原生办公已经成为生产力基建，它不再是工具的简单叠加，而是以用户核心任务为轴心，彻底重构流程、释放生产力的效率革命。

这种背景下，从单一办公工具升级为支撑企业数字化转型的办公平台，尤其是支撑国产化办公基础设施，扛起服务者、基建者的使命，也成为中国AI企业的重要担当。

以商汤为代表的企业正以行动践行这一方向。

“为积极响应国产化的需求，小浣熊已经实现了从模型到硬件的全链路国产化适配，后续还会陆续推出国产化的AI PC、AI box，适配更多场景。”贾安亚补充道。

近期热门文章

之江实验室薛贵荣：当AI开始做科研，我看到了大语言模型的天花板丨GAIR 2025

郭毅可院士：AI带来“知识通胀”，击碎了传统教育的“前提假设”丨GAIR 2025

云大厂半年复盘：GPU业绩暴增、国内云攻守各异、外资云持续调整

免责声明：本文观点仅代表作者个人观点，不构成本平台的投资建议，本平台不对文章信息准确性、完整性和及时性做出任何保证，亦不对因使用或信赖文章信息引发的任何损失承担责任。

AI办公的“最后一公里”有多远？商汤跨过的3大关卡

什么是AI办公的“核心诉求”？

从“可用”到“好用”，至少要突破三大关卡

什么才是AI办公智能体的“真壁垒”？

精彩评论