给Agent装上"顺风耳":一家AI公司如何用录音硬件重构人机协作
在不少人眼中,录音笔是一个既不新鲜、也缺乏“科技感”的品类。
这个市场看似不大,却早已挤满了各路玩家。索尼、飞利浦想盘踞高端,爱国者、纽曼激战百元档,科大讯飞则试图用AI转写开辟新的增量空间。到了生成式AI时代,钉钉、飞书等科技巨头也纷纷依托其办公生态,推出了形态各异的AI录音硬件。
然而,恰恰是在这样一个看似“卷无可卷”的赛道里,一家长期深耕B端业务的企业——明略科技,却在今年5月打出了一张令人意外的牌,推出了一款面向C端用户的AI原生录音硬件——Octic。
这不禁让人心生好奇:一家原本主要为广告营销和零售行业提供数据挖掘与分析服务的企业级人工智能公司,为何会突然跨界,推出一款面向大众消费者的AI智能硬件?
给Agent装上“顺风耳”
答案,藏在明略科技过去半年最重要的一项内部实验上——全员“养虾”。
今年年初,明略科技创始人吴明辉拉着几位同事一起在群里“养虾”,却意外发现,把被赋予了不同专长的“龙虾”丢进不同的工作群和对话子区(Thread)里,竟会产生非常有意思的化学反应——当多个具备独立记忆与推理能力的“龙虾”在特定语境下和自己的主人及其他“龙虾”交互时,会有集体智慧涌现。
基于这个发现,吴明辉和明略科技几位工程师一拍即合,紧急开发了一套名为Octo(章鱼)的开源协作系统。在这个系统里,不仅活跃着各司其职的真实员工,还潜藏着员工们自己调教的 “龙虾”。
在Octo系统里,“龙虾”已经超越了传统AI工具的范畴,更像是员工的“数字分身”。
一个典型的场景是,当有员工休假结束、重返岗位时,面对积压了数天的工作群聊,他不再需要耗费数小时去手动翻阅海量的历史消息,可直接在群里 @ 自己的“龙虾”,并下达类似于“帮我总结过去三天里关于某项目的所有讨论要点与决策”的指令。接收到任务后,被@的“龙虾”会快速“爬楼”群聊信息,将一份条理清晰的摘要私发给自己的主人。
这种“人虾”协作带来的效率提升立竿见影,一场自上而下的组织级AI进化在明略科技内部迅速蔓延。
“截至目前,明略科技已有1400多名员工‘养’了3100多只‘虾’。”吴明辉透露。
不过,在吴明辉看来,这种群养“龙虾”的协作模式仍有一个盲区——数据匮乏。
吴明辉将数据划分为三个层级:一是公开互联网数据;二是沉睡在企业内部、科研设备及个人终端中,因安全与隐私顾虑不敢上云的私域数据;三是蕴含在人脑中、交流中,尚无法被形式化的暗默知识(Tacit Knowledge)。
“要想让‘龙虾’真正具备个人与组织的记忆,从而支撑起高效的在线协作,核心就在于攻克第二层和第三层数据的获取难题。”吴明辉指出,“我们既需要确保私域数据能在用户私有环境中被安全调用,也要找到一种有效方式,将原本存在于人脑及日常对话中的 Context(上下文信息)持续沉淀下来。而端侧硬件,正是 Agent 在现实世界中捕获这些关键 Context 的最佳入口。”
基于这一洞察,团队萌生了一个大胆的想法,给“龙虾”装上能够捕捉线下会议和日常交流的“顺风耳”。依托这一研发思路,面向C端用户的AI录音笔Octic应运而生。
值得注意的是,明略科技提出的“Agent正从云端走向端侧,从工具进化为数字同事”的构想,与黄仁勋在 GTC 大会上提出的“PC 正在被重新发明”的论断不谋而合。两者共同指向了一个确定性的行业趋势——把涉及隐私与高价值的信息处理由云端转至端侧,让 Agent 在本地安全运行。
越用越懂你的Personal AI
从硬件形态来看, Octic与市面上常见的 AI 录音卡片并无二致,同样采用了便携磁吸设计,贴附手机背面即可快速启用。
但在明略科技副总裁、Octic 产品负责人孔誉乾看来,这款产品的核心并不在硬件本身,而在于其背后的 Personal AI技术体系。
这套体系直指吴明辉反复强调的第三层数据难题——暗默知识匮乏。
“一个人关注什么项目、与谁协作、决策时重数据还是凭直觉,这些关键信息极少见于正式文档,却散落在每一次交谈与会议中,并随记忆迅速衰减。”吴明辉解释道,“Octic 的首要使命,正是将这些原本留不住的 Context(上下文) 精准捕获,转化为 Agent 可理解的记忆资产。”
与传统大模型“一次性问答、用完即忘”的模式不同,Personal AI 构建了一套分层的记忆架构。其将长期知识沉淀为稳定的人格与常识层,并从中期记忆中提炼出概念图谱。因此,用户无需重复交代背景,系统便能在每一次会议和对话中持续积累理解上下文。这种渐进式的学习能力,正是Octic实现“越用越懂你”的技术底座。
如果说“Personal AI”是Octic的底色,那么“会中助攻”,则是它区别于传统录音卡的第二个杀手锏。
Octic团队敏锐地捕捉到,让职场人士“抓马”的时刻往往就发生在当下。
试想一下,当对方突然抛出一组你拿不准的数据,急需秒速核实;或是讨论陷入胶着,需要有人从另一个角度提问;又或是临门一脚要做决策时,却发现还有信息盲区没补齐……正是这些真实存在的痛点,让 Octic 团队萌生了“让 AI 从‘会后秘书’升级为‘会中搭档’”的想法。
为此,Octic团队开发了支持者、质疑者、观察者三种角色人设,以及事实查验、反方质疑、论点强化、信息助手、话题走向分析、氛围感知、执行追踪共七种Skill。在会议进行时,它不仅能将语音实时转为文字,更能理解上下文语境,在后台“边听边找Bug”。
孔誉乾展示了一个日常使用场景:他在录制一场内部技术分享时,将Octic切换至“质疑者”人设。录制过程中,背后的Agent便开始实时挑战演讲者的论点,比如某个商业判断是否有数据支撑、某个技术路线是否存在替代方案,同时推送相关专业术语的解释卡片,供他随时查阅。
“相当于你在聆听的同时,旁边有一个懂你的AI在帮你找问题、补知识。”孔誉乾解释称。
不过,要实现“会中实时助攻”,技术门槛远比想象中高。孔誉乾坦言,团队在实现这一功能上“踩了巨多的坑”。
比如,实时处理长文本时,大模型可能拒绝服务或中途崩溃;个性化纠错时,Agent需要精准识别哪些是人名、哪些是业务术语,指令稍有偏差,效果就会大打折扣。这也解释了为什么行业内至今鲜有产品真正实现会中实时辅助。
“智能体互联网”的时代要来了
如果从“Agent持续进化的数据入口”这一视角重新审视Octic,就会发现,明略科技的考量并非仅是在AI录音笔的红海里分一杯羹、做一款好用的C端录音产品那么简单。
相反,这款录音卡更像是一个低调的探路者,其背后承载的是明略科技构建“智能体互联网”(Internet of Agents,以下简称 IoA)宏大愿景中的关键一环,是连接物理世界与数字智能生态的端侧入口。
随着“龙虾”逐步拥有个人记忆和组织记忆,一个属于智能体互联网的崭新时代正加速拉开序幕。
回顾互联网的发展历史,PC时代解决了信息的数字化与连接;移动时代实现了人与人的实时互联,而即将到来的IoA时代,其核心则是连接具备任务能力、记忆能力和执行能力的Agent(智能体)。
吴明辉将Agent分为三个层级:无状态 Agent(Stateless Agent)、单会话 Agent(Single-Session Agent)、跨会话有状态Agent(Cross-Session Stateful Agent)。
其中,无状态 Agent不具备上下文感知,它无法记住上一次与用户的交互内容。每次用户发起请求,对它来说都是一个全新的、孤立的任务。这类 Agent通常表现为Dify、N8 等低代码节点工具中的标准 Workflow(工作流),以及各类Skill(技能插件)。
而单会话Agent能够在单个会话内存储和调用上下文记忆。它最大的局限性是一旦用户结束当前对话、开启一个新的会话(New Chat),它就会遗忘此前所有的交流内容,像患了‘失忆症’。目前市面上主流的 AI对话产品(如ChatGPT、Manus等)大多属于这一类。它们在日常单次任务处理中表现出色,但缺乏跨时间的连续性。
跨会话有状态 Agent(Cross-Session Stateful Agent)则更进一步,其不再受限于单次对话的窗口,而是具备跨时间、跨场景的记忆能力。它能够将不同时间、不同场景下的交流内容进行存储和关联,可以在多个会话之间自由共享和调用上下文信息,“龙虾”就是这类产品。
“更重要的是,Octic作为私域数据的端侧硬件入口,把那些原本零散、私域的线下长尾数据,安全地转译为Agent可读的‘记忆资产’。”吴明辉补充道。
当这种“控制权回归个体”的范式成为常态,每个人都拥有了懂自己、代表自己的Agent,并开始在Octo等系统上联网、对话、协作时,“智能体互联网”(IOA)的图景便在物理世界与数字世界的交界处呼之欲出了。
“试想一下,以前大家用 CC(Claude Code)写代码,所有 Context(上下文)都锁在工程师自己的电脑里,窗口一关、机器一停,团队其他人都无法看见和复用。现在你把CC这样的工具集成到‘龙虾’里,再用 Octo等去调度,你的编码习惯、思考逻辑和业务偏好就会被沉淀下来。哪怕你休假了,只要经过授权,团队其他人只需要在工作群里 @ 你的‘龙虾’。”吴明辉兴奋地说道。
在吴明辉的构想中,“智能体互联网”时代的到来将打破传统组织协作的边界,将人机协同推向了一个前所未有的广袤维度。
“比如,员工未来不再需要亲自参与到每一个群聊或会议中。可以派遣你的龙虾或者AI分身进入不同的工作群(如Octo群组)。这些分身拥有你的跨会话记忆,能代表你发言、记录、分析。”吴明辉解释称。
让天下没有AI焦虑
当私域数据和信息有了Octic这样的AI原生硬件实时捕捉,跨会话协同和执行流程又被 “龙虾”等智能体接管,一个更深邃的行业命题也随之浮出水面:对于追求效率的现代公司或组织而言,未来是否会逐步用这些成本更低、永不疲倦的 AI“数字分身”来冷酷地平替掉真实的员工?
对于这类AI焦虑,吴明辉给出了一个笃定的答案:AI无法取代人类,因为AI不具备人类依托独特人生阅历形成的专属品鉴(taste)能力。
吴明辉将人类的工作流拆解为“思、品、行”三个维度:“思”是依托已知前提开展演绎、归纳、溯因的逻辑推理,这是AI的强项,相关工作可交由AI Agent完成;“品”是脱离固定逻辑前提、由个人阅历催生的整体性品鉴判断,是人类独有、不可替代的能力;“行”是品鉴的载体,品鉴依托实地行动积累自然形成,脱离现实行动的品鉴只是空谈。
这也推导出了未来AI Native 组织产生集体智慧的闭环逻辑,即行动者深入现实探索,利用Octic等端侧硬件沉淀一手信息和数据(Context),为品鉴提供素材;品鉴者凭借自身独有的品鉴力,针对现有信息做出差异化独立判断;而AI Agent不做价值方向判断,依托强大推理能力承接品鉴结果、高效落地执行。
在探索 Scaling Law与智能体长程进化的过程中,人类的品鉴能力同样不可或缺。
据METR(Model Evaluation and Threat Research)的研究数据显示,尽管AI执行长程任务的“Horizon Length(有效视野长度)”正在以每7个月翻倍的速度迅猛增长,但其底层的软肋依然存在——Agent在单步推理中的微小误差,会随着执行步骤的延长在链条中复合放大,导致最终成功率呈指数级衰减。
举个例子,哪怕 Agent 单步的准确率高达 99%,在连续执行100步的复杂复合任务后,其整体的最终成功率也会因为误差的叠加而跌至约 36.6%。
吴明辉指出,面对这种不可避免的“机器幻觉与链路崩溃”,人类作为“品鉴者”的核心价值便凸显出来。比如,人类无需亲自去干前 100 步的脏活累活,而只需在关键的里程碑节点进行审查(品鉴),一旦发现方向跑偏,便及时介入并重置误差链。
“所以留住人、培养人的Taste(品味),才是未来AI原生公司的护城河。”吴明辉称。
回望过去半年年,明略科技围绕“智能体互联网”铺陈的AI版图已悄然合拢:“龙虾”让用户有了可编辑、可审计的跨会话AI分身;Octo作为开源协作系统,打通了 Agent之间的连接通道;而Octic则补上了最后一块拼图——让 Agent 在物理世界中拥有持续的 Context (上下文)输入。
"很多公司以为 AI Native 就是给每个人发个助手,"吴明辉说,"错了。真正的 AI Native,是让 AI 长进组织里,跟着人一起经历真实世界。它见过的世面越多,就越懂你。明略要做的,就是让每个企业和个人,都能拥有一支越用越强的 AI 团队。"
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


