迈向物理世界,飞书“豆”志昂扬
2023年至2024年,Scaling Law是整个AI行业的唯一信仰,所有人都试图通过堆砌参数和算力来触碰智能的上限。然而到了2026年,风向悄然逆转。那些曾经信奉“大力出奇迹”的顶尖团队,开始默契地将模型做“窄”。
这种“窄”并非能力的退化,是指Context的极度聚焦。行业开始意识到,与其追求全知全能的通用智能,不如在特定的业务流中,用更精准的上下文去解决一个具体的问题。
1月19日,飞书联合安克创新发布了“安克AI录音豆”。这枚直径仅23.2毫米、重约10克的小圆片,采用了与钉钉录音卡片截然不同的磁吸设计,让设备轻盈地别在衣领上。在商业模式上,它选择了“一次性硬件(约 800 元)+ 订阅制服务”的组合。
这是飞书向物理世界迈出的第一步,恰逢一个微妙的时间节点。传统的“聊天驱动工作”模式,正在迎来它的边际效应递减点。人类处理信息的带宽是有限的,没人能通过阅读更多的群消息来提高效率。钉钉和飞书都敏锐地捕捉到这一信号,二者不约而同地完成了从“人机协同”向“多智能体协同”的转向选择。
这种转向并非空中楼阁,其商业合理性已被一家名为Plaud的创业公司验证。截至今年7月,Plaud累计出货量突破100万台。其联合创始人许高在2025年9月的一次公开访谈中提到,2025年Plaud总收入预计能达到2.5亿美元。
市场的热度印证了《新立场》此前的观点:AI硬件,必须懂领域内的“脏活累活”。会议场景信息密度极高,但过去真正被结构化保存的内容少得可怜。将会议纪要变为可以沉淀、检索、复用的内容资产,本身就是一门好生意。
创业者负责验证路的可行性,而巨头负责把路修成收费站。 Plaud证明了录音卡片是一门好生意,但在办公领域,飞书与钉钉拥有第三方硬件无法逾越的壁垒:生态的无缝对接。
当录音数据能够直接流转进飞书文档、多维表格,或者钉钉的审批流时,硬件才真正成为了工作流的一部分。而这两款产品,也充分体现了两家企业负责人的处事风格:钉钉维护流程秩序,飞书坚持产品体验。
在这场关于效率的探索中,大厂与创业者、飞书与钉钉,或许并非简单的对手,而是共同的拓荒人。毕竟,让AI更懂人类,让工作更少羁绊,是业内共同的愿景。
飞书理想依旧
飞书的核心价值始终锚定于“协同”。然而,在协作的深水区,一个长期存在的痛点日益凸显:组织内部每天产生的海量会议录音,蕴含着无限丰富的“上下文”,却因人类处理能力的“带宽”限制,往往沦为沉睡的信息孤岛。
事实上,这种对语音价值的探索并非孤例。早在2017年,锤子科技的“闪念胶囊”就曾敏锐地捕捉到了语音交互的潜力,那是一次理念超前的探索。彼时受限于AI技术,录音尚是“死数据”。而今天,当语音输入已成共识,AI硬件的下一场革命,正是为了让数据跑得更近、更活。
对于飞书而言,线上数据的挖掘已臻化境。最大的“暗数据”,依然存在于线下的谈话之中。
将视角拉高到 AGI 的演进路径上,我们迫切需要更高分辨率的人类数据样本,Andrej Karpathy曾抛出一个极具洞察力的论断:世界是一个巨大的“Token流”。带入这个理论框架,飞书过去几年处理的“Keyboard Tokens”(键盘敲击字符)是经过人类大脑预处理、压缩过的信息。键盘是低带宽的压缩工具,但麦克风捕捉的声波却是原始数据(Raw Tokens)。
这枚录音豆,便是飞书为了捕获原始数据而设计的“高保真采集器”。它试图捕捉人类声音中那些微妙的波形与情绪,从而让AI真正理解沟通背后的意图。
具体到产品哲学上,安克AI录音豆延续了飞书一贯的“重内容体验”。录音豆的操作极简,只有一个按键,技术上沿用了不入耳耳机的设计理念,利用充电舱进行配对。它具备双麦克风、自动人声增强、声纹识别等能力。
这种精致背后,是飞书精心修筑的生态高墙。与 Plaud 等第三方硬件“生成即终结”的单点逻辑不同,使用第三方卡片,流程往往终结于“生成一篇文档”。
但对于飞书用户,录音、分析、生成纪要之后,这些数据进入企业大脑,系统可从历史录音中提取答案。
这种“录音-分析-沉淀-检索”的闭环,虽然为用户提供了上帝视角的检索能力,但也意味着一旦你开始使用它,你就更难离开飞书的生态引力场。
值得注意的是,飞书在形态上做了一次关键的“切割”。与钉钉 A1 那种安于桌面的“静止客体”不同,飞书录音豆通过磁吸设计占据了衣领这一高地,试图成为与人共生的“移动主体”。
不过,这枚录音豆或许只能捕获特定场景下的音频流,但它指向了字节跳动这家巨头对“硬件”的长期思考。从大力智能学习灯的尝试,到Pico在VR领域的深耕,再到2024年对Oladance耳机的收购——字节跳动一直在耐心地寻找一个属于自己的物理容器。
在AGI时代,APP的边界日益明显。未来的交互必然是流式(Streaming)且全时在线的。为了突破系统级的延迟与权限壁垒,AI需要从图标下沉为操作系统(OS)。构建一套“Model-as-OS”(模型即系统)的软硬一体化闭环,或许是通往用户分发权的必经之路。
在这个宏大的架构蓝图下,飞书与安克的联手,是一次务实且高效的“借船出海”。让飞书这支纯粹的软件团队,依托安克成熟的硬件工业体系,完整跑通从产品定义到量产销售的全链路。这不仅降低了试错成本,更是在为未来消除工程上的不确定性。
诚然,会议录音只是一个垂直的切口,但这枚录音豆的意义,不在于它现在能承载多少野心,而在于它开启了什么。它是飞书向物理世界投出的一块问路石,也是通往更高频、多模态交互未来的序章。
两种主义的平行生长
钉钉与飞书这对协同办公领域的“老对手”,在AI时代走向了截然不同的分岔路。这种分岔,很大程度上源于两家企业灵魂人物的性格底色。
无招相信秩序。在他的世界观里,效率来自于流程的标准化与管控的颗粒度。过去一年,回归后的无招带领钉钉,用一种近乎野草般的生命力,在物理世界完成了从录音笔、到执行终端的“生态尝试”。DingTalk A1与DingTalk Real功能设计,毫无花哨地契合了钉钉“重业务逻辑”的场景。
无招对硬件有着一种一以贯之的、近乎偏执的“执念”。从2017年的M1指纹考勤机,到创业时期的智能猫砂盆、数字光耳机。再到回归后用“蕨”与“木兰”的植物演化史为钉钉定调,他始终试图用物理设备来丈量管理半径。
钉钉的硬件逻辑是惊人自洽的, DingTalk A1 不止于录音,它直接生成单据,触发审批流。硬件采集的 ID、时间戳、数值等结构化数据,又恰好是通义千问(Qwen)模型最擅长的逻辑推理战场,没有算力的浪费,也没有模态的错位, 钉钉做到了“模型能力与硬件形态”的契合,每一分算力都被精确地转化为了无招所渴望的“业务流程自动化”。
相比之下,飞书则选择了一条更为理想主义的路径——它更像是一颗精致的“种子”。
谢欣是典型的中国互联网“绩优生”,北大计算机系科班出身,历经微软亚洲工程院与百度的洗礼。作为飞书早期的推石人,他从一开始就拒绝谈论ROI,执拗地将飞书定义为“新时代的Office”。他赋予了飞书一种近乎洁癖的价值观:工具不仅仅是工具,它是先进组织的容器。
他曾提出:我们开会把讲PPT改为写文档,先默读,再讨论。这种对内容密度和形式的极致追求,让飞书在很长一段时间里,成为了中国SaaS行业里那个不计成本的理想国。
飞书也用一份漂亮的成绩单验证了“产品力换收入”的路径。2024年,其年度订阅收入(ARR)突破3亿美元,同比增长50%,在与钉钉、企业微信的贴身肉搏中撕开了一道口子。更重要的是,它赢得的是最具活力、也最挑剔的那群人。从造车新势力到新茶饮巨头,再到AI Native公司,比如DeepSeek、MiniMax、月之暗面。飞书成功地将自己变成了“先进生产力”的代名词。
然而,对“完美”的执念,也意味着需要支付更高的探索成本。谢欣曾坦诚地反思组织效率与聚焦问题:组织不够精干、效率在变低、力量不够聚焦。
飞书的产品负责人位置上,从徐哲到陈满砚,再到齐俊元、童遥,这种人事变动,在《新立场》的视角下,更像是在构建“新一代Office”蓝图过程中,对“最佳操盘手”的持续寻找与对齐。
这种“知音难觅”以及对“标准”的坚守,自然也延伸到了硬件策略上。由于对用户体验的极致苛求,飞书在硬件决策上显得尤为审慎与克制。这枚录音豆是精致的、安全的、挑不出错的。尽管在外界看来,它似乎暂时还无法承载飞书全部的野心,但对于一个始终致力于重塑工作流的精英团队而言,这或许是当下最稳妥的起手式。
这种“精益求精”的哲学,在竞争的时间维度下确实会被放大。AI硬件的窗口期稍纵即逝。钉钉显然更愿意在泥泞中摸爬滚打,也用更近似于“蕨类”的方式提早去占据物理世界的入口;而飞书则继续保持着一种“产品洁癖”般的优雅,但也用一枚“录音豆”来跟上了节奏。
这并非优劣之分,而是选择之别。 钉钉在构建骨骼,飞书在丰富灵魂。这枚精致的录音豆,或许只是飞书在物理世界的一次轻声问候,而在它身后,那个关于“先进组织”的宏大叙事,仍在继续书写。
写在最后
从能力图谱的维度审视,飞书、钉钉与腾讯会议,或许是当下最适合涉足AI录音硬件的企业。因为它们天生就伫立在“信息发生的源头”。会议、协作、沟通——这些场景构成了企业数据的“原油井”。
对于这些协同办公巨头而言,硬件不是跨界,而是将原本就在流动的比特流,通过物理载体进行更高保真的捕获与沉淀。
当 AI 从AIGC for Fun转向AI for Work,“好用”的权重便迅速让位于“安全”。一家正在研发核心技术的车企,或者一家筹备上市的茶饮公司,或许愿意用Startup(初创公司)的产品画几张海报,但绝不敢将董事会的录音、核心代码的讨论上传到一家不知名创业公司的服务器上。
在企业级市场,数据安全不是一个“Feature(功能)”,而是“入场券”。这也解释了为什么办公AI最终会成为大厂的深耕区。只有飞书这样的平台,才拥有经得起审计的合规体系、私有化部署的能力以及庞大的云安全背书。对于企业客户而言,选择大厂的硬件,本质上是选择了一份“数据资产的保险箱”。至于硬件本身是否精美,反而是次要的。
归根结底,AI时代的探索,是操作系统(OS)权重的争夺。
未来的交互注定是流式的(Streaming)。飞书种下的这颗“录音豆”,或许现在看起来还很微小,但它承载着连接物理世界与数字世界的愿景。它不仅仅是一个配件,更是一次关于未来的土壤测试。飞书希望通过这颗种子,在未来长出那棵连接人与智能的通天藤蔓,让协作更自由,让创造更简单。
*题图及文中配图来源于网络。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


