豆包手机把老美吹的牛逼给做出来了
从2023年Chatgpt横空出世,我就一直在等待AI手机走进现实。
从小米到苹果、谷歌,再到微软的sureface,我关注每一次AI手机和AIPC的发布会,看了各大厂商ppt和视频,我都充满了期待,但最后没有一个能够在产品上实现的,基本都是用ppt吹牛逼。
直到12月1日发布的豆包手机助手,我不得不说字节的宣传片效果惊人但小字却非常谦虚,说是工程样机,AI功能复现存在不确定性。
我昨天也惯性地认为,谷歌拥有安卓底层系统权限,自家的Pixel手机都没做出能够商用的手机个人助手产品,字节应该更没戏了。毕竟一个agent要完成一个点外卖的动作,可能要拆分成五到十个步骤,每个步骤如果有90%的成功率,那整个一套流程下来就只有50、60%的概率能够完成指令了,这其实是没法商用的。
但我真的高估了老外的软件能力,低估了我们工程师的水平。
今天看到群里发过来的真人实测视频,可以说字节的宣传片朴实、低调以及过分的谦虚了。
今天华创TMT研究员拿到了努比亚153这款工程样机,并且现场做了评测,结论是:
“实测效果惊艳,对复杂任务理解好、完成度高(80-90%)、成功率高(80-90%),耗时可接受(复杂任务在 3 分钟 +,简单任务几十秒),但可后台运行,等待感弱”
具体可以看一下后面的评测录像:
我想说一下豆包手机能够完成这些复杂指令对AI产业的意义。
首先,这标志着AI个人助理成为AI落地的第四个大场景
目前AI有已经有三个商业化需求场景落地了:
2023年第一场景是chatbot(聊天机器人),主要满足信息咨询需求,目前看来也是最高频因此也是用户最多的AI应用场景。
2024年开始AIcoding(AI编程)开始爆发,虽然编程的需求不是大众需求,但编程的语料质量高,效果好,付费渗透率高,因此Anthropic的token消耗量超过了openai,成为了第二个AI的商业化需求场景。
2025年随着nano banana在ai生图上的进步,解决了AI视频一致性问题,可灵、sora、Veo等ai模型已经开始商业化,AI视频成为了第三个落地的AI应用场景,预计未来几年AI生成的视频渗透率会持续上升。
AI助理从AI诞生大家就都报以期望,不过因为完成复杂指令的成功率很低,年初的manus火了一阵后来就没声音了,微软的surface去年做了一个特别吸引人的aipc介绍视频,最后啥也没做出来全是yy的效果图而已。
AI助理的功能可以分为两步,第一步是帮人记住事情,第二步是帮人做事情。助理是所有人潜在的刚需,满足的是人懒的本性。点餐、比价等每一项工作都需要在手机上点击和滑动十几次才能完成,但AI个人助理把这个流程简化为一句话和点一两次确认,我相信随着AI个人助理产品不断完善,其渗透率会持续上升。
更重要的是,AI个人助理是一个C端的需求场景,比ai coding、ai视频这种2b的需求影响范围更广,如果每天有过亿用户调用个人助理,对AI算力的需求是巨大的,这就给现在的AI叙事提供了新的逻辑,明年的主升浪就有谱了。
另一方面,人机交互方式会发生变化
AI个人助理极大地提高了交互效率,一句话能够完成10次点击、滑动才能完成的事情,明显降低了交互次数。手机其实只是AI个人助理的一种载体或者媒介,是边缘计算的一个平台。
手机的交互优势在于打字这种方式,如果后面点击、滑动、打字这些交互变少了,其实智能手表、AR眼镜在一些场景下都会比手机更方便。毕竟手机还需要从兜里拿出来,手表和眼镜只需要说话就够了。AI个人助手可以存在于任何的智能硬件中,比如家庭的智能中枢电视。
从测试视频中也可以看出,一个任务大约需要1、2分钟才能完成,其实用AR眼镜调用豆包手机助手,完成之后直接在眼镜的显示屏里确认比手机更加方便。
总之,AI个人助手能力越强,交互的次数就越少,而交互次数越少,就越利好AR眼镜,以及其他的AI智能硬件。
meta豪赌ar眼镜是下一个流量入口,今天看到豆包手机助手这么高水平的任务完成度,我觉得AR眼镜成为下一个入口的时间真的要来了。
最后,我能预感2026年AI agent应该真的要落地了,豆包做到了,其他大厂也会跟进,手机这块豆包和中兴走在了前面,等其他厂半年后做到豆包现在的个人助手水平之后,估计豆包又要优化到更好的版本了。但除了手机,比如之前谷歌和openai一直发力的ai浏览器,微软的surface和联想一直想做的aipc,可能在2026年都有机会给我们带来惊喜。
AIagnet和AI硬件应该是2026年最大的主题,制造业也是我们中国的强项,让我们耐心的等待下一个主升浪到来吧。
风险提示:本文发布的所有内容,不构成任何投资建议,市场有风险,投资需谨慎。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


