阿里确实把C端用户放心上了。
作者|刘杨楠
想和爱豆拍电影,不再只是梦想。
12月16日,阿里发布最新视频生成模型“万相2.6”。其最大亮点在于实现了国内视频模型在“角色扮演”功能上的突破,同时该模型也支持音画同步、多镜头生成及声音驱动等功能,模型功能更加全面。
千问APP接入万相2.6的动作也足够果决。模型刚更新,千问APP就顺势无缝上线“AI小剧场”功能,在国内首次实现了“角色合拍”的创新玩法,让用户能够打破次元壁,和朋友或名人同框,一同出演AI短片。放眼全球,目前仅有OpenAI的Sora 2有类似功能。
万相2.6和千问APP的碰撞,也隐约传递出一则关键信号——千问APP正在跨越单纯的工具属性,开始向着更具想象力的“超级入口”迈进。
1.千问APP的边界突围
此次模型和APP同步更新,阿里对不同类型用户的定位极其清晰。
对于专业创作者而言,模型的角色扮演功能无疑拓宽了创作边界和自由度,让以往需要高昂成本才能实现的镜头语言触手可及;对于C端用户而言,APP上的乐子更多了。
千问APP此次接入万相2.6后,我们已经陷在“AI小剧场”的脑洞里难以自拔。
比如,悟空可以和黛玉告白。我们用“AI翻拍”功能翻拍了一位创作者的原创视频。
prompt:帮我翻拍视频,修改内容为:把红色晚霞换成飘雪的冬夜天台,冷白月光洒下,城市剪影被薄雪覆盖,丁达尔效应变为雪花飘舞的光痕。从这次“AI小剧场”的更新中,我们也感受到,这一次,阿里用实际行动证明,他们把C端用户真正放在了心上。
从这次“AI小剧场”的更新中,我们也感受到,这一次,阿里用实际行动证明,他们把C端用户真正放在了心上。
万相2.6本身瞄准专业的影视制作领域,但在技术落地的选择上,千问几乎没有丝毫迟疑,真正在第一时间就无缝接入万相2.6。
这一动作打破了以往前沿技术先服务B端,后下放C端的惯例。千问APP直接把以往专业创作者才能用到的顶级模型能力,毫无保留地带到了小白用户面前,有趣且有用。
在当前国内C端AI应用同质化严重的背景下,“AI小剧场”确实能提供一种差异化体验,不仅能吸引大量喜欢尝鲜的年轻用户,也能留住那些对内容质量有要求的创作者。
不夸张地说,在“AI小剧场”刷大家生成的各类AI视频的时候,我们真正感受到了“AI原生视频APP”的具象化——故事、人物和画面背景均由AI生成,这里似乎能够将一切想象变成一条短视频。
从更深层的产品逻辑来看,“角色合拍”功能带有强烈的“社交属性”,用户不仅能创建自己的AI分身,还能邀请好友一起创建,直接将千问的应用场景从传统的问答、办公、学习,拓展到了视频创作和社交娱乐领域。
在这个新场景下,用户不再是枯燥地提问,而是内容的共创者。可以预料,这种具有高互动性、高分享欲的交互形态,也能在很大程度上增加千问APP的用户粘性,并极有可能通过社交裂变,吸引一波全新的用户群体。
回顾互联网发展史,这种由社交带来的人与人之间的强链接,在某种程度上是每一代“杀手级APP”制胜的根本。
相比于技术的快速迭代,人性的迁移往往是极其缓慢的。人们对连接、表达和被关注的渴望从未改变。千问APP通过“AI小剧场”切入这一基本需求,无疑抓住了C端产品的一大窍门。
从千问上线“AI小剧场”的这一连串动作中,“甲子光年”也能清晰看到,阿里正在加速为这款产品烙印上C端的基因。至此,各大厂在今年铆足劲头争夺的“超级入口”,终于呈现出一个逐渐丰满、清晰的阿里画像。
2. “超级入口”的阿里画像
千问APP是裹着市场争议诞生的。
11月17日,阿里巴巴正式对外发布了“千问App”,并将其战略定位清晰地锚定为“AI 超级入口”。其底座接入了阿里通义实验室目前最强悍的Qwen 系列模型,明确对标ChatGPT当时最新的5.1版本(目前已迭代至5.2版本),战略站位很高。
但市场对千问APP的预期不明。一直以来,对比豆包、DeepSeek、元宝等竞争对手动辄千万级甚至亿级的用户规模,阿里AI产品在C端市场的存在感稍弱,这与其开源模型在海外技术社区的高声量形成鲜明反差。
但千问近一个月的成绩单,已经让曾经的质疑不攻自破。
12月17日,正值千问APP公测“满月”。在这一个月里,千问展现出了惊人的成长速度,共计更新18个版本,在创作、学习、办公三大核心场景的能力上持续增强。
用户数量的增长更是打破了纪录:公测仅一周下载量即破千万;公测23天,月活跃用户数(含APP、Web、PC端)一举突破3000万,成为全球增长最快的AI应用。
目前来看,阿里通过千问APP打造超级入口的思路已逐渐清晰。
如果沿用互联网时代的产品思路,功能价值和情绪价值是两种不同的产品思路。而现在的千问,已经初步兼具两种价值。
一个月前,当千问刚面世时,阿里主要打出的是“能办事”的旗号。但不得不承认,对于C端用户而言,“能办事”虽然重要,却并非全部。在某种程度上,“好玩”和“好用”对于大众用户来说同样重要,甚至“好玩”才是留存的关键。“AI小剧场”可以看作是千问APP从单纯的“严肃好用”走向“好用又好玩”的关键转折点。
“AI小剧场”将专业视频创作的门槛降低至趋近于0。这自然能帮助千问构建一个由UGC驱动的C端内容生态,这个生态甚至可能成为未来连接IP、社交甚至电商生态的起点。
值得注意的是,该功能需要调用角色、形象,这与阿里生态内庞大的文娱IP资源(如优酷、阿里影业)存在着巨大的想象空间。这表明,千问正尝试成为连接阿里内部各项能力和服务的“超级应用”,而不仅仅是一个独立的AI工具。
此举让千问在国内视频大模型的C端应用竞争中,一举占据了首发和引领者的位置。它不仅直面与Sora 2的全球竞争,也为整个国内行业设立了产品化的参考标准。
总而言之,“AI小剧场”的上线让市场看到,它不再满足于被动提供对话功能,而是通过提供创造性的新能力来主动定义用户对AI的期待。
当然,这个功能能否持续火热,未来还取决于内容质量的把控、版权生态的构建以及后续的长效运营。
不过,阿里全栈布局的深厚技术底座,已经给其产品能力的持续演进上了一层保险。
3. 阿里全栈布局的杠杆效应
在各家企业激烈争夺“超级入口”定义权的当下,阿里在技术上的重投入或许并不讨巧。
但在“甲子光年”看来,AI时代的C端产品不同于传统互联网产品,其产品功能的本质上是源于底层的AI能力溢出。
在这个过程中,技术与产品的边界逐渐模糊。这是重技术投入厂商和重产品投入厂商在全新技术周期内的一场贴身肉搏,各种玩法规则或许还需要重新摸索。
而对于阿里而言,已经具备了技术层面的核心优势。
先以此次更新的万相2.6为例。当前全球AI视频模型的技术路线尚未收敛,回归、扩散、原生多模态等多种技术路线仍在探索中,国内外厂商在各大榜单上激烈互搏,但在画面一致性、复杂运动(如大范围运镜)以及实用性上仍存挑战。
在落地应用上,视频模型也仍然面临生成结果不稳定、用户试错成本高、难以直接商用的困局。虽然市场上有个别成功案例,但整体生态不算成熟;加之国外闭源模型(如谷歌Veo)使用费用高昂,均限制了创作者的大规模使用。
在此背景下,阿里万相技术能力一直保持在第一梯队,同时延续了开源路径,让普通用户使用模型能力的门槛大幅降低。
回顾其发展历程,从2.1版本的全面开源,特别是其开源的小参数版本(如1.3B),让家用显卡也能运行,实质性地推动了技术的普及;到2.2版本引入MoE架构提升效率、首创电影美学控制系统。
再到今年9月,阿里率先在国内发布音画同步的视频生成模型万相2.5,极大提升视频创作的效率,在权威大模型评测集LMArena上,万相图生视频位居国内第一。
这一次更新的万相2.6,更是直接“硬刚”Sora 2,其具备的某些功能,比如音频驱动生成视频,甚至是Sora 2目前仍尚未实现的。
在视频范畴之外的语言模型领域,阿里千问也已具备比肩GPT的实力。一个鲜为人知的事实是,英伟达开源的多个模型,其基座都来自于千问。
爱彼迎(Airbnb)CEO布莱恩·切斯基更是直言,公司大量依赖阿里千问,因为和OpenAI相比,千问“更好更便宜”。在大模型赛道,阿里已成为实力全面硬刚OpenAI的中国科技公司。
不得不说,大模型掀起的AI浪潮里,阿里的打法无疑是最符合“技术厂商”布局逻辑的——专注迭代模型,丰富开发生态, 赋能广大开发者。
在模型研发的时间线上,阿里在国内也有先发优势。阿里“通义”系列的发布时间甚至早于OpenAI的ChatGPT,并且一直在保持高频迭代。
目前,阿里已在全球开源300多款模型,在全球主要模型社区的下载量突破7亿,衍生模型突破18万个,阿里千问已超越美国Meta的Llama,成为全球第一的开源模型家族。
如今,通过千问APP无缝接入万相2.6的动作,我们已经能看到,当用户从企业或开发者们转换为喜好各异,个性鲜活的个人消费者,阿里正在迅速转换姿态,以技术驱动的方式,摸索一条获客和客户留存的新路径。
对于阿里这种体量的巨头而言,如此大幅度的转身并不容易,千问的终局或许仍未定型。但阿里的全栈技术布局已经决定,其所能撬动的产品能力远不止如此。只要阿里保持当前的战略集中度和执行力,千问APP成为真正的AI超级入口,或许只是时间问题。
(封面图来源:AI生成)
END.
精彩评论