Sora视频生成效果炸裂,颠覆谁、利好谁?

没有任何预料,龙年伊始,投向市场一记惊雷的仍是AI。

春节假期尾端,OpenAI公布了其新一枚“王炸”级产品——Sora文生视频大模型,60秒的超长生成能力、逼真的视觉效果,让业内大呼人类与AGI的距离将被指数级压缩。

这仿佛梦回2023,由ChatGPT热所引发的AIGC朝拜一般。市场在春节前对于AI板块原本的犹豫、疑虑荡然无存,人工智能仍然牢牢坐稳摩尔时间。

从生成文字、图片上升到视频,OpenAI全面碾压同行。那么,Sora为AI产业注入哪些新动能,对于行业发展来说又意味着什么?

Sora横空出世,颠覆了谁?

在Sora横空出世之前,市面已流行多款文生视频大模型,例如Pika、RunwayML等等,但它们最多只能生成20秒的视频,均达不到像Sora一般的超长时长、世界模型、多镜头切换的特点,也不能保持高清的视觉质量。

同时,Sora还颠覆了业内的既往认知——多模态对于算力的耗费程度远大于纯文本生成。比如以Gemini为例,机构推测其参数规模至少达到万亿级别。而根据纽约大学谢赛宁推算,Sora参数量约为30亿。

产品效果如此惊艳、却又不会消耗大量GPU,Sora究竟是怎么做到的?综合业内的分析来看,Sora强大涌现能力的产生源泉有三:足量的数据、优质的标注、灵活的编码。据介绍,Sora在训练时可以不依赖于人工标注的数据,而是依靠机器的自我标注。同时,OpenAI搭建了一种新型的模型DiT(transformer + diffusion),而非依赖transformer这一单一技术架构。

至此,OpenAI已经横扫文生图(DALL·E3)、文本生成(ChatGPT)以及文生视频(Sora)三大核心科技。不仅如此,跟据《华尔街日报》最新报道,OpenAI CEO山姆·奥特曼正在推进一项雄心勃勃的计划,拟筹集至多7万亿美元,用于提高全球芯片制造能力。若筹资成真,将意味着OpenAI几乎全面占领AGI赛道中的所有关键卡位。

OpenAI的“野心”似已明朗,那就是做一个超级闭源的AGI巨无霸。面对一个冉冉升起的“科技巨头”,不少行业、个体将再次受到冲击。专家分析,Sora的诞生将首先对影视、广告、教育、游戏等多个行业产生直接影响。例如,视频创作者可以专注于更具创意性和战略性的工作,而将繁琐的重复性工作交给人工智能。

而在二级市场上,传统视频工具类公司均受到不同程度挫伤。例如,美股软件巨头Adobe在Sora发布次日暴跌超7%。据悉,Adobe的主要收入构成是数字媒体服务,包括对于视频、图片的二次加工、编辑,其中公众耳熟能详的Photoshop便是由Adobe出品。

为行业带来哪些新的思考?

目前,Sora尚处于定向邀请阶段,还未大面积向公众普及。专家预计,Sora全面推出的时间可能是在今年8月份。在这期间,一些和Sora高度同质化的公司仍将受到不同程度的冲击。

但是,新的机会也在孕育,新的理念正在形成。对于AI大模型领域来说,规模参数越大效果越好的既有观念被重新审视。如前文所述,Sora的参数仅为约30亿,但是其超强的生成能力却是有目共睹。

针对算力参数与模型性能的关系,百融云创(百融云-W,6608.HK)CEO张韶峰此前曾呼吁,对于行业大模型来说,需要警惕陷入“博算力”的误区。他认为,模型“大非万物”,重点是要寻求算力参数、用户意图与实时反馈之间的平衡。

“提升模型的响应速度、适度压缩算力成本,反而可以求得推理能力最优解,从而形成数据迭代、模型更新及用户响应的闭环飞轮。”张韶峰表示。

在张韶峰看来,在算力资源有限的情况下,通过模型优化和动态调整、提高算法效率、提升硬件适配度以及建立持续学习和自我优化的系统,通过用户的适时反馈来调整模型,便可以提高解决方案的准确性,最大化缔造AI技术的生产价值。

“大家都非常渴望大模型,反而会造成一种浪费。重要的是要在具体场景下彻底打通业务,形成一定的商业闭环。”张韶峰说道。

据介绍,百融云创于2023年打造了产业驱动大模型BR-LLMs,并自主构建了大模型预训练、微调、推理工程优化、应用开发套件等一整套技术栈。其中,以BR-LLM为基座的Cybertron平台内置丰富插件工具,对外输出Agent、Copilot等服务。

而除了和Sora颇为相似的“算力平衡”理念外,百融云创也并没有追逐LLM的单一力量,如前文所述,Sora的智能涌现力来自于LLM与diffusion的合力,而百融云创采用的是将决策式AI与生成式AI有机融合来为垂直行业提供AI产品服务和解决方案。

例如,在金融行业的智能营销领域,由于传统的营销方法耗时耗力,转化率受到制约。因此通过AI技术来提升营销效率成为普遍选择,但若仅仅依靠生成式AI技术效果却不尽如人意。

诚然生成式AI在个性化的信息推荐、营销活动响应方面存在诸多优势,但是由于缺乏前期的客户分析和行为预测,会使得LLM模型对于客户偏好和需求认识不足,不能有针对性的生成营销信息。金融机构甚至发现,投入大量成本开展营销的效果和不做一致。而融合了决策式AI的CRM系统可以将LLM模型功能的“天花板”被直接打开,大幅提升全客群模型的营销转化率。

Sora的问世带来了全新的憧憬和想象,标志着一个新的时代到来。分析人士认为,Sora将驱动AI大模型板块商业化落地加速,AI与场景的结合更为紧密,对于像百融云创这样深耕在垂直领域的AI公司构成行业性利好。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论