©️深响原创 · 作者|何理 大模型这把火,烧了一年多。目前,各界对AI热情依旧,但也多了些理性。最明显的表现是,大家越来越关心大模型的商业化问题,甚至还因此引发过理想主义和务实主义的争论。 有没有一种可能,是公司既追求大模型技术理想,同时兼备又快又稳的商业化步伐? 商汤就属于这类公司。在近期的发布会上,商汤推出了新升级的大模型体系——日日新5.0。在主流客观评测上,日日新5.0达到或超越了GPT-4 Turbo版本;同时,商汤发布了行业首个“云、端、边”全栈大模型产品矩阵,并请来金山办公、海通证券、小爱同学等头部客户站台,介绍合作成果。 结合公司此前的财报数据(2023年,商汤生成式AI业务收入达12亿元,同比增长200%)来看,商汤大模型的商业化已经进入快车道。理解商汤的商业化进展,其实就是在理解大模型热潮将涌向何方。 系统理解商汤的商业化进展 一年多时间,在诸多厂商的探索中,大模型商业化的逻辑越来越清晰。公司要走通大模型商业化路径,需要具备三方面的能力:大模型本身能力的出众、落地不同场景的能力和灵活贴合不同客户需求的能力。 大模型本身的能力 在行业“百模大战”的背景下,大模型已经不是“有没有”的问题,而是是否出色、各方面能力是否扎实的问题。只有表现可靠的大模型,才能得到客户和用户的青睐。 根据发布会的信息,日日新5.0主要聚集增强了知识、数学、推理及代码能力——文科方面,日日新5.0的创意写作能力、推理能力以及总结能力均大幅提升;理科方面的数理能力、代码能力及推理能力也达到业内领先水平;此外,商汤多模态大模型的图文感知能力达到全球领先水平,多模态能力也落地到产品层面,相关产品支持长图解析、文生图以及跨文档知识抽取及总结问答展示。 商汤多模态大模型在多模态大模型权威综合基准测试MMBench和多个知名多模态榜单取得领先成绩 图源:商汤 发布会