“业内首家推出“云、端、边”全栈大模型产品矩阵。” 作者:苏打 编辑:tuya 公司情报专家《财经涂鸦》获悉,4月23日,商汤科技SenseTime在其技术交流日活动中,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并全新升级“日日新SenseNova 5.0”大模型体系,其综合能力全面对标GPT-4 Turbo,技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。 在人工智能发展的最基本法则——尺度定律(Scaling Law)的准则下,商汤持续寻求最有数据配比并建立数据质量评价体系,推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。 商汤科技董事长兼CEO徐立表示:“商汤在尺度定律的指导下,将持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。” 「日日新5.0」性能超越GPT-4 Turbo 自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova 5.0”(以下简称:日日新5.0)采用混合专家架构,推理时上下文窗口可以有效到 200K 左右。 本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。 在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注入后,可以获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助。 在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力达到业内领先水平,为金融、数据分析等场景落地提供坚实基础。 本次“日日新5.0”另一大核心指标就是多模态能力,商汤多模态