商汤科技
商汤科技官方号
老虎认证: 商汤科技是一家赋能百业、行业领先的人工智能软件公司
IP属地:北京
0关注
1367粉丝
商汤科技是一家赋能百业、行业领先的人工智能软件公司

全球零售巨头走访中国AI:迪卡侬高管团队到访商汤

近日,全球领先的体育用品零售企业迪卡侬高管团队到访商汤科技,深入了解中国人工智能领域的最新进展,并重点体验以「日日新」多模态大模型为代表的技术成果,同时围绕AI在零售与供应链场景中的应用展开交流。商汤集团董事长兼CEO徐立、副总裁林洁敏参与接待。 迪卡侬高管团队由集团及大中华区管理层组成,涵盖其全球与本地业务的核心团队。作为全球零售与消费领域的重要参与者,迪卡侬在体育用品领域具备成熟的产业能力与全球化布局。 在商汤AI体验中心,代表团重点体验了基于「日日新」多模态大模型打造的一系列AI应用,包括AI生产力工具「小浣熊」、内容生成平台Seko以及大晓机器人在零售仓储场景中的应用,深入了解多模态能力在数据分析、内容创作及供应链等场景中的实际价值。 在随后举行的会谈中,迪卡侬相关负责人表示,本次到访加深了对中国人工智能最新进展的理解,也进一步看到了AI在零售与供应链场景中的广阔应用前景。期待未来进一步加强交流与合作,共同应对全球科技变革带来的机遇与挑战,实现互利共赢。 随着人工智能技术加速演进,中国正逐步成为技术创新与规模化应用的重要高地。在此背景下,商汤持续推进全球化布局,已在亚洲、中东等多个市场开展业务,在智慧城市、医疗、教育、零售等领域形成可复制的应用模式,并探索AI基础设施与应用生态协同出海路径,推动“中国创新”在更广泛的产业场景中持续释放价值。
全球零售巨头走访中国AI:迪卡侬高管团队到访商汤

龙虾节来啦!SOTA模型免费用,商汤还准备了大奖等你!

3月27日-29日,全球开发者先锋大会(GDPS 2026)在上海徐汇西岸国际会展中心启幕!  这次,商汤科技也带着重磅产品来到现场——商汤输入法AudioClaw和商汤SenseAudio AI语音开放平台。 官网体验链接(点击阅读原文即可跳转): https://senseaudio.cn 商汤输入法AudioClaw 是商汤科技基于日日新多模态大模型推出的智能应用,集语音输入法、全自动会议助理、专属知识库、龙虾助手于一体。 为什么要做这个? 现在很多人用AI,其实都有同一个问题: 要在不同工具之间来回切; 复制、粘贴、再修改; 一个简单需求,要走好几步! AI很强,但用起来不顺。 商汤这次想解决的,就是这件事:能不能让AI变得更“顺手”? 商汤输入法AudioClaw 只需要简单说出需求,通过语音你就能完成很多事情,比如: 高效输入,精准识别:毫秒级精准识别,自动净化口语冗余;支持多语种、方言智能互译 语音交互,轻松改写:语音指令即可完成翻译、扩写、摘要、风格改写等智能处理 AI会议智能总结,提升效率:自动记录发言人与时间戳,智能生成多模态会议总结;支持跨会议问答,内容多端同步 专属龙虾智能助手:轻松上手,支持微信等多应用接入,提供更多实用Skills 即装即用,支持微信接入;自动沉淀知识库,持续进化;语音交互更智能,技能库不断拓展 SenseAudio AI语音开放平台 不只是生成文字,还能直接“说出来”: 拥有 70 + 专业精品音色,情感逼真、场景覆盖全面 支持音色克隆与文生音色,可 API 调用,搭配 SenseAudio-TTS-1.5模型表现力更佳 语音识别(ASR)模型低延时、高精准与稳定 API 服务 同时还拥有音乐、图片、视频生成能力,编曲专业、画风多样、视听效果出色,创作高效便捷 现场可以做什么? 这次不是看演示,而是
龙虾节来啦!SOTA模型免费用,商汤还准备了大奖等你!

创新高!商汤科技2025年收入超50亿元,半年EBITDA转正

3月24日,商汤科技(0020.HK)发布全年业绩公告。2025 年度,集团总收入增长33%,超50亿元,创历史新高,增幅为近三年最快;全年净亏损大幅收窄58.6%,经调整净亏损实现连续四个半年同比加速减亏,下半年息税折旧摊销前利润(EBITDA)为3.8亿元,上市后首次转正,超市场预期,公司成功从技术投入期迈向可持续的爆发增长期。报告期内,商汤造血能力实现“质”的飞跃,集团资金效率持续提升,现金流稳健,贸易应收回款达48.7亿元,创历史新高;下半年集团经营性现金流自上市以来首次实现正向净流入。商汤将于2026年第二季度推出基于第二代NEO架构的全新模型,该模型预计将实现效能与性价比的倍数级跃升,广泛赋能智能体AI应用。 商汤科技董事长兼首席执行官徐立表示:“我们深信语言与视觉的深度融合是突破智能上限的高效路径。我们基于NEO原生架构,高效实现理解与生成统一,探寻多模态的新‘尺度定律’。这一系列技术突破和智能体AI的深度结合将打开新的应用可能性,赋能全新垂直场景。商汤在保持底层技术创新的同时,亦实现收入与EBITDA的双增长,在行业中展现出卓越的增长韧性与经营效率,稳步走向高质量发展。” 深耕原生多模态大模型,“增效+降本”驱动商业跑出加速度 2025年,商汤持续投入前沿技术研发,在大模型架构创新、训练范式、推理效率、空间理解等方面取得突破性进展,持续保持国内领先水平。 商汤日日新多模态大模型性能攀升,持续霸榜,先后于2025年1月、5月、12月在SuperCLUE和OpenCompass等综合评测中位列榜首。与此同时,2025年商汤先后发布并开源空间智能模型SenseNova‑SI系列,在多项国际权威空间智能指标的评测中位列同类模型全球第一;开源的Kairos-SenseNova成为首个实现“多模态理解-生成-预测”一体化的开源具身原生世界模型。2025年12月,商汤发
创新高!商汤科技2025年收入超50亿元,半年EBITDA转正

“拾”光而上,2026商汤奖学金申报开启!

​“拾”光而上,不负热爱。2026商汤奖学金申报正式开启! 随着大模型能力持续跃升,OpenClaw等新一代智能体应用的出现,也让“AI真正开始做事”变得更加可感。一个从模型突破走向场景落地、从能力展示走向真实协同的时代,正在加速到来。而今年,商汤奖学金也迎来了一个格外重要的节点——第十届申报正式启动。站在这一轮技术变革与产业升级交汇的新起点上,商汤奖学金将继续发掘并支持更多有潜力的青年人才,帮助他们走近前沿科技、走进真实实践,在更广阔的舞台上奔赴未来。 九年同行,见证每一份热爱发光 自设立以来,商汤奖学金始终聚焦人工智能领域优秀本科生的发掘与培养,鼓励青年人才在学术研究、技术创新与产业实践中不断成长。它不仅是一项奖励计划,更是一座连接高校人才培养与产业前沿探索的桥梁。 截至目前,商汤奖学金已累计选拔并资助了250名AI青年,陪伴他们在热爱中启程、在探索中成长,在实践中完成一次次蜕变。 在这里,我们见证了许多属于他们的闪光时刻: 有人深耕基础研究,在日复一日的积累中夯实学术能力;有人在竞赛与项目实践中不断突破,展现出过硬的工程素养;也有人将对AI的热爱转化为创造现实的力量,在更早的时候便开始思考如何用技术回应时代、改变世界。 多维支持,助力青年人才加速成长 这是一个变化极快的时代,也是一个属于年轻人的时代。对于关注人工智能的青年学子来说,当下,正是与未来并肩奔跑的黄金阶段:你所学习的内容,正在成为时代的核心议题;你所投入的方向,正深度参与未来科技蓝图的塑造;而你今天迈出的每一步,都有可能成为改变明天的重要力量。商汤奖学金想做的,正是在这样的时代节点上,为这些青年人才提供更多被看见、被支持、被激发的机会。 面向国内极具潜力的AI人才,商汤科技将提供高达20,000元人民币的奖金,开放万卡级计算集群和百亿级数据资源,更有顶尖人工智能大模型研究团队全程指导。我们期待与你并肩同行,
“拾”光而上,2026商汤奖学金申报开启!

赋能广西具身智能产业升级!商汤大装置×大晓机器人×广西产业技术研究院达成三方战略合作

近日,商汤大装置联合大晓机器人与广西产业技术研究院达成战略合作,就AI基础设施建设、具身数据采集、世界模型研发、机器人应用场景拓展等领域达成深度合作。开启三方携手赋能具身智能产业发展的新篇章。 此次战略合作旨在充分发挥三方各自优势,协同构建"算力—数据—模型—场景"四位一体的产业闭环,聚焦助力广西具身智能产业实现规模化升级、构建完善产业生态,同步辐射东盟区域相关产业发展。 优势互补 协同共建具身智能产业闭环 三方将围绕具身智能全产业链关键环节开展深度协同: 商汤大装置将依托其SenseCore平台能力,提供算力调度、资源管理、数据服务等核心基础设施支撑,破解具身智能研发中的算力瓶颈与数据管理难题,赋能训练场智能化建设。 广西产业技术研究院将发挥区域产业资源统筹与技术集成优势,依托"广西—东盟具身智能中试训练场"为重要载体与关键支点,推动具身智能技术加速迈向产业化、规模化、市场化应用,助力广西打造面向东盟的具身智能产业创新高地与应用示范标杆。 大晓机器人将凭借其在具身智能数据采集、模型研发与场景落地方面的深厚积累,持续提供技术支撑,深度助力具身数采场建设,加速智能技术研发落地与场景创新应用。 以"训练场"为牵引, 打造面向东盟的具身智能产业生态 广西—东盟具身智能中试训练场,是在广西自治区党委、政府高度重视与自治区科技厅具体指导下,由广西产业技术研究院联合国内具身智能头部企业共同建设的省级重大中试平台。立足广西、服务东盟,构建覆盖全区的训练场网络体系,聚焦真实产业需求,打造集数据采集、高质量数据集建设、模型训练、集成研发、中试验证、创新孵化于一体的产业协同创新体系。 以此为牵引,三方将共同应用本地训练基础设施,形成场景应用示范,催生产业配套与科学研究需求。基于算力、模型、场景、高质量数据集等核心要素,协同打造:  专属算力调度平台,实现算力资源动态分配、弹性扩容与高
赋能广西具身智能产业升级!商汤大装置×大晓机器人×广西产业技术研究院达成三方战略合作

商汤元萝卜× OpenClaw|不只下棋,更是龙虾AI智能体🦞

当 OpenClaw 的热度持续攀升,「养龙虾」风潮席卷全网,AI 与物理世界的连接正在迎来全新拐点。 今天,我们将商汤元萝卜AI下棋机器人的独特能力,以 OpenClaw Skill 的形式开放出来,全面支持 OpenClaw 开源生态。 GitHub: https://github.com/SenseRobotClaw/ClawSkill ClawHub: https://clawhub.ai/SenseRobotClawBot/senserobot 商汤元萝卜作为首个支持 OpenClaw 生态的量产家用下棋机器人,为 OpenClaw 赋予视觉感知与实体交互能力,元萝卜也将升级为新一代桌面智能体。 我们以开放的姿态,让元萝卜机器人走出传统下棋场景,向更广阔的智能体应用延伸。 这是一次从「虚拟交互」到「物理执行」的关键跨越,机器人的真正价值,就在于连接现实、影响物理世界。 元萝卜作为 OpenClaw 生态中可以直接落地现实的物理终端,正在打破虚拟与现实之间的边界。它为 OpenClaw 拓展视觉感知与安全机械臂能力,实现桌面环境感知、智能决策与实体交互,进一步化身为桌面场景的“智能执行者”。 每个人都能直观感受到:AI,正在直接作用于现实世界。 我们坚信,人与机器的深度交互,能碰撞出无限可能。 此次开放,元萝卜将逐步释放多维能力,跳出传统下棋场景,通过简单指令即可实现机器人多种桌面操作能力,例如: 机械臂控制 自由抓取与摆放棋子 自动清理棋盘 表情管理 语音播报 当然,你也不必局限于这些玩法,你还可以尝试: 用它完成自动化桌面任务,解放双手 设计趣味互动表演,让机器人成为你的创意伙伴 搭建 AI 实验场景,探索具身智能的边界 开发专属小游戏,把奇思妙想变成真实的物理动作 依托 OpenClaw 与自然语言交互能力,用户可以口述任务,机器人自主执行,在真实环境下,体验
商汤元萝卜× OpenClaw|不只下棋,更是龙虾AI智能体🦞

商汤Seko助力!2026年度AI短片计划全球启动

作为人工智能领域的领军企业,商汤科技始终深耕AIGC技术研发与场景落地。 近日,商汤Seko在2026上海影视创制大会上隆重推出“创所未见·2026年度AI短片计划”,3月10日起正式启幕,面向全球征集优秀AI短片作品! “创所未见·2026年度AI短片计划”由上海大宁资产经营(集团)联合主办,视听静界·π空间提供场地支持,商汤Seko为独家视频生成平台。该活动致力于打造全球性、专业性、引领性的文化科技赛事IP,并且计划将搭建全球AIGC创作者交流高地,挖掘优质AIGC内容与人才,推动人工智能与影视创作、文化传播深度融合,让中国文化魅力与上海城市精神通过AIGC技术对话世界! 商汤Seko将为全球创作者提供更广阔的展示舞台与技术支撑,助力创作者打破创作边界、释放创意潜能。在此我们诚邀全球范围内擅长AIGC创作的你/你们踊跃投稿参赛,用创意与技术共探AIGC在视听创作领域的无限可能! 01 参赛对象 面向全球AIGC创作者及团队,不分国籍、年龄、职业,均欢迎报名: 专业领域:影视公司、AI 科技企业、专业创作团队; 校园渠道:全球高校学生(含本科、硕士、博士); 大众参与:AIGC爱好者、独立创作者; 海外同行:海外华人AIGC创作者、外籍AIGC创作者(接受多语言参赛报名) 02 参赛作品要求 1.时长:30秒-8分钟(其中微短片类30秒-3分钟,常规短片类3-8分钟); 2.分辨率:不低于1080P(推荐4K),格式为(MP4/MOV) 3.原创性:参赛作品须为原创,未参与过其他同类赛事,无版权纠纷;若使用第三方素材,需注明来源并获得授权; 4.标注要求:作品片头需标注“本作品由AIGC技术创作”,片尾注明视频生成平台Seko及应用环节。水印及视频尾板素材链接: https://my.feishu.cn/drive/folder/AjaAfY83WlqwfudtGYhce
商汤Seko助力!2026年度AI短片计划全球启动

72倍推理提速、7分钟长视频生成!大晓机器人开源实时生成世界模型 Kairos 3.0-4B

近日,大晓机器人重磅开源开悟世界模型3.0(Kairos 3.0)-4B 系列具身原生世界模型。作为业内首个实现 “多模态理解 — 生成 — 预测” 一体化的开源具身原生世界模型,该模型以 “物理因果一致、跨本体泛化、超长时交互、云侧实时生成、轻量化高效能、端侧本体控制” 为核心优势,性能全面领跑国内外主流具身世界模型。 Kairos 3.0-4B 是全球首个可端侧驱动具身智能本体控制的世界模型,也是行业内首个在 THOR 端侧平台达成 1:1.5 (视频生成时间:视频时长)实时生成的具身世界模型。该模型部署于Jetson Thor T5000 端侧平台,算力可达517 TFlops,不仅能在 3D 仿真环境中精准生成机械臂运动形态、完成运动轨迹的预测与规划,更可依托 THOR 端侧平台实现机器人本体的真实驱动与作业执行,让机器人真正从“会表演”走向“能干活”。 在全球权威具身智能 Benchmark 评测中,Kairos 3.0-4B 各项指标全面领先。在 A800 GPU Benchmark 中,基于模型能力和推理工具,Kairos 3.0-4B 的推理速度较 Cosmos 2.5 提升 72 倍,刷新全球具身世界模型性能纪录,充分验证了其硬核技术实力。 Kairos 3.0-4B 兼具通用世界模型能力与具身场景深度赋能优势。在通用场景下,该模型可生成高度还原的真实物理世界,以黄果树瀑布为例,其能精准呈现自然光影效果,支持流畅运镜且无画面跳帧,云、水、叶片等元素均可实现动态演化;同时,模型深度适配具身智能需求,凭借双重能力打通数字仿真与物理执行,以中国自研核心技术破解行业核心痛点,为具身智能规模化落地提供核心引擎,成为具备全球竞争力的具身世界模型标杆。 ▎以原生世界模型架构,筑牢具身智能对物理世界的底层认知 当前,具身智能行业深陷数据稀缺且割裂的困境,传统生成
72倍推理提速、7分钟长视频生成!大晓机器人开源实时生成世界模型 Kairos 3.0-4B

AWE2026 | 商汤小浣熊“OpenClaw双路径赋能方案”亮相,驱动AI终端破解落地难题

​3月12日,与德国IFA、美国CES齐名的全球顶级行业盛会——中国家电及消费电子博览会(AWE 2026)在上海新国际博览中心隆重启幕。 当这个舞台聚集了全球消费电子领域的顶尖硬件时,商汤科技的展区却提供了一种独特的体验:在这里,AI本身就是最核心的“展品”。 AI并非附着于单一产品,而是作为“大脑”和“灵魂”,注入从教育、办公到影像、机器人等形态各异的智能终端之中,生动诠释了“AI科技,慧享未来”的展会主题。 AI BOX现场吸睛!商汤小浣熊“OpenClaw双路径赋能方案”亮相 在本届AWE现场,商汤科技推出基于OpenClaw生态的智能体一体化交付方案,当Agent拥有了实体,这吸引了大量现场关注。 本次亮相的核心,是围绕OpenClaw智能体生态推出的 “能力开放”与“一体化交付”双路径方案。 路径一:能力开放,接入生态。商汤将“办公小浣熊”在数据分析、文档处理等场景中积累的成熟能力,封装为一组可便捷调用的 Raccoon Skills,并全面接入OpenClaw生态。企业和开发者可通过OpenClaw直接调用这些技能,快速增强智能体的专业办公处理能力。 路径二:一体交付,本地落地。商汤与趋境科技联合推出的本地AI Box一体化方案,以OpenClaw作为智能体任务规划与执行层,打通从能力接入、任务执行到企业级交付的完整闭环。该方案尤其适用于对数据安全、私有化部署及合规性要求极高的金融、政务等场景,为企业提供可部署、可运维的可靠落地形态。 在这一协同体系中:小浣熊解决“能做什么”,OpenClaw解决“如何执行”,而AI Box则解决了“如何真正落地”。三者结合,共同推动智能体技术从“会回答”向“会完成、可交付”的务实演进。 目前,“办公小浣熊”可通过对话完成从数据分析到报告交付的全流程,已服务超300万用户;“代码小浣熊”则作为全生命周期研发伙伴,已落地于超10
AWE2026 | 商汤小浣熊“OpenClaw双路径赋能方案”亮相,驱动AI终端破解落地难题

OpenClaw,商汤小浣熊来了!软硬一体安全部署,养出精通Excel的龙虾

最近全网掀起“养龙虾”(OpenClaw)热潮,大家都在想怎么让它更厉害。 今天,我们带来了一个更实用的答案:一只软硬一体又安全的“实干龙虾”。 简单说,我们做了两件事情: 第一,我们把商汤办公小浣熊的办公能力,封装成为可调用的Raccoon Skills,上架到了OpenClaw生态中。 以后,你的OpenClaw就能直接调用小浣熊处理Excel、分析数据、生成报告这些看家本领了,就像给龙虾装上了专门处理办公问题的“工作钳”。 Raccoon Skills: https://clawhub.ai/Raccoon-Office/raccoon-dataanalysis-skill 左右滑动查看小浣熊为龙虾注入数据分析新技能 第二,我们将联合“趋境科技”,推出一个“开箱即用、安全可控”的AI Box一体化方案。 很多朋友想要拥抱OpenClaw,但常常被两个问题劝退: 1、太复杂:自己部署配置,技术门槛高,且安全层面不可控。 2、用不起:调用云端大模型API,Token消耗像流水,账单涨得比效率还快,重度用户每月成本可能高达数千元。 所以,我们联合合作伙伴趋境科技推出“本地部署 + 云端扩展”一体化方案,把OpenClaw、小浣熊的能力,和一台优化好的AI BOX打包,做成了一个 “AI办公专用机”。 整套方案以 OpenClaw 作为 Agent 执行层,承接多入口接入、任务执行和自动化调度;以办公小浣熊提供办公能力与云端扩展服务;以趋境 AI Box 承接本地推理、设备部署与远程运维支持。 这套方案的核心优势主要有两点: 一次性买断,告别Token焦虑:盒子买下来,核心的办公与推理能力就在本地运行。没有持续的API调用费用,成本清晰可控,特别适合一人公司或十人以下的小团队。 安全可控,上手即用:数据留在本地,隐私安全;插电联网就能用,不用自己折腾复杂的安装和运维
OpenClaw,商汤小浣熊来了!软硬一体安全部署,养出精通Excel的龙虾

人民日报新媒体 × 商汤 Seko,未来已来AI创意大比拼开启征集!

开始征集!人民日报新媒体 × 商汤 Seko 📢 人民日报新媒体 × 商汤 Seko #未来已来AI创意大比拼# 开启征集! 🕒即日起 - 3月15日 🎥用 Seko 做一支关于“未来中国”的视频,即有机会: 💰 赢万元大奖 🚀 优质作品【无上限投流】 🎞️ 人民日报新媒体展映 🔥活动详情见尾图官网 期待各位的优秀作品~ #商汤科技#商汤Seko#人民日报#AI
人民日报新媒体 × 商汤 Seko,未来已来AI创意大比拼开启征集!

全球首创,刷新19个SOTA!大晓机器人开源空间智能通用模型ACE-Brain-0

近日,大晓机器人联合上海交通大学、南洋理工大学、香港中文大学、香港大学等研究机构共同推出以空间智能为底层框架、跨不同具身本体的通用基础模型“ACE-Brain-0”,正式面向全行业开源。 ACE-Brain-0首次打破汽车、机器人、无人机等不同本体壁垒,贯穿空间认知、自动驾驶、低空感知、机器人交互,重新定义了物理世界智能的技术底层逻辑。其性能表现在涵盖空间认知、自动驾驶、低空感知、具身交互的24 个核心 benchmark 中,19 个取得当前模型中的 SOTA(排名第一) 成绩,全面大幅领先市场主流具身模型。ACE-Brain-0主要对标GPT-4o、Gemini 2.5-Pro、Qwen2.5-VL-7B-Inst、RoboBrain2.0-7B、MiMo-Embodied-7B等16个知名模型,将19个Benchmark具身模型最强基线准确率相对提升5%-97.8%。在衡量三维认知的MindCube,以82.1%的成绩,较最好的开源模型(InternVL3-8B)提升了97.8%。 目前,上述模型已应用于大晓机器人具身超级大脑模组A1,使搭载具身超级大脑A1的机器狗具备行业首创的端到端自主导航能力,并且基于VLA架构实现云端智能交互,让机器狗具备理解抽象指令、感知复杂环境、完成复杂任务的端到端闭环能力。 在城市人行道等复杂公共场景中,搭载ACE-Brain 的机器狗展现出卓越的导航与VLA能力。以图片场景为例,面对“估算行人和摩托车间距、判断是否有足够空间导航通过”的需求,ACE-Brain赋能机器狗精准完成三大核心动作: 依托空间认知能力,可精准量化行人和摩托车间距约0.5米,为导航决策提供可靠依据;通过视觉语言理解,清晰解析自然语言指令,实现“看—懂—判”的连贯交互,无需额外定制化指令;在导航决策中,既能判断空间足够通过,又主动提出“谨慎前行”的安全建议,兼顾效率
全球首创,刷新19个SOTA!大晓机器人开源空间智能通用模型ACE-Brain-0

商汤技术博客:无需编解码器,NEO-unify如何打造原生视觉语言理解与生成

今天,商汤科技发布最新技术博客—— NEO-unify: 原生架构打造端到端多模态理解与生成统一模型(NEO-unify: Building Native Multimodal Unified Models End to End)。文章深入解读NEO-unify:一项旨在从底层统一多模态理解与生成的端到端原生架构。  当前,多模态模型普遍采用“视觉编码器(VE)用于理解,变分自编码器(VAE)用于生成”的组合式设计。这套范式虽行之有效,却也内在割裂了感知与创造,常面临模块协同与效率权衡的挑战。  我们能否更进一步,让AI像人一样,直接从最原始的像素和文字中,统一地进行学习、理解与生成?这正是NEO-unify尝试回答的根本问题。它摒弃了传统的VE与VAE,首次构建了一个真正的端到端原生统一模型,在同一个架构内直接处理像素与文本,并在此基础上协同完成理解与生成任务。初步研究成果令人振奋,该设计在保持强大语义理解与细节恢复能力的同时,显著提升了训练与计算效率。 博客原文 Hugging Face地址(英文): https://huggingface.co/blog/sensenova/neo-unify 官方地址: 英文:https://www.sensetime.com/en/news-detail/51170542?categoryId=1072 中文:https://www.sensetime.com/cn/news-detail/51170543?categoryId=72 NEO-unify:原生架构打造端到端多模态理解与生成统一模型 当前多模态智能架构困境 长期以来,多模态研究已形成一种默认范式:视觉编码器(Vision Encoder, VE) 负责感知与理解,而变分自编码器(Variational Autoencoder, VAE) 则用于内
商汤技术博客:无需编解码器,NEO-unify如何打造原生视觉语言理解与生成

开学迎新!商汤AI“讲解员”走进上海中学国际部

昨天,上海中学国际部迎来新学期开学首日。 校园里出现了一位特殊的“迎新使者”——由商汤科技“商量AI讲解大脑”驱动的智能讲解机器人亮相校园,以生动鲜活的互动形式迎接返校学子,为开学日注入了浓厚的科技活力,成为校园里一道亮眼的风景线。 活动现场,不少同学主动驻足,与智能讲解机器人互动交流。机器人不仅热情送上新学期的美好祝福,还能主动回应同学们的各类疑问,沉浸式的体验让开学日的校园充满了欢乐气息与科技探索乐趣。 此次开学日的精彩亮相,商汤“商量AI讲解大脑”赋能的智能讲解机器人进入校园,意在打造智慧教育与科技创新实践的全新场景,让孩子感受“有温度、更智慧”的AI应用场景。 目前,商汤讲解机器人已率先应用于全国各类公共服务中心、校园、银行、博物馆等场所,化身“智能讲解员”,为师生、群众提供讲解服务。依托商汤领先的AI技术优势,机器人具备结构化逻辑输出与100%标准化信息传递能力,可精准、稳定地讲解如校史沿革、校园文化等内容,避免了传统人工讲解中信息遗漏、口径不一的问题,确保对应场景传播的准确性与专业性。 机器人搭载的全面问答功能与可迭代生长的知识体系,在开学日也能够精准回应师生关于校园文化、办学理念、校园设施等方面的个性化疑问,让信息传递更高效;智能断点续讲、精准语义识别等核心功能,打破了传统讲解的机械模式,允许师生在参观过程中随时打断、自由提问,真正实现了从“被动聆听”到“主动探索”的互动升级,让校园文化传播更具趣味性和参与感。 上海中学国际部是经上海市人民政府批准设立的外籍人员子女学校,始终致力于构建世界一流的、研究型、创新型中国基础教育领先名校。此次商汤科技的AI讲解大脑的应用,是探索“人工智能+教育”深度融合的重要实践。 商汤AI讲解大脑赋能的智能讲解机器人不仅为校园文化传播提供了智能化新载体,更让学生在日常校园生活中近距离接触前沿科技,在潜移默化中激发科学探索兴趣,培养
开学迎新!商汤AI“讲解员”走进上海中学国际部

一键生成,页页可改”!商汤办公小浣熊推出「可编辑」的AI PPT

你的AI PPT工具,是否还停留在“一键生成,手动重做”的尴尬阶段? 节后复工,需求扎堆而来。本想借助AI提高效率,却往往深陷新的泥潭:生成的模板难以适配具体需求,想改一页却牵动全局,最终风格凌乱,不得不手动重做……AI生成的,为何反而成了最难修改的“枷锁”? 问题在于,许多AI只负责“生成”,却未将真正的“编辑权”交还给你。 现在,一切不同了。 近期,商汤办公小浣熊重磅推出「可编辑」的AI PPT,真正实现“一键生成,页页可改”。从生成到交付,每一页都由用户掌控,才是真正好用的AI PPT。 该功能现已全面上线,登录商汤办公小浣熊官网,点击「PPT 生成」-「创意模式」即可尝鲜体验!(点击阅读原文跳转): https://office.xiaohuanxiong.com/home 面对最真实的PPT创作场景——充斥着来自老板与甲方五彩斑斓的需求变化,办公小浣熊可编辑的AI PPT能力都能“懂”,恰恰能做到这三点↓↓↓ ①懂你赶时间的急 多套模版即选即用 高效出稿“不翻车” “今天来需求,报告方案明天要!”相信是很多人都有过的经历。 面对时间紧、任务重的紧急需求,办公小浣熊「PPT生成-创意模式」内置了一批高品质、高审美的成品风格,工作汇报、市场调研、商业提案、活动策划……都可直接预览、一键套用。 用户只需选风格、丢思路,剩下的就交给小浣熊即可,不用再对着空白页面发愁,也不用费劲想提示词。整个过程视觉统一、出稿迅速、成品可用。 ②懂你抠细节的严 单页级对话修改 精准调优“可编辑” 只想改其中一页,但AI却把整个PPT推翻重来?办公小浣熊彻底杜绝“牵一发而动全身”的烦恼——每一页都支持独立编辑,想动哪页就动哪页,其他页面纹丝不动。 更重要的是,小浣熊提供全方位的单页编辑能力,满足用户不同场景的调整需求 单页重新生成:整页不满意?AI对话重生成,无需重做全稿。 单页文案润色:表
一键生成,页页可改”!商汤办公小浣熊推出「可编辑」的AI PPT

20亿+设备验证,商汤科技美颜Agent上线!

修图五分钟,内耗两小时?你是不是也受够了春节假期时精心拍摄的全家福,反复调试美颜参数却也难以让每位家人都满意;视频拜年时,为调试美颜参数而手忙脚乱,出来的效果却一言难尽…… 够了!美颜技术该进化了! 商汤科技正式推出的美颜Agent,通过将更智能的AI分析和决策能力与历经海量验证的美颜SDK效果执行深度协同,打造出一个能更精准听懂人话、更深刻懂得审美的AI 美颜助手。 用户无需复杂学习,仅需一句自然描述,即可在多种场景下获得既显著又保留个人特色的原生美感。它不只是执行美颜算法,而是通过理解人与场景,实现自主决策并执行最适宜的美颜策略,从而将用户体验从繁琐的手动参数调整,全面提升至“AI智能决策、一键生成效果”的新高度。 实现“智能”与“自然”的真正统一 当前,市场上的一些解决方案在纯AI或纯传统SDK之间徘徊。商汤美颜Agent的核心突破,在于成功构建了更智能的AI决策+稳定可靠的SDK执行协同架构,兼顾AI 的判断力和传统美颜的稳定性。它可支持用户进行图像检测、一键美颜、图片编辑实现互动式修图,智能美颜修图和Effects特效引擎sdk联动,解决了目前的AI修图略假失真的问题。 商汤美颜Agent能基于商汤在AI领域多年的积累,精准地理解用户“帮我把肤色修得透亮有元气”、“想要上镜脸但不要失真人”等复杂、主观的表述,并像专业修图师一样,通过分析人脸特征、肤质、五官比例,判断图片、短视频、直播等具体使用场景,可决策需要调整部位、调整比例、需要保留真实感的部分,生成恰到好处的美化策略。​ 此外,凭借在传统SDK领域的经验,商汤SenseAR SDK精准、可靠地执行 AI 的决策,确保了美颜Agent从磨皮到轮廓调整的每一项处理都极度稳定、细腻且可预测,避免AI的过度修饰和塑料感。同时,不依赖用户盲目调参、减少试错成本,底层效果可控、可复现,适合直播与规模化使用。 商汤美颜Ag
20亿+设备验证,商汤科技美颜Agent上线!

出海突围成功!商汤医疗为印尼注入中国智慧

随着“人工智能+”行动全面实施、高质量共建“一带一路”向纵深发展,人工智能已成为全球数字新基建的重要组成,更是中国科技出海的新名片。 在医疗健康领域,“AI+医疗”正突破地域限制,以技术普惠弥合国际医疗差距,成为“健康丝绸之路”的重要抓手。作为沿线重要伙伴,印度尼西亚长期面临医疗资源与能力分布不均的重大挑战,普遍采用X光作为首要分诊工具。因此,如何提升这一环节的效率与一致性,成为当地医疗机构持续关注的现实课题。 在此背景下,商汤医疗率先携手印尼当地最大的私立医疗集团——Siloam Hospitals Group(以下简称Siloam),落地SenseCare®胸部X光智能分析解决方案,成为中国首个成功出海的AI影像普惠方案。 该方案以“低成本、高可及”模式赋能海外医疗体系,不仅从流程、效率与精度等方面全方位提升医院智慧影像诊疗能力,更以实际行动助推当地医疗系统的可持续发展,彰显中国企业的方案价值与技术担当。 出海突围 开启印尼智慧影像新篇章 Siloam作为印尼领先的私立医疗集团,在全国管理着41家医院和73家诊所,覆盖雅加达、爪哇岛、苏门答腊岛、加里曼丹岛等区域,每年接诊近两百万名患者。长期以来,Siloam在推动医疗服务普惠和体系升级方面始终走在前列,此次选择与商汤医疗达成合作,正是基于对商汤医疗技术成熟度、产品可靠性及落地能力的综合认可。双方携手,旨在共同攻克印尼X光影像诊断效率欠佳、资源不均的难题,实现AI辅助诊断“零的突破”,系统性赋能本土医疗体系升级。 商汤医疗SenseCare®胸部X光智能分析解决方案,正是破解这一痛点的关键。该方案基于深度学习算法,能对X光胸片进行快速智能分析,精准检出肺、纵隔和骨三大类关键部位异常,支持气胸、肺炎、肺结核等十余种疾病的辅助检测,并提供相应量化分析与结构化输出,辅助医生在高负荷阅片环境下快速、稳定地完成阅片,并降低漏诊率,
出海突围成功!商汤医疗为印尼注入中国智慧

商汤Seko首届「全民AI春晚」播出啦

商汤科技旗下AI视频创作智能体Seko发起的首届“全民AI春晚共创计划”正式落下帷幕。 这场以“马年焕新”为主题、全民可参与的AI创作盛会,历时数周,最终集结了来自全国各地的200余部创意作品,以技术之力为传统春节注入了崭新的生命力。 没有导演,无需排练,从细腻逼真的4K画风大片,到皮影戏演绎的传统年俗,再到诙谐幽默的宠物小品——广大网友借助Seko AI工具“手搓”出一个个令人惊艳的节目。 本文就含有四支精美作品合集,好作品一次看个。 作品题材横跨相声小品、家庭短剧、歌舞才艺与创意整活,风格多元、脑洞大开,被网友直呼为“神仙打架”。其中,四分之一创作者凭借出色作品斩获现金奖励与平台流量扶持,多部优质内容成功破圈,在全网提前点燃“过年模式”。 值得关注的是,本届共创计划的创作者画像呈现出鲜明的“全民性”。参与者既有来自影视制作领域的资深爱好者,也不乏学生、宝妈、上班族、公务员等跨界人群。他们因Seko AI的低门槛创作体验而聚集,用想象力重新定义“春晚”。 作为行业首个创编一体、多剧集生成智能体,商汤Seko自2025年7月上线以来迅速走红。上线仅两个月用户量突破10万,不到半年已聚集超20万创作者。从技术落地到文化共创,商汤Seko正以“人人皆可创作”的理念,推动AIGC从专业圈层走向日常生活。 本次“全民AI春晚”不仅是一场科技与民俗的融合实验,更是一扇窗口,让我们看到当创意不再受限于工具时,传统节日将焕发出怎样的无限可能。未来,商汤将持续深耕AI视频生成与创作智能体,让更多普通人以最低的门槛,触碰最高的创意天花板。
商汤Seko首届「全民AI春晚」播出啦

商汤科技获纳入MSCI中国指数

全球知名指数公司MSCI(摩根士丹利资本国际公司,简称明晟)公布2月份指数季度调整结果,商汤科技集团-W(00020.HK)B类股获纳入MSCI中国指数,相关调整将于2月27日收盘后正式生效。 MSCI指数是全球机构投资者广泛采用的基准指数,其成分股调整备受资本市场关注。MSCI中国指数作为MSCI全球标准指数系列中MSCI全球新兴市场指数的重要组成部分,是国际资本配置中国资产的关键参照。 公司获纳入MSCI中国指数,反映其自由流通市值、流动性及国际的可投资性等客观量化指标符合MSCI的严格筛选标准。此外,MSCI亦会考量公司所处行业竞争优势等因素。 商汤科技表示,获纳入MSCI中国指数,体现了国际资本市场对公司在人工智能领域的核心技术实力、长期发展战略、稳健商业化进程以及高标准公司治理水平的认可。商汤科技将继续推进“大装置-大模型-应用”三位一体的战略布局,加速从技术领先迈向规模化的商业落地。 此次纳入将有助提升商汤科技对更广泛长期价值投资者的吸引力,为公司的长远发展积蓄更为稳定的资本市场支持。在人工智能行业加速发展的背景下,以商汤科技为代表的中国人工智能前沿力量,正获得全球资本市场的关注与价值重估。
商汤科技获纳入MSCI中国指数

商汤Kapi相机将电影工业标准“装”入千万手机

这个春节,让手机拍照功能彻底“开挂”! 当你想要珍藏团圆饭的温暖、烟花绽放的绚烂时,是否总感觉手机直出照片少了点“质感”? 在视频领域,苹果的Apple Log是行业标杆,以其电影级色彩和巨大后期空间被专业创作者推崇。但想得到一张同等电影感的静态照片,却得走“拍视频->选帧->截图”的繁琐弯路,还牺牲了画质。 针对这一行业痛点,商汤科技旗下「Kapi相机」推出Kapi Log拍照功能,将Apple Log在视频领域树立的专业标准,首次完美引入至手机拍照领域。 商汤Kapi相机的核心算法将自研 Log 曲线深度融合至底层影像管线,直接处理 Raw 域数据,为最高 4800 万像素的照片注入电影级质感,表现可比肩 Apple Log。 全家福的笑脸、年夜饭的热气、夜空的烟花……现在,按下快门,直接得到的就是一张电影感“专业底片”。 一次快门,一张“电影底片”,专业效果触手可得 Kapi Log是什么?简单说,它让你拍照时直接生成一张类似Apple Log的“灰片”。 这张“灰片”最大程度保留了画面的原始信息:高光不过曝,暗部有细节,为用户后续的创意调色提供了专业级起点。  此次 Kapi 相机的技术突破在于,将Log管线创新性用于拍照流程,并从RAW原始数据开始处理。这意味着: l  从源头杜绝“塑料感”:规避暴力锐化算法,还原真实质感; l  发挥硬件极限:以DNG格式保留极致动态范围,为后期留出巨大空间。 在画质、宽容度与工作流效率三大维度上,Kapi Log实现全面跨越: l  画质突破:高解析与真质感兼得​ 对比视频截帧,Kapi Log基于拍照管线,可输出最高4800万像素的成片,细节远超4K视频截帧(约800万像素),给予你充足的裁剪自
商汤Kapi相机将电影工业标准“装”入千万手机

去老虎APP查看更多动态