范式智能

范式智能(6682.HK),领先的全栈AI云服务平台。

IP属地:北京
    • 范式智能范式智能
      ·05-21 16:25

      范式出席世界互联网大会研讨会,共议负责任的AI国际标准与开源生态

      近日,世界互联网大会人工智能专业委员会标准推进计划研讨会在北京召开,会议聚焦“发展负责任的人工智能国际标准机遇与挑战”核心议题。范式作为产业界代表受邀出席,与来自国际组织、标准化机构、科研院所的权威代表,以及百度集团、科大讯飞、联想集团等优秀企业的30余位专家共同探讨AI国际标准的演进路径与产业实践。  会上,专委会副主任委员、标准推进计划联合牵头人、中国信息通信研究院人工智能研究所所长魏凯介绍了2026年度标准推进计划,标准推进计划联合牵头人、国际人工智能治理协会主席约翰·希金斯分享了年度工作思考。在产业实践交流环节,范式结合自身在全栈AI云服务平台的长期积累,分享了负责任AI标准的落地思考。 范式指出,随着AI在金融、政务、能源等关键行业深度渗透,模型可解释性、公平性与安全性已成为企业规模化应用的核心关切。对此,范式正以云平台和Token驱动模式加速AI服务普惠——基于Phanthy(万神殿)平台整合超70,000个适配模型,提供标准化API能力,并将负责任AI原则嵌入算力调度、模型安全与数据治理的全流程。同时,范式主导的开源异构算力管理项目HAMi已适配多家国产芯片,以开放生态促进技术透明与标准共识,为负责任AI的规模化落地提供坚实基础设施支撑。 与会专家一致认为,开源生态与国际标准深度耦合,是推动人工智能普惠与负责任发展的重要路径。各方应加强开放协作,在标准研究、安全治理、算力协同等领域形成合力。世界互联网大会相关负责人表示,本次会议成果将为7月ITU AI for Good全球峰会专题研讨会奠定坚实基础。 未来,范式将继续秉持“AI for Everyone”使命,深度参与国际标准研制与开源生态共建,助力全球人工智能治理体系向更安全、更可信、更负责任的方向演进。 范式智能( $06
      1.04万评论
      举报
      范式出席世界互联网大会研讨会,共议负责任的AI国际标准与开源生态
    • 范式智能范式智能
      ·05-20 13:44

      范式 × 欢喜传媒 |强强联合,共拓“AI+文娱”智能新生态

      5 月 20 日,范式 $06682(06682)$ 正式宣布,与头部影视文娱企业欢喜传媒签订战略合作与合资框架协议。双方将依托范式全栈AI能力,结合欢喜传媒丰富的影视数据、IP 及制作资源,共同推动文娱产业完成数字化向智能化的跨越式升级。 根据协议,双方拟成立合资公司为合作平台,计划在多个领域落地深度合作布局,涵盖数据合作、影视领域大模型研发、探索AI解决方案在新文娱领域落地、影视项目联合出品制作以及相关知识产权开发,以及探索建立资源合作。 三年 2 亿美元 API 采购目标 双方同步订立大模型 API 服务框架协议,欢喜传媒意向采用范式的大模型 API 服务,计划在三年内,通过 Token 消耗产生的累计服务金额预计不低于 2 亿美元。 该项长期采购规划,充分彰显行业市场对范式技术平台实力、系统稳定性及商业化落地能力的高度认可,不仅为公司带来长期稳定且可预期的营收增量,更进一步夯实业绩增长根基,显著提升经营增长确定性。 强强联合,引领 AI 文娱迈向高质量发展 过去,AI 在影视行业更多停留在概念验证阶段,而此次强强联手,则是首次将“大模型调用”、“Token消耗”、“长期采购”等核心指标真正落实到长期商业合作框架中,这代表着范式的全栈 AI 能力实现了从平台到文娱生态的关键一跃。 欢喜传媒是长期深耕影视内容领域的头部公司,长期与张艺谋、王家卫、陈可辛、宁浩、徐峥等知名导演保持深度合作,在电影制作、内容开发及线上娱乐领域拥有丰富的产业资源与内容积累。 范式则具备覆盖模型、平台、Agent及API服务的大模型全栈能力,能够为产业客户提供从模型能力到平台接入、再到场景落地的完整 AI 交付体系。凭借范式在国产算力适配及软硬件一体化交付方面的独特优势,本次合作将显
      1.66万1
      举报
      范式 × 欢喜传媒 |强强联合,共拓“AI+文娱”智能新生态
    • 范式智能范式智能
      ·05-13

      范式贡献 vLLM 关键 Bugfix,多卡高并发场景下吞“Token”大坑解决了!

      今年以来,“如何 Tokenmaxxing” 成为了大洋两岸都在讨论的问题。 然而,在真实企业场景中,大家都在用的主流开源大模型推理框架 vLLM 一直隐藏着一个“吞 Token 大坑”:  系统看起来正常运行,请求也正常返回,但模型的回答质量却在高并发、多卡并行等复杂环境下悄悄下降。 近日,范式 $06682(06682)$ 工程师向开源大模型推理框架 vLLM 提交的一项关键 Bugfix 已被官方社区合并。该修复解决了 vLLM 在 Pipeline Parallelism(流水线并行)模式下,高并发请求可能导致 prompt token 丢失,并进一步引发模型推理准确率下降的问题。 01 多卡流水线并行,会“吞掉”用户的 Token 可以把大模型想象成一条很长的生产线。模型太大,一张 GPU 放不下或算不过来,就把它按层拆成几段:前面几层放在 GPU 1,中间几层放在 GPU 2,后面几层放在 GPU 3。请求进来后,数据会像产品上流水线一样,依次经过每一段 GPU,最后产出结果。在有多个请求或 micro-batch 时,不同 GPU 可以同时处理不同阶段,从而提高整体吞吐。 图片 它的好处是:让多张 GPU 一起干活,跑更大的模型、扛更多请求。 但难点也在这里:请求多了以后,每一站都要记清楚“这个请求处理到哪了、上下文有哪些”。一旦记录错了,模型就可能漏看一部分题目背景,答案自然会变差。所以,流水线并行看起来是“多卡分工”,本质上考验的是:多张 GPU 能不能配合得又快又准。 但当系统同时处理大量请求时,问题就出现了。vLLM 在流水线并行模式下,需要一边拆分任务、一边分批处理输入内容,还要不断调整请求顺序。原有逻辑在少数复杂场景下,可能把某个请求的上下文记录错
      2.09万评论
      举报
      范式贡献 vLLM 关键 Bugfix,多卡高并发场景下吞“Token”大坑解决了!
    • 范式智能范式智能
      ·05-08

      告别“从零开始”|范式发布企业级成长型AI Agent——PhanHermes

      员工每次与AI协作,都需要重复介绍项目背景、公司规范、业务流程;AI不记得昨天的会议决议,也无法沿用上周刚教会它的周报模板——这种“每次从零开始”的体验,让厌倦重复解释上下文的业务用户苦不堪言,也使有重复性工作流的员工始终无法摆脱机械劳动。 这正是当前通用AI工具在企业落地中的真实困境。 针对上述痛点,范式今天正式推出PhanHermes——一款支持本地化部署、完全私有化的企业级成长型AI Agent。它具备持久记忆、主动学习与多端协同能力,同时严格守护企业数据隐私,让AI真正成为“属于企业的智能伙伴”。无论你是被重复解释消耗耐心的业务用户,还是需要持久运行、自我进化、支持多模型Agent框架的开发者,PhanHermes都能为你提供专属解决方案。 从开源命令行到企业级安全协作 PhanHermes源自开源项目Hermes Agent——2026年GitHub上最受欢迎的“成长型 Agent”。但Hermes仅限命令行,无法满足企业对数据隔离、权限管理和合规性的要求。 范式将其核心能力完整迁移至企业办公环境,支持私有化部署于飞书、企业微信、钉钉、邮件、Telegram、Slack等主流协作平台。所有交互数据均保留在企业内部,杜绝外泄风险,让日常工作的每个触点都能拥有一个会持续成长的专属AI。 五大核心功能 重塑人机协作 持久记忆,沉淀企业知识:PhanHermes拥有跨会话的长期记忆,能够记住每位员工的偏好、部门规则、项目背景。后续协作无需重复“自我介绍”——尤其适合“厌倦重复解释上下文”的用户,单项目信息检索时间有效缩短。 自动学习,工作减负:需要反复执行某项任务(如整理纪要、生成周报、审查代码)时,PhanHermes会将其提炼为“技能”(skill)以供随时调用。让“有重复性工作流的用户”告别机械劳动,把精力留给创造。 主动通知机制:继承Hermes的nudge机制,
      2.31万评论
      举报
      告别“从零开始”|范式发布企业级成长型AI Agent——PhanHermes
    • 范式智能范式智能
      ·05-07

      范式推出龙虾农场:让每个人都能拥有自己的云端AI工作队

      范式推出龙虾农场(PhanClaw Farm),一款面向 AI Agent 时代的云端生产力平台。 随着AI从“聊天工具”逐渐变成“数字员工”,越来越多创作者、开发者、产品经理、设计师和团队,开始让AI参与真实工作:写代码、做设计、整理资料、分析需求、生成内容、处理项目。但当AI 真正进入工作流后,新的问题也随之出现:一个AI不够用,多开几个又不好管;放在本地跑,设备成本高;不同任务混在一起,环境也容易乱。 龙虾农场(PhanClaw Farm)要解决的,就是让用户可以在云端用合理的成本创建和管理多只“龙虾”。每一只龙虾,都可以理解成一个独立的云端AI工作环境。用户可以让一只负责写代码,一只负责做设计,一只负责整理资料,一只负责产品分析。它们各干各的事,互不打扰,又可以被用户统一管理。简单来说,过去用户可能需要买多台电脑、打开多个工具、切换多个账号;现在,可以直接在龙虾农场里开多只龙虾,让它们在云端分别完成不同任务。 低成本背后,是范式的虚拟化技术 龙虾农场的核心特点是:用起来专属,但底层更高效。对用户来说,每只龙虾都是有独立环境,可以长期使用的;在底层,范式通过虚拟化技术,把 GPU、Token、模型调用等资源统一调度起来,让资源不浪费,也让使用成本更低。 虚拟化技术要做的,就是在保证用户体验和环境隔离的前提下,把底层资源更高效地利用起来。用户感受到的是自己的独立龙虾,平台底层则通过统一调度,让GPU、Token和模型能力被更灵活地分配。 也正因为如此,龙虾农场不是简单地把电脑搬到云上,而是通过虚拟化和资源调度,把多个AI工作环境变得更容易创建、更低成本运行,也更适合长期管理。 数据不丢、隐私不出,是AI Agent真正干活的前提 当AI Agent进入真实工作流程后,数据安全就不再是附加能力,而是基础前提。因为它可能需要处理项目文件、历史记录、账号信息、代码仓库等敏感内
      4.31万评论
      举报
      范式推出龙虾农场:让每个人都能拥有自己的云端AI工作队
    • 范式智能范式智能
      ·05-07

      以一当十!单张显卡虚拟显存狂飙256GB

      传统GPU的显存就像一间固定的“备菜台”——空间有限,菜一多就手忙脚乱。想做大餐?只能加钱上多卡,成本直接起飞。现在,选择Virtual VRAM——突破当前GPU硬件的物理显存容量限制,给“备菜台”配上一个超大的“储藏室”。它巧妙地将高速内存虚拟为显存使用,让单张显卡的虚拟显存容量可扩展至256GB。什么概念?相当于10张4090的物理显存之和。无需更换硬件,就能在接近原生显存的性能下,轻松承载大规模AI训练与推理。一卡顶十卡,做大模型,从此不再畏手畏脚。高性能+大容量,这次真的“一力当十”! $范式智能(06682)$
      2.07万评论
      举报
      以一当十!单张显卡虚拟显存狂飙256GB
    • 范式智能范式智能
      ·04-30

      范式加码算力基础设施,全面扩容API业务产能

      范式今日宣布,计划以总价4亿元人民币采购GPU服务器及相关配套设备。该批服务器将用于模型推理与训练,并重点投入API业务线,以应对市场快速增长的API调用需求。 目前,范式API业务正处于高速增长通道——2026年第一季度,客户Token调用量较2025年第四季度增长超过400%,且季度内每月调用量均实现环比翻倍。此次算力资源的及时部署,将为业务持续高速扩张提供坚实支撑。 凭借领先的vGPU技术与丰富的大模型适配经验,范式能够在同等算力条件下不断提升Token调用效率,实现算力资源的深度释放。 本次扩容彰显了公司对算力资源的中长期战略部署。未来,范式将持续加大投入、稳步扩充算力基础设施,以长期匹配并支撑API业务的高速增长需求,全力抢抓Token产业发展红利。 范式智能 $范式智能(06682)$ 是领先的全栈AI云服务平台,提供包括先知AIOS、HAMi vGPU、信创模盒等高效AI基础设施,具备从底层异构算力纳管优化到智能体模型调用的全栈能力,赋能千行万业智能化转型,并致力于在AI 2.0时代打造高效规模化的“Token工厂”。 范式以“AI for Everyone”为使命,作为“驾驭AI的领航者”,成为全球领先的通用人工智能科技公司。
      2.29万评论
      举报
      范式加码算力基础设施,全面扩容API业务产能
    • 范式智能范式智能
      ·04-29

      用AI训练模型!范式发布PhanthyModel

      4月28日,范式正式发布 PhanthyModel,一款帮助科学家和开发者“做模型”的 AI 工具,也是范式在“AI 自主进化”方向上的一次重要产品化尝试。 很多科学研究和工业场景里,都需要先做模型。比如预测一个结果、模拟一次实验、分析一组数据,或者找出某个问题背后的规律。但这个过程并不简单:要整理数据、选方法、搭模型、跑实验、看结果,还要不断修改和调整。过去,这类工作通常需要专业人员花5-6个小时完成,甚至更长。 PhanthyModel 要解决的,就是这件事太慢、太依赖专家经验的问题。 有了PhanthyModel,用户只需要告诉它想解决什么问题,它就可以帮忙看数据、想方案、搭模型、跑实验、分析结果,并根据专家的反馈继续改进。在早期测试中,过去5-6个小时的人工建模工作,现在可以缩短到约10分钟。 它的价值不只是“做得更快”。更重要的是,每一次专家的修改、评价和反馈,都会被沉淀为宝贵的建模经验,成为后续模型迭代升级的重要依据。随着真实任务和专家反馈不断积累,PhanthyModel 会在下一次模型升级中进一步提升建模能力,越来越懂得如何处理复杂的真实建模任务。 所以,PhanthyModel不只是一个提高效率的工具。它代表的是一种新的AI工作方式:AI不再只是回答问题,而是开始真正参与复杂工作,并在工作中持续变强。对于科研、工程、工业和数据分析行业来说,这意味着复杂建模的门槛会降低,实验和研发速度会变快,更多想法也能更快被验证出来。 范式智能 $范式智能(06682)$ 是领先的全栈AI云服务平台,提供包括先知AIOS、HAMi vGPU、信创模盒等高效AI基础设施,具备从底层异构算力纳管优化到智能体模型调用的全栈能力,赋能千行万业智能化转型,并致力于在AI 2.0时代打造高效规模化的“T
      4.54万评论
      举报
      用AI训练模型!范式发布PhanthyModel
    • 范式智能范式智能
      ·04-17

      范式华东总部迎国际投资人团 共探AI2.0产业机遇与跨境合作

      近日,范式华东总部迎来由国际科技投资平台Tech Buzz China组织的国际商务考察团到访。考察团成员来自新加坡、印度、美国、荷兰等国家,涵盖家族办公室、影响力投资机构及专业投资顾问,此行旨在深入了解范式全栈式AI2.0生态系统,并就AI技术驱动产业变革的跨境合作机遇展开交流。 图片 图片 考察团一行首先参观了范式上海展厅,对公司在AI技术研发与商业化落地方面的实践进行了实地了解。随后,考察团与范式管理层围绕AI大模型、AI Agent、世界模型等前沿技术议题进行座谈。双方重点探讨了人工智能如何赋能金融、医疗、零售等行业的智能化转型路径。 图片 图片 参与本次交流的机构包括新加坡ASIAMIN Capital Advisors、美国TenCore Partners及荷兰Fourstones Advisors FZE等,上述机构在亚洲跨境资产配置、全球市场深度基本面投资及中东家族办公室多元资产组合管理等领域拥有多年实践。 交流期间,双方聚焦AI技术如何服务于产业的长期价值创造交换了具体看法,并一致认为,AI2.0阶段的核心价值在于通过技术普惠推动各行业实现可持续增长,跨境协作是释放这一潜力的关键路径之一。 图片 图片 Tech Buzz China是国际科技投资平台,专注中国AI等前沿领域,由马睿创立。通过研究、活动及播客《TechBuzz China》连接全球资本与创新者,推动跨境合作。 范式智能( $06682(06682)$ )是领先的全栈AI云服务平台,提供包括先知AIOS、HAMi vGPU、信创模盒等高效AI基础设施,具备从底层异构算力纳管优化到智能体模型调用的全栈能力,赋能千行百业智能化转型,并致力于在AI 2.0时代打造高效规模化的“Token工厂”。 范式以“AI for
      2.53万评论
      举报
      范式华东总部迎国际投资人团 共探AI2.0产业机遇与跨境合作
    • 范式智能范式智能
      ·04-13

      信创模盒ModelHub XC|适配认证模型突破40000大关 基于自动化引擎的规模化增长与算力兼容实践

      信创模盒ModelHub XC今日数据显示,已完成适配与认证的AI模型数量超过40000个。距离上次突破30000个的节点仅过去不到一个月,实现日均新增约330个,适配效率较上线初期提升超百倍。这一数据更新了目前国内信创模型库的规模情况,也反映出在国产算力与AI应用之间,中间层适配技术的推进状态,标准化适配能力日渐成熟。 40000个适配模型的数据构成 在信创产业推进过程中,硬件性能逐步提升的同时,上层应用生态的丰富度成为当前阶段关注的重点。信创模盒社区目前累积的40000余个适配模型,覆盖自然语言处理、计算机视觉、语音识别、大语言模型及多模态模型等多个技术方向。这些模型已在社区完成对主流国产算力平台的验证,为不同行业的数字化场景提供能够调用的资源储备。   适配方式的转变:从人工调试到EngineX自动化处理 信创AI应用部署在早期面临的一个具体问题,是不同国产芯片架构与开源模型框架之间的指令集差异。传统做法中,需要技术人员针对特定硬件手动进行算子适配与调试,单个模型的部署周期较长。 信创模盒上线初期,适配模型数量在数百个级别。随着底层适配工具EngineX的应用,模型适配流程由人工操作转向自动化处理,适配效率发生变化。社区数据显示,适配模型数量在随后数月内先后达到千级、万级规模,直至目前的40000余个。   对信创算力平台的覆盖范围 目前,信创模盒社区已支持的主流信创算力平台包括天数智芯、**、寒武纪、海光、昆仑芯、沐曦、曦望等。对于近期发布的模型版本,如DeepSeek V3.1、OpenAI开源版本、智谱GLM-5等,社区已同步完成适配与基础验证,开发者可在社区内查看相关兼容性信息。   提供全生命周期支持的服务平台 在适配模型数量增长的同时,信创模盒社区也在同步构建面向开发者与企业的服务支撑体系。社区目前提供的能力覆盖从底层引擎到上
      2.45万评论
      举报
      信创模盒ModelHub XC|适配认证模型突破40000大关 基于自动化引擎的规模化增长与算力兼容实践
       
       
       
       

      热议股票