范式智能

范式智能(6682.HK),领先的全栈AI云服务平台。

IP属地:北京
    • 范式智能范式智能
      ·06-05

      范式入选太空计算工委会副主任委员单位,共筑空天智能新基石

      近日,中国计算机行业协会太空计算工作委员会(以下简称“工委会”)成立大会暨第一次全体成员大会在北京召开。 范式作为国内领先的全栈AI云服务平台,成功当选副主任委员单位。本次入选的副主任委员单位均来自头部企业、专业科研机构及知名高校。未来,范式将与产业同仁一道,共同推动太空计算技术与生态建设。 大会现场,工业和信息化部电子信息司副司长史惠康、电子系统处处长金磊,中国科学院院士、西北工业大学常务副校长张艳宁,中国科学院院士、中国科学院大学杭州高等研究院院长王建宇,中国电子信息产业发展研究院总工程师、工委会筹备组组长李宏伟及首批成员单位代表共同出席。史惠康表示,2026年是“十五五”规划开局之年,也是我国太空计算产业布局的关键之年,建议从强化统筹布局、促进融合创新、完善生态建设三方面推动产业发展。张艳宁院士指出,太空计算是国家战略布局的关键点,也是航天强国建设的必然要求与重要基石,未来计算将向空天地海一体化方向发展。 经大会选举,王建宇院士担任工委会主任委员,同时选举产生副主任委员单位、秘书长、副秘书长等。范式凭借在AI基础设施领域的全栈技术积累,成为十五家副主任委员单位之一。 范式围绕太空算力发展,在算力调度、模型适配、场景落地及安全合规等方面具备相应能力,可支撑星载算力管理、卫星智能体构建及跨域数据服务等需求。 太空计算工委会的成立,标志着我国太空计算产业协同发展迈出关键一步。范式将充分发挥自身在AI算力管理与优化方面的核心能力,与工委会成员单位一道,为空天地海一体化智能计算生态贡献技术力量。 范式智能( $06682(06682)$ )是领先的全栈AI云服务平台,提供包括先知AIOS、HAMi vGPU、信创模盒等高效AI基础设施,具备从底层异构算力纳管优化到智能体模型调用的全栈能力,赋能千行
      2.21万1
      举报
      范式入选太空计算工委会副主任委员单位,共筑空天智能新基石
    • 范式智能范式智能
      ·06-03

      信创模盒认证模型突破10万!范式率先突破国产AI基础设施适配瓶颈,打造极致高效的“Token工厂”

      今天,范式 $06682(06682)$ 正式宣布:信创模盒认证模型突破 10 万!在“国产芯片×大模型规模化适配”的问题上,范式再次给出了一份漂亮的成绩单。 依托自研 vGPU 虚拟化技术与十余年AI工程化经验,范式在 Token 调用效率上形成了"国产算力×全球模型"的差异化优势,持续刷新了国产AI基础设施的适配边界,走出了一条可规模化的“Token工厂”路径。 这意味着,范式精准破解了当前AI规模化落地中最棘手的“国产芯片×大模型”双向适配难题。通过自研的底层异构算力优化与全场景模型适配能力,范式已让****、寒武纪、海光、壁仞等主流国产芯片,与 Llama、Qwen、DeepSeek、GLM 等全球主流开源模型实现真正的“即插即用”,告别过去“A芯片能否跑B模型”的不确定性。 这一突破,不仅夯实了范式在”底层异构算力优化+全场景模型适配“的核心技术壁垒,更助力构建起高客户粘性、可持续增长的“Token 工厂”的商业模式。刚刚过去的一季度,范式的 Token 调用量同比去年激增近 6 倍。在这场正向飞轮中,范式做到了:让同样的芯片跑更多模型、同样的模型可选型更高效的算力,真正将国产AI基础设施从“能用”推向“好用”,从“试点”推向“规模”。 我们在实践中感受到:国产AI 基础设施的拐点,正在加速到来! 01 解决“国产芯片×大模型”双向规模化适配难题,打造领先的 Token 工厂 当前,全球 AI 产业正在经历一场从“单点突破”转向“规模化落地”的“Token产能竞赛”。Token 经济的爆发,本质是海量推理需求的爆发;而推理规模化落地的核心瓶颈,正是"多芯片×多模型"的适配难题。 范式以十余年&n
      2.11万评论
      举报
      信创模盒认证模型突破10万!范式率先突破国产AI基础设施适配瓶颈,打造极致高效的“Token工厂”
    • 范式智能范式智能
      ·05-29

      政策再加力 | 范式邀您见证:信创模盒冲刺10万认证模型里程碑!

      5月以来,国内AI产业持续释放重磅政策:算力跨区域协同、数据要素流通、开源合规治理全面加速。范式 $06682(06682)$ 信创模盒(ModelHub XC),高度契合这一系列政策导向——以标准化模型适配与安全合规能力,成为国产算力从“能用”走向“好用”的关键引擎。 01 政策风口下的新范式去年,《算力互联互通行动计划》明确提出,推动全国 2028 年实现全国公共算力标准化互联。而今年 5 月,新政策进一步强调算力跨区域协同与普惠应用。信创模盒通过标准化的模型与硬件匹配体系,正在构建一套属于信创生态的“算力标识规范”——为跨域任务调度、算力互联互通打下坚实基础。政策所指,正是范式所向。 范式信创模盒,正站在这一系列政策风口上,加速国产算力从“能用”走向“好用”。 02 为什么是范式信创模盒 众所周知,信创领域最难解决的一个现实困境就是:芯片买得到,模型跑不通。 为了啃下国产芯片“跑不通模型”这个“硬骨头”,范式推出信创模盒 ModelHub XC 及 EngineX AI 引擎体系,给信创领域带来了“全栈加速器”。 · 效率革命:底层算法架构适配,实现“引擎驱动、多模型即插即用”。适配周期从“周”缩至“天/小时”。 · 跨平台兼容:支持**、天数智芯、沐曦、海光、摩尔线程、壁仞等主流国产平台,算力无感迁移。 · 认证模型 9 万+:截止本周,信创模盒已适配认证模型突破 9 万+,覆盖全球主流开源体系。同时,每款模型带“硬件适配标签”,用户一眼便能清楚哪款国产芯片跑得最稳。 03 下周邀您一起,见证 10 万里程碑 9 万只是新起点。下周,信创模盒适配认证模型数即将突破10万! 这不仅是数字跃升,更是国产算力生态
      2.12万评论
      举报
      政策再加力 | 范式邀您见证:信创模盒冲刺10万认证模型里程碑!
    • 范式智能范式智能
      ·05-26

      范式率先将DRA标准推向生产级!范式主导开源的HAMi-DRA正式生产可用,三大主流芯片已完成方案落地

      近日,由范式 $06682(06682)$ 主导开源的 vGPU 架构 HAMi,宣布其 HAMi-DRA 模式正式达到生产可用状态。 HAMi-DRA 的正式发布,意味着 Kubernetes 用户第一次可以在不改动业务代码的情况下,平稳迈入下一代设备资源管理时代。 01 源于范式,定义生产级标准 去年 9 月,随着 Kubernetes v1.34 正式发布, DRA 已被社区确立为 GPU、NPU、FPGA 等异构设备的标准管理路径。CNCF 2025 年度报告也明确指出:对于管理 GPU 集群的团队,DRA 是一个重大进步。” 众所周知,HAMi 是目前 Kubernetes 上最活跃的开源 vGPU 方案,其源自范式内部 vGPU 技术,已服务数百家企业,而 HAMi-DRA 是开源项目 HAMi 的轻量演进版。 此次发布的 DRA 版本,标志着范式在 Kubernetes 下一代设备资源标准领域率先完成生产级落地。 02 范式率先将 DRA 推向生产级 值得注意的是,早在 Kubernetes v1.35 正式发布前,范式就已率先完成 HAMi-Core 与 DRA 的深度适配,推出 GPU 动态资源驱动(DRA Driver),成为国内最早将 DRA 推向生产实践的技术团队之一。 这一成果的核心使命是:让 DRA 这项先进标准能够真正落地到生产环境,以最友好的方式服务于用户,同时加速行业向标准化、开放式的 GPU 调度体系过渡。 围绕这一使命,第四范式主导了 HAMi-DRA 的核心设计与关键工程突破,包括 libvgpu.so 动态注入、环境变量配置、临时目录管理等一系列 DRA 落地的核心技术难题。 同时,该项目兼容
      2.06万评论
      举报
      范式率先将DRA标准推向生产级!范式主导开源的HAMi-DRA正式生产可用,三大主流芯片已完成方案落地
    • 范式智能范式智能
      ·05-21

      范式出席世界互联网大会研讨会,共议负责任的AI国际标准与开源生态

      近日,世界互联网大会人工智能专业委员会标准推进计划研讨会在北京召开,会议聚焦“发展负责任的人工智能国际标准机遇与挑战”核心议题。范式作为产业界代表受邀出席,与来自国际组织、标准化机构、科研院所的权威代表,以及百度集团、科大讯飞、联想集团等优秀企业的30余位专家共同探讨AI国际标准的演进路径与产业实践。  会上,专委会副主任委员、标准推进计划联合牵头人、中国信息通信研究院人工智能研究所所长魏凯介绍了2026年度标准推进计划,标准推进计划联合牵头人、国际人工智能治理协会主席约翰·希金斯分享了年度工作思考。在产业实践交流环节,范式结合自身在全栈AI云服务平台的长期积累,分享了负责任AI标准的落地思考。 范式指出,随着AI在金融、政务、能源等关键行业深度渗透,模型可解释性、公平性与安全性已成为企业规模化应用的核心关切。对此,范式正以云平台和Token驱动模式加速AI服务普惠——基于Phanthy(万神殿)平台整合超70,000个适配模型,提供标准化API能力,并将负责任AI原则嵌入算力调度、模型安全与数据治理的全流程。同时,范式主导的开源异构算力管理项目HAMi已适配多家国产芯片,以开放生态促进技术透明与标准共识,为负责任AI的规模化落地提供坚实基础设施支撑。 与会专家一致认为,开源生态与国际标准深度耦合,是推动人工智能普惠与负责任发展的重要路径。各方应加强开放协作,在标准研究、安全治理、算力协同等领域形成合力。世界互联网大会相关负责人表示,本次会议成果将为7月ITU AI for Good全球峰会专题研讨会奠定坚实基础。 未来,范式将继续秉持“AI for Everyone”使命,深度参与国际标准研制与开源生态共建,助力全球人工智能治理体系向更安全、更可信、更负责任的方向演进。 范式智能( $06
      2.36万评论
      举报
      范式出席世界互联网大会研讨会,共议负责任的AI国际标准与开源生态
    • 范式智能范式智能
      ·05-20

      范式 × 欢喜传媒 |强强联合,共拓“AI+文娱”智能新生态

      5 月 20 日,范式 $06682(06682)$ 正式宣布,与头部影视文娱企业欢喜传媒签订战略合作与合资框架协议。双方将依托范式全栈AI能力,结合欢喜传媒丰富的影视数据、IP 及制作资源,共同推动文娱产业完成数字化向智能化的跨越式升级。 根据协议,双方拟成立合资公司为合作平台,计划在多个领域落地深度合作布局,涵盖数据合作、影视领域大模型研发、探索AI解决方案在新文娱领域落地、影视项目联合出品制作以及相关知识产权开发,以及探索建立资源合作。 三年 2 亿美元 API 采购目标 双方同步订立大模型 API 服务框架协议,欢喜传媒意向采用范式的大模型 API 服务,计划在三年内,通过 Token 消耗产生的累计服务金额预计不低于 2 亿美元。 该项长期采购规划,充分彰显行业市场对范式技术平台实力、系统稳定性及商业化落地能力的高度认可,不仅为公司带来长期稳定且可预期的营收增量,更进一步夯实业绩增长根基,显著提升经营增长确定性。 强强联合,引领 AI 文娱迈向高质量发展 过去,AI 在影视行业更多停留在概念验证阶段,而此次强强联手,则是首次将“大模型调用”、“Token消耗”、“长期采购”等核心指标真正落实到长期商业合作框架中,这代表着范式的全栈 AI 能力实现了从平台到文娱生态的关键一跃。 欢喜传媒是长期深耕影视内容领域的头部公司,长期与张艺谋、王家卫、陈可辛、宁浩、徐峥等知名导演保持深度合作,在电影制作、内容开发及线上娱乐领域拥有丰富的产业资源与内容积累。 范式则具备覆盖模型、平台、Agent及API服务的大模型全栈能力,能够为产业客户提供从模型能力到平台接入、再到场景落地的完整 AI 交付体系。凭借范式在国产算力适配及软硬件一体化交付方面的独特优势,本次合作将显
      2.25万1
      举报
      范式 × 欢喜传媒 |强强联合,共拓“AI+文娱”智能新生态
    • 范式智能范式智能
      ·05-13

      范式贡献 vLLM 关键 Bugfix,多卡高并发场景下吞“Token”大坑解决了!

      今年以来,“如何 Tokenmaxxing” 成为了大洋两岸都在讨论的问题。 然而,在真实企业场景中,大家都在用的主流开源大模型推理框架 vLLM 一直隐藏着一个“吞 Token 大坑”:  系统看起来正常运行,请求也正常返回,但模型的回答质量却在高并发、多卡并行等复杂环境下悄悄下降。 近日,范式 $06682(06682)$ 工程师向开源大模型推理框架 vLLM 提交的一项关键 Bugfix 已被官方社区合并。该修复解决了 vLLM 在 Pipeline Parallelism(流水线并行)模式下,高并发请求可能导致 prompt token 丢失,并进一步引发模型推理准确率下降的问题。 01 多卡流水线并行,会“吞掉”用户的 Token 可以把大模型想象成一条很长的生产线。模型太大,一张 GPU 放不下或算不过来,就把它按层拆成几段:前面几层放在 GPU 1,中间几层放在 GPU 2,后面几层放在 GPU 3。请求进来后,数据会像产品上流水线一样,依次经过每一段 GPU,最后产出结果。在有多个请求或 micro-batch 时,不同 GPU 可以同时处理不同阶段,从而提高整体吞吐。 图片 它的好处是:让多张 GPU 一起干活,跑更大的模型、扛更多请求。 但难点也在这里:请求多了以后,每一站都要记清楚“这个请求处理到哪了、上下文有哪些”。一旦记录错了,模型就可能漏看一部分题目背景,答案自然会变差。所以,流水线并行看起来是“多卡分工”,本质上考验的是:多张 GPU 能不能配合得又快又准。 但当系统同时处理大量请求时,问题就出现了。vLLM 在流水线并行模式下,需要一边拆分任务、一边分批处理输入内容,还要不断调整请求顺序。原有逻辑在少数复杂场景下,可能把某个请求的上下文记录错
      2.13万评论
      举报
      范式贡献 vLLM 关键 Bugfix,多卡高并发场景下吞“Token”大坑解决了!
    • 范式智能范式智能
      ·05-08

      告别“从零开始”|范式发布企业级成长型AI Agent——PhanHermes

      员工每次与AI协作,都需要重复介绍项目背景、公司规范、业务流程;AI不记得昨天的会议决议,也无法沿用上周刚教会它的周报模板——这种“每次从零开始”的体验,让厌倦重复解释上下文的业务用户苦不堪言,也使有重复性工作流的员工始终无法摆脱机械劳动。 这正是当前通用AI工具在企业落地中的真实困境。 针对上述痛点,范式今天正式推出PhanHermes——一款支持本地化部署、完全私有化的企业级成长型AI Agent。它具备持久记忆、主动学习与多端协同能力,同时严格守护企业数据隐私,让AI真正成为“属于企业的智能伙伴”。无论你是被重复解释消耗耐心的业务用户,还是需要持久运行、自我进化、支持多模型Agent框架的开发者,PhanHermes都能为你提供专属解决方案。 从开源命令行到企业级安全协作 PhanHermes源自开源项目Hermes Agent——2026年GitHub上最受欢迎的“成长型 Agent”。但Hermes仅限命令行,无法满足企业对数据隔离、权限管理和合规性的要求。 范式将其核心能力完整迁移至企业办公环境,支持私有化部署于飞书、企业微信、钉钉、邮件、Telegram、Slack等主流协作平台。所有交互数据均保留在企业内部,杜绝外泄风险,让日常工作的每个触点都能拥有一个会持续成长的专属AI。 五大核心功能 重塑人机协作 持久记忆,沉淀企业知识:PhanHermes拥有跨会话的长期记忆,能够记住每位员工的偏好、部门规则、项目背景。后续协作无需重复“自我介绍”——尤其适合“厌倦重复解释上下文”的用户,单项目信息检索时间有效缩短。 自动学习,工作减负:需要反复执行某项任务(如整理纪要、生成周报、审查代码)时,PhanHermes会将其提炼为“技能”(skill)以供随时调用。让“有重复性工作流的用户”告别机械劳动,把精力留给创造。 主动通知机制:继承Hermes的nudge机制,
      2.37万评论
      举报
      告别“从零开始”|范式发布企业级成长型AI Agent——PhanHermes
    • 范式智能范式智能
      ·05-07

      范式推出龙虾农场:让每个人都能拥有自己的云端AI工作队

      范式推出龙虾农场(PhanClaw Farm),一款面向 AI Agent 时代的云端生产力平台。 随着AI从“聊天工具”逐渐变成“数字员工”,越来越多创作者、开发者、产品经理、设计师和团队,开始让AI参与真实工作:写代码、做设计、整理资料、分析需求、生成内容、处理项目。但当AI 真正进入工作流后,新的问题也随之出现:一个AI不够用,多开几个又不好管;放在本地跑,设备成本高;不同任务混在一起,环境也容易乱。 龙虾农场(PhanClaw Farm)要解决的,就是让用户可以在云端用合理的成本创建和管理多只“龙虾”。每一只龙虾,都可以理解成一个独立的云端AI工作环境。用户可以让一只负责写代码,一只负责做设计,一只负责整理资料,一只负责产品分析。它们各干各的事,互不打扰,又可以被用户统一管理。简单来说,过去用户可能需要买多台电脑、打开多个工具、切换多个账号;现在,可以直接在龙虾农场里开多只龙虾,让它们在云端分别完成不同任务。 低成本背后,是范式的虚拟化技术 龙虾农场的核心特点是:用起来专属,但底层更高效。对用户来说,每只龙虾都是有独立环境,可以长期使用的;在底层,范式通过虚拟化技术,把 GPU、Token、模型调用等资源统一调度起来,让资源不浪费,也让使用成本更低。 虚拟化技术要做的,就是在保证用户体验和环境隔离的前提下,把底层资源更高效地利用起来。用户感受到的是自己的独立龙虾,平台底层则通过统一调度,让GPU、Token和模型能力被更灵活地分配。 也正因为如此,龙虾农场不是简单地把电脑搬到云上,而是通过虚拟化和资源调度,把多个AI工作环境变得更容易创建、更低成本运行,也更适合长期管理。 数据不丢、隐私不出,是AI Agent真正干活的前提 当AI Agent进入真实工作流程后,数据安全就不再是附加能力,而是基础前提。因为它可能需要处理项目文件、历史记录、账号信息、代码仓库等敏感内
      4.34万评论
      举报
      范式推出龙虾农场:让每个人都能拥有自己的云端AI工作队
    • 范式智能范式智能
      ·05-07

      以一当十!单张显卡虚拟显存狂飙256GB

      传统GPU的显存就像一间固定的“备菜台”——空间有限,菜一多就手忙脚乱。想做大餐?只能加钱上多卡,成本直接起飞。现在,选择Virtual VRAM——突破当前GPU硬件的物理显存容量限制,给“备菜台”配上一个超大的“储藏室”。它巧妙地将高速内存虚拟为显存使用,让单张显卡的虚拟显存容量可扩展至256GB。什么概念?相当于10张4090的物理显存之和。无需更换硬件,就能在接近原生显存的性能下,轻松承载大规模AI训练与推理。一卡顶十卡,做大模型,从此不再畏手畏脚。高性能+大容量,这次真的“一力当十”! $范式智能(06682)$
      2.10万评论
      举报
      以一当十!单张显卡虚拟显存狂飙256GB
     
     
     
     

    热议股票