PhanthyCloud云原生智能服务自适应治理引擎:大幅降低企业使用成本
为解决语音对话智能体在规模化落地中常见的“三难”——高峰稳定、体验一致、成本可控,范式智能 $06682(06682)$ PhanthyCloud近日正式推出云原生智能服务自适应治理引擎(Adaptive QoS Engine,简称 AQE)。该引擎面向语音对话、多模态交互等计算密集型场景,基于 Kubernetes 云原生架构,将“负载感知—质量自适应—资源编排”打通成一套自动运行的治理闭环,让系统在流量波动下依然稳定交付,同时显著提升硬件资源利用率。内部实测显示,在同样 1000 并发条件下,AQE 可将成本下降15倍以上,让“算得起、用得稳”不再矛盾。
在真实业务中,高保真语音合成往往消耗大量 GPU 显存与算力,而轻量化引擎则能以更低资源支撑更高并发。传统“静态配置、一刀切”的资源策略要么成本过高,要么在峰值流量下容易出现排队、超时与体验波动。AQE的核心不是简单扩容,而是把“服务质量(QoS)”纳入调度决策:系统会基于实时指标(并发请求、队列积压、GPU 利用率等),在多种预定义的 QoS 档位间自动切换,并联动调整服务实例资源配额与模型/引擎配置。
更关键的是,AQE 内置质量优化(压缩/量化/降级)机制:忙时在可控体验边界内提升吞吐、抬升资源利用率;闲时恢复更高质量配置,把成本压下来,形成“忙时保稳定、闲时降成本”的自动驾驶式治理能力。在同样 1000 并发条件下,基于质量优化与自适应切换策略,内部实测可实现成本约下降15倍以上的优化空间。
为验证该能力的工程可靠性,范式智能在连续语音对话场景完成系统级压力验证。我们将一次完整的“升压—稳态—降压”定义为一个轮回:并发从 0 线性提升至 1000,再逐步回落至 0,单个轮回耗时约 2.5 小时。实际测试并非只跑一轮,而是连续执行了20多个轮回,覆盖不同负载波动与切换边界,全程累计压测时长约 48 小时,用于验证系统在长时间运行与反复升降级过程中的稳定性与一致性表现。
作为 PhanthyCloud的底层能力之一,云原生智能服务自适应治理引擎(AQE)将持续扩展到更多智能体与多模态链路中,帮助企业把智能语音服务真正做到:高峰不崩、体验不掉、成本更可控。
范式智能技术集团股份有限公司(港交所代码: 6682)是全球领先的通用人工智能科技公司,以“AI for everyone”为使命,致力于用“AI agent+世界模型”的技术路线赋能千行万业。公司成立于2014年,于2025年实现集团化,下设企业服务、消费电子、智慧能源、智慧体育等业务板块。截至目前,公司已在金融、零售、医疗等领域成功落地超 10000+个AI应用,始终致力于推动AI普惠,助力企业实现可持续增长。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


