AI推理基础设施市场正面临一轮显著的成本与供给冲击。
在美国知名风投机构Altimeter近期举办的活动上,AI推理基础设施服务商Baseten首席执行官Tuhin Srivastava透露,其云服务商已于今年5月提前通知,英伟达B200 GPU的每小时租赁单价将在10月合同续约时,从现行的2.63美元涨至5.10美元,涨幅约94%。
他强调,这一数字的关键不在于绝对价格水平,而在于其所折射出的供需失衡程度——云服务商提前数月主动报价,本身即表明在算力持续紧缺的背景下,需求方已几无议价空间。
与此同时,供给端紧张态势同样未见缓和。据Tuhin Srivastava介绍,当前采购1000块GPU的交付排期已普遍延至明年第二季度,等待周期长达12至15个月。交付瓶颈与租赁价格上涨形成叠加效应,企业即便加大投入,短期内亦难以通过采购途径补足算力缺口。价格上行与供给瓶颈双重挤压下,AI推理的成本正面临实质性抬升。
Baseten成立于2019年,总部位于旧金山,定位为生产级AI推理基础设施服务商,业务涵盖模型部署、管理、扩展与监控,提供多集群、多云环境的弹性扩展支持,并辅以性能研究与嵌入式AI工程服务。截至2026年1月,公司已完成D+轮融资,并获得英伟达战略投资。
Baseten首席执行官Tuhin Srivastava
精彩评论