云计算的成本:一个万亿美元的悖论

云计算是计算史上最重要的平台转变之一。它影响了数千亿美元的 IT 支出,目前还处于早期阶段,每年在超过 1000 亿美元的公有云支出基础上迅速增长。这种转变是由一个强大价值主张驱动的 —— 在业务规模扩张的时候及时提供基础设施 —— 在运营和资本方面提高效率。云计算还有助于孕育创新,因为公司的资源可以释放出来,专注于产品创新和增长。

然而,随着“云”的成熟 —— 我们看到了“云”对公司生命周期价值的更完整描述 —— 越来越明显的是,尽管云计算在公司早期就兑现了其承诺,但随着公司规模的扩大和增长的放缓,它给利润带来的压力可能会大于收益。因为这种情况发生在公司生命周期的后期,因此很难逆转,这是公司多年来专注于创新而不是基础设施结构优化的结果。如果为了显著提高效率,重写或重组底层设施可能需要数年时间,这通常被认为是不可能的。

现在,人们越来越意识到云计算的长期成本影响。随着“云”的成本开始在总营收成本(COR)或商品销售成本(COGS)中占据重要地位,一些公司采取了值得借鉴的举措,“回迁”大部分工作负量(如 Dropbox),或者在一些情况下采用混合云的方法(如 CrowdStrike 和 Zscaler)。那些已经效仿的公司都表示他们大幅节约了成本:2017 年,Dropbox 在其 S-1 中详细描述了其在 IPO 前两年累计节约了 7500 万美元的巨额成本,这主要是因为其大幅优化了基础设施,其中大部分工作是从公有云回迁。

然而,考虑到这些转变的工作量之大,以及“云是必然的”这一占据行业主导地位、有些独特的共识,大多数公司发现很难证明将存储服务从云转出是合理的。因为在对潜在损失的经济规模进行评估时,计算方法发生了变化。通常,增长随着规模的增长而放缓,短期效益将逐渐成市场价值判断的一个关键的决定因素。然而事实是:云计算的高额成本导致了利润率的下降,严重影响了收益。

不过,本文的重点并不是支持从云回迁;这是一个非常复杂的决定,影响广泛,每家公司都不一样。相反,我们想了解“云”究竟抑制了多少市值,以帮助我们在随着公司规模不断扩大的同时,帮助制定管理基础设施的决策框架。

本文框架:我们预计,在将工作量从云端完全回迁的极端情况下能节约多少成本,并使用公开数据估算出其对股价的影响。结果显示(基于相对保守的假设!),在目前使用云基础设施的 50 家头部软件上市公司中,由于云服务对利润率的影响,相对于他们自己运营基础设施,估计会有 1000 亿美元的市值损失。虽然我们分析关注的是软件公司,但云计算的影响绝不仅限于软件类公司。将这一分析扩展到更广泛的、有望从相关节约中受益的大型上市公司,我们估计市值损失规模可能超 5000 亿美元。

我们的分析强调了通过云优化可以为公司带来多少价值 —— 无论通过系统设计和实现、重新架构、第三方云效率解决方案,还是将工作量转移到特殊用途的硬件上。鉴于云计算与本地部署是目前业内的主流做法,我们的分析无疑是一个非常违背直觉的假设。然而,很明显,当你考虑到对市值的影响以及近期节省的支出时,任何降低云成本的举措都会因为公司规模不断变大而获得其合理性与正当性。


从云端回迁的单位经济学:Dropbox 等案例

为了量化云计算的成本,并了解优化所节约的成本,我们可以从一个更极端的大规模“回迁”案例开始:Dropbox。Dropbox 在 2016 年启动了基础设施优化计划,通过将大部分工作量从公有云转移到自己直接租赁和运营的“低成本定制的协同设施基础设施”,他们在两年多的时间里节省了近 7500 万美元。从 2015 年至 2017 年,Dropbox 的毛利率从 33% 上升至 67%,他们指出,这“主要是由于我们的基础设施优化......以及在此期间的收入增长。”

但这只是 Dropbox。因此,为了将“云回迁”的潜在节约推广到更多的公司,前 Google 工程师、云计算优化公司 Optimyze 的联合创始人 Thomas Dullien 估计,每年 1 亿美元的公有云支出可以转化为大约不到一半的年度总拥有成本(TCO) —— 从服务器机架、地产、冷却到网络和工程等成本。

具体节省的成本显然各不相同,但我们采访过的几位专家都同意以下“结论”:在云计算中运行同等工作量,回迁后的成本是前者的三分之一到二分之一。此外,一家大型消费互联网公司的工程总监发现,公有云的价格可能是自己运营数据中心成本的 10~20 倍。承诺使用量和按量计价的折扣方案在业界很常见,并且可以将这一倍数降至个位数,承诺使用的折扣方案通常会将费用节约 30-50%。但扣除这些折扣方案和激进的研发预算,AWS 的运营利润率仍在 30% 左右 —— 这意味着回迁有望节省更多的钱。自己管理自己的硬件,其所带来的性能提升可能会推动更多的收益。

在我们与不同从业者的所有对话中,他们一致认为:如果你是大规模运营的公司,那么云计算的成本会使你的基础设施费用翻倍。


云计算的真实成本

当你考虑到云计算支出占总收入成本(COR)的占比时,节省下的 50% 成本就特别有意义。基于对上市软件公司(那些披露其承诺使用量的云基础设施支出的公司)的基准测试,我们发现,承诺使用量的支出平均占 COR 的 50%。

实际支出占 COR 的百分比通常会高于承诺支出:一家价值 10 亿美元的私营软件公司告诉我们,他们的公有云支出占 COR 的 81%,“云支出占收入成本的 75%~80% 在软件公司中很常见。”在 Google 和 Optimyze 的任职期间,Dullien 观察到,因为担心过渡投入,公司在确定云计算的投入规模时通常会比较保守,只会承诺基础使用量。根据经验,承诺支出通常比实际支出要低 20%。我们采访的一些公司报告称,他们的实际云支出至少超出之前预测的 2 倍。

如果我们将这些基准推广到那些利用公有云基础设施的软件公司,根据经验,我们估计 50 家顶级上市软件公司(在其年度文件中披露了一定程度的年度云计算支出)的云计算支出总额达到 80 亿美元。虽然其中的一些公司采用了混合云的方式 —— 公有云和本地部署(这意味着相对于我们的基准而言,云支出在 COR 中的比例可能较低)—— 但我们的分析也可以平衡这一点,只要假设承诺支出等于实际支出。根据我们与专家的对话,我们认为假设回迁使云支出减少了 50%,那么将会有 40 亿美元的节约成本产生。对于那些规模更大的、利用云基础设施的上市软件公司和消费互联网公司而言,这一数字可能要高得多。

虽然 40 亿美元的节约成本本身就很令人吃惊,但如果换算成未解锁的市值,这个数字就变得更加令人惊讶。由于所有公司在市场上都是以其未来现金流的现值来估算的,实现这一总额(40 亿美元的成本回收)所创造的市值增量将远超 40 亿美元。

是多少呢?一个粗略的指标是,看看公开市场如何评估额外的毛利:仍在烧钱的高增长软件公司通常以毛利的倍数作为估值,这反映了市场对公司长期增长和利润率结构的假设(常见的收入倍数也反映了公司的长期利润率,这就是为什么即使在增长率调整的基础上,毛利率较高的业务,收入倍数也往往会增加)。然而,这两种资本化倍数都是基于市场对公司未来现金流折现的预测方法。

在我们分析的50家上市软件公司中,企业平均总市值是2021年毛利的(基于发布时的CapIQ)24-25倍。换而言之:每节省1美元(或者说,毛利每增加1美元),市值便会增长24-25倍。(假设节省的费用是扣除了增量资本支出所产生的折旧费用(如果相关))。

这意味着,仅在这50家公司中,额外的40亿美元毛利预计可以产生额外的1000亿美元的市值。此外,由于使用毛利倍数(相对于自由现金流倍数),它假定了增量的毛利也与某些递增的经营支出有关,这种方法可能低估了每年节省40亿美元对市场产生的影响。

对于特定的公司来说,根据其具体估值,这种影响可能会更大。为了说明这一现象(并不是投资建议,详见下文和 https://a16z.com/disclosures/),以 Datadog 的基础设施监控服务为例。在发布报告时,该公司的股价接近 2021 年预计毛利的 40 倍,并在 S-1 中披露了对 AWS 三年累计 2.25 亿美元的使用承诺。如果我们将承诺支出折合成每年 7500 万美元的 AWS 成本,并假设其中会有 50% 或 3750 万美元的成本可以通过回迁得以节约,那么仅就削减支出而言,就能提高 15 亿美元的市值!

虽然这种粗略的分析方法从来都不完美,但大致方向是正确的:大型上市软件公司的市值受到云计算成本的拖累,损失高达数千亿美元。如果将范围扩大到企业软件和消费互联网公司,这一数字可能超过 5000 亿美元 —— 假设整个云计算支出的 50% 都是由规模较大的技术公司所消耗的,那么这些公司将从云计算的回迁中收益。

对于商业领袖、行业分析师和创建者来说,云服务的成本太高了,在做出长期或是短期的基础设施决策时,很难忽视其对市值的影响。

云计算的悖论

我们该何去何从?一方面,将工作量移出云端是一个重大决定。对于那些事先没有计划的人来说,必要的重建似乎非常不切实际,甚至是不可能的;任何此类工作都需要一个强大的基础设施团队,而这个团队可能还没有。而所有这些都需要专业知识,这不仅会分散注意力,还会影响公司增长。如果从规模上来看,云计算还是保留了许多好处 —— 比如按需分配的功能,以及支持新项目和新地区的大量即时服务。

但在另一方面,我们也在这篇文章中概述了这种现象,即当云计算的成本在某一时刻占据主导地位,数千亿的市值便会被抑制,并陷入一种悖论:如果你不开始使用云计算,你就是疯了;如果你坚持使用云计算,你也是疯了。

那么,企业如何才能从这种悖论中解脱出来呢?如前所述,我们并不是在为回迁阐明理由;相反,我们指出,基础设施应该是一个首要的指标。意思是,公司需要尽早、经常地进行优化,有时还需要在“云”之外进行优化。当你要建立一个大规模的公司时,基本就不能有任何教条主义。

虽然在思维方式的转变和最佳实践方面还有很多内容可以探讨,但有以下几个考量因素可以帮助企业解决云计算成本不断上涨问题。

将云计算的支出纳入 KPI。使基础设施成为首要指标的一部分,就要确保它是企业的关键绩效指标。以 Spotify 的 Cost Insight 为例,这是一个跟踪云支出的本地化工具。通过追踪云支出,不仅仅是财务团队,该公司的工程师也能够了解云支出情况。曾在 Digital Ocean 工作,现为 Vantage 公司联合创始人兼 CEO 的 Ben Schaechter 注意到,他们不仅看到了整个行业的公司在业务生命周期的早期将云计算成本指标与核心性能和可靠性指标放在一起,而且“曾被突如其来的云计算账单困扰的开发人员变得更加精明,期望他们的团队对云计算支出的方法更加严谨”。

激励正确的行为。将有关基础设施的首要 KPI 数据授权给工程师,虽然可以让他们意识到问题的存在,但不能改变他们做事的方式。一位业内知名的 CTO 告诉我们,他的一家公司投入了类似于在销售过程中使用的短期激励措施(SPIFFs),因此,只要工程师能够通过优化或取消工作量而节省一定数量的云计算支出,他们都可以获得一定奖金(由于节省的费用是经常性的,因此公司的投资回报率会很高)。他补充说,这种方法 —— “将痛点直接与能够解决问题的人相关联” —— 实际花费较少,他们在短短的六个月内为整个组织带来了 10% 的回报,整体支出降低了 300 万美元。值得注意的是,公司的 CFO 是支持这种非传统模式的关键。

优化,优化,优化。在评估任何企业的价值时,最重要的因素之一是销售成本或 COGS —— 企业每赚 1 美元的成本支出是多少?客户数据平台公司 Segment 最近分享了他们是如何通过对基础设施决策的逐步优化,将基础设施成本降低了 30%(同时在同期将流量增加 25%)。有许多第三方优化工具可以为现有系统提供快速收益,根据我们的观察经验,范围在 10%~40% 之间。

提前考虑回迁问题。云计算悖论的存在 —— 即云计算在早期更便宜,更好,而在公司发展的后期成本更高 —— 并不意味着公司必须被动地接受它而不做任何计划。确保你的系统架构师在早期就能意识到回迁的可能性,因为当云计算成本开始赶上甚至超过收入增长时,那就太晚了。即使在早期进行适度的或更模块化的架构投资 —— 包括能够将工作量转移到最佳位置而不被锁定的架构 —— 也能减少未来的回迁工作量。Kubernetes 的流行和软件容器化,使工作量更加便携,一定程度上是因为企业不希望被锁定在特定的云中。

渐进式回迁。没有理由不能以渐进的方式和混合方式进行回迁(如果这确实是你业务的正确举措)。除了非此即彼的讨论之外,我们还需要更多的细微差别:例如,回迁可能只对资源最密集的工作流的一部分有意义。不一定非此即彼!事实上,在与我们交谈的许多公司中,即使是最积极进行回迁工作量的公司,他们仍在云中保留了 10% 到 30% 或更多的工作量。

虽然这些建议主要针对SaaS公司,但对其他行业也有一定意义;例如,如果你是一个基础设施服务商,你可能想要考虑分摊成本的选择 —— 比如使用客户的云积分 —— 这样成本就不会出现在你的财报上。整个生态系统都需要考虑云计算的成本。


结论

这个行业是如何走到这一步的,很容易理解:云计算是优化创新、敏捷性和增长的完美平台。在一个由私募股权推动的行业中,利润率往往是次要的。这就是为什么新项目倾向于从云开始,因为公司优先考虑的是功能开发的速度而不是效率。

但现在,我们知道了(上云)的长期影响尚未得到充分理解 —— 这很有讽刺意味,因为超过 60% 的公司首先会把节约成本作为迁移到云端的理由。对于一个新的创业公司或新的项目来说,云计算是一个显而易见的选择。此外,为云计算就是提供灵活性,即使付出适度的“灵活性税”也是值得的。

问题在于,对于大公司 —— 包括规模化的初创公司 —— 这种税收相当于数千亿美元的股权价值,而且是在公司已经深深地致力于云计算(而且往往根深蒂固而无法自拔)之后征收的。有趣的是,早期转移到云计算的最常见的理由之一 —— 大量的前期资本支出(CapEx) —— 已经不再需要。在过去的几年里,公有云基础设施的替代方案已经有了很大的发展,可以完全通过运营费用(OpEx)而不是资本支出来构建、部署和管理。

需要注意的是,尽管我们在这里分享的一些数字看起来很大,但实际上我们的假设还是趋于保守。实际支出往往会比承诺的要高,而且我们没有考虑超额的弹性定价。因此,云计算对整个行业市值的实际拖累可能远高于我们的预期。

目前云计算服务商所享有的 30% 的利润率是否最终会在竞争中胜出并改变问题的严重性?不太可能。因为目前大部分的云计算支出都被三家寡头所垄断,Amazon、Google 和 Microsoft 三家公司总市值高达 5 万亿美元。有点戏剧化的是,虽然他们都受到了竞争的冲击,但仍然拥有很高的利润率,而较高利润率来自他们运营着自己的基础设施,使他们能够在产品和人才方面进行更大的再投资,同时提高自己的股价。

因此,在数千亿美元的情况下,这一悖论可能会以某种方式得到解决:公有云要么开始放弃利润;要么他们开始减少工作量。无论未来是何种情况,目前基础设施最大的机遇可能在云硬件和运行在上面的不匹配的代码之间。

*以上内容翻译自 https://a16z.com/2021/05/27/cost-of-cloud-paradox-market-cap-cloud-lifecycle-scale-growth-repatriation-optimization/,如需原文请与我们联系。

我们是以第一性原理研究为基础的专业机构,欢迎关注和留言。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论