本文翻译自 The Information,作者 Anissa Gardizy,Qianer Liu
据参加会议的人说,去年圣诞节前后,Nvidia 首席执行官黄仁勋召集公司高管召开了一系列会议,讨论一个日益严重的问题:Nvidia 最大的客户是否会用完数据中心空间来安装其人工智能芯片,这可能会损害销售。
黄告诉同事们,他担心亚马逊网络服务公司和微软等云服务器提供商(最近几个季度他们总共购买了大约一半的英伟达人工智能服务器芯片)没有足够快的速度来建立新的数据中心和电源,以容纳它们订购的芯片(即图形处理单元)。据 Nvidia 的一名员工以及几位客户和数据中心运营商称,会议结束后,Nvidia 的管理人员加快了询问云提供商是否有足够的空间和电力来容纳他们的订单的步伐。
“数据中心提供商 DataBank 的首席执行官劳尔-马蒂内克(Raul Martynek)说:“除非客户能证明他们的数据中心有能力放置 GPU,否则 Nvidia 不会交付 GPU。” 黄仁勋已成为商界巨星,也是人工智能热潮的首席啦啦队长,这股热潮推动了他的微芯片公司实现了前所未有的增长和利润,使其价值达到了与微软和苹果公司同样的 3 万亿美元水平。但是,在风光无限、当之无愧的胜利背后,黄仁勋和他的同事们也在集中精力应对企业面临的下一个威胁–对 Nvidia 芯片的需求最终可能会放缓。
为了防范这种可能性,Nvidia 开始向人工智能开发者出售更多软件,一年前甚至成立了自己的服务器租赁业务 DGX Cloud。此举使其直接与最大的客户–微软和 AWS 等云计算提供商展开竞争。奇怪的是,DGX Cloud 是在 Nvidia 驱动的服务器集群上运行的,它从这些云提供商那里租用了这些服务器。然后,Nvidia 以更高的成本将这些服务器租给自己的客户,并向他们承诺更好的计算性能。
此举在业内造成了紧张局势。最大的云计算提供商 AWS 最初拒绝让 Nvidia 在 AWS 数据中心内开辟自己的竞争对手业务。但在 AWS 的所有小竞争对手都同意英伟达的条件后,AWS 松口了,表示将提供搭载英伟达较新人工智能芯片的 DGX 云,而其他云提供商还没有这种芯片。AWS 也可能担心在芯片难以获得的时候惹恼一个重要的供应商。据一位参与讨论的人士称,去年秋天,Nvidia 甚至考虑为 DGX Cloud 租用自己的数据中心。此举将完全摒弃云计算供应商。Nvidia 最近还聘请了 Meta Platforms 的高级主管 Alexis Black Bjorlin 负责云计算业务。目前还不清楚 Nvidia 是否计划为 DGX Cloud 建立自己的数据中心。
在 Nvidia 采取这些措施的同时,其销售人员也在不遗余力地了解客户使用 Nvidia 芯片的情况。最近,Nvidia 的销售人员正在向云提供商询问的问题包括:他们的客户是谁,以及他们在租用这些服务器时签署了什么样的承诺。这些问题的答案可以帮助 Nvidia 提前制定销售计划,也可以帮助它了解自己的云服务器租用业务的潜在客户。
在管理这些不同工作的同时,黄仁勋仍然意识到一个可能影响销售的因素:购买其芯片的大型科技公司正在进行一项回报不确定的巨额投资。微软、Meta、埃隆-马斯克(Elon Musk)的 xAI 和其他公司都在使用芯片来训练实验性的新人工智能模型,但这并不会立即产生收入。当 Meta 公司首席执行官马克-扎克伯格(Mark Zuckerberg)在 4 月底承认收入的不确定性时,由于投资者对这种情况表示不满,该公司股价大幅下跌。可以想象,投资者的压力可能会促使其中一些公司撤回芯片采购。
与此同时,微软、AWS 和其他云计算提供商对传统计算工作负载(而不仅仅是人工智能)的需求也在回升,因此,据两位在一家主要云计算提供商工作的人士以及几家数据中心运营商的高管透露,他们无法只为容纳 Nvidia 芯片而扩建数据中心。
同事和客户说,考虑到这些问题,黄仁勋一直在谨慎管理 Nvidia 分配芯片的方式,这样就不会有一家公司积累过多的芯片。他还试图影响客户在数据中心组装 GPU 的方式,推动他们遵循 Nvidia 认为能带来更好计算性能的服务器机架设计。
但据 Nvidia 公司及其一些客户的人士称,如果客户日后想改用竞争芯片,按照 Nvidia 公司的建议会使他们更难改用。一位参与谈判的人士说,这导致了与微软这一重要客户的定期对峙,争论的焦点是这家云计算提供商计划如何安装 Nvidia 即将推出的芯片。
此外,Nvidia 还希望从连接其芯片服务器的电缆、机架和其他硬件中榨取尽可能多的收入,这可能会牺牲戴尔等长期生产 Nvidia 芯片服务器的服务器制造商的利益。
所有的杠杆
与核心服务器芯片业务相比,Nvidia 销售软件和云服务的收入微不足道。但去年 8 月,Nvidia 首席财务官科莱特-克莱斯(Colette Kress)表示,这些新业务的年收入已有望达到数亿美元,三个月后,她又表示,到 2023 年,这些新业务的年收入有望超过 10 亿美元,这意味着它们现在约占 Nvidia 总收入的 1%。相比之下,其核心服务器芯片业务去年的收入为 475 亿美元。
今年 5 月,Nvidia 披露已承诺斥资近 90 亿美元向顶级客户租用云服务器,主要用于内部研发,但也用于促进云服务器租用业务。一些客户和前员工认为,这项业务最终会使 Nvidia 免受不可避免的芯片衰退的影响,并使租用其服务器的客户更难寻求替代芯片。
Nvidia 前高管、现任风险投资公司 Playground Global 合伙人萨沙-奥斯托伊奇(Sasha Ostojic)说,云计算和软件产品 “没有得到分析师和技术界的重视”,而这是一项每年可创造数百亿美元收入的业务。他说,”Nvidia 拥有发展与芯片互补的服务所需的一切杠杆”。
除了潜在的丰厚收入流之外,DGX Cloud 还成为 Nvidia 帮助部分客户过渡到新一代芯片的一种方式。例如,软件制造商 ServiceNow 一直为自己的数据中心购买 Nvidia 服务器,现在也直接从 Nvidia 租用这些服务器。
ServiceNow 总裁 C.J.Desai 说:”去年,当 GPU 的需求’如此之高’时,我说,’嘿,Jensen,我可能需要更多的 [服务器]’。黄告诉他”黄告诉他:”这完全没问题,但你应该能够将容量提升到 DGX Cloud。
Desai 说,ServiceNow 的人工智能雄心 “非常依赖 “Nvidia 的产品,包括今年早些时候推出的软件,帮助公司在应用程序中高效运行人工智能。德赛拒绝讨论其公司在这些产品上的投入,但表示投入一直在增长,ServiceNow 已经拒绝了竞争对手云计算和芯片公司的报价,因为其工程师非常喜欢 Nvidia 的 “全堆栈”。
Nvidia 发言人拒绝让黄仁勋接受本文采访。”我们每天都在向客户证明我们的价值。Nvidia 为客户提供最低的总体拥有成本、卓越的性能,以及从芯片到系统、软件和算法等各个层面的创新,”该发言人说。
黄仁勋的举动反映了他作为创始人的偏执,在公司发展史上,包括 1999 年上市之后,他曾多次经历险境。例如,去年圣诞节期间的会议可能只是将公司推向高峰的公式的一部分–将其 GPU 变成 OpenAI、生物技术和制药公司、量化交易公司和其他数十家人工智能开发商的命脉。
杰夫-赫布斯特(Jeff Herbst)说:”Nvidia 没有自满情绪。”赫布斯特是一位风险投资家,他在 Nvidia 工作了 20 年,直到 2021 年才开始负责业务开发和收购。”从会议的基调或基调上,你真的不知道时局是好是坏。”
科技界的泰勒-斯威夫特
31 年前,Nvidia 开始为 PC 游戏系统销售图形处理器。2006 年,黄仁勋推出了 “计算统一设备架构”(Compute Unified Device Architecture),这是一种利用图形芯片提供的计算能力的编程语言,为 Nvidia 最近的崛起奠定了基础。CUDA 通过自动构建利用芯片的应用程序,节省了开发人员的时间。近年来,CUDA 已成为影响 Nvidia 销售额的一个重要因素:数以百万计的程序员不想费力学习如何使用竞争对手的芯片编程。
在谷歌等人工智能开发商开始利用 Nvidia 芯片训练被称为深度神经网络的大型机器学习模型之后,Nvidia 的销售额在 2010 年代开始飙升。这些人工智能模型帮助公司为个人客户量身定制网站和广告,并提高了面部识别的准确性和语音助手识别人声的能力。黄仁勋也有过失手的时候,其中包括为自动驾驶汽车开发软件(而不仅仅是芯片)的大胆尝试,这涉及到雇佣一个庞大的工程师团队。这个计划没有成功。但该公司在 2019 年以 70 亿美元收购了 Mellanox Technologies 公司,从而在企业数据中心(其人工智能芯片越来越多地应用于这些地方)获得了更强的立足点。
“他想彻底改变医疗保健、机器人技术和制造业,为了实现这一目标,他想’我现在需要做什么才能实现这一目标?
OpenAI 推出的 ChatGPT 是在微软数据中心使用英伟达(Nvidia)芯片构建的,这引发了芯片制造商前所未有的繁荣。几乎所有大型技术公司和无数其他开发商都争相购买 GPU,以开发自己的对话式人工智能和根据人们想看的内容描述生成图像和视频的模型。Nvidia 还为其中数十家开发商提供了资金,包括 Mistral、Cohere、Runway、Wayve、Figure 和 Perplexity。自 ChatGPT 发布以来,Nvidia 的市值已经增长了 8 倍,达到 3.2 万亿美元,在 6 月 5 日,Nvidia 曾短暂超越苹果,成为全球第二大最有价值的上市公司。
存储公司 Box 的首席执行官亚伦-列维(Aaron Levie)说:”如果你是 Nvidia,你真正想要的是这个由更好的软件服务组成的非常强大的飞轮,让客户留在你的轨道上。”我认为,[黄]在这方面做得很好。
在 6 月第一周于台北举行的科技产业大会 Computex 上,大批媒体追着黄仁勋满城跑。为了显示黄仁勋的名气,网上出现了一张 “黄仁勋美食地图”,上面标注了这位身着黑色皮夹克的高管经常光顾的餐厅,被誉为最时髦的台北美食指南。
“Meta 首席执行官马克-扎克伯格(Mark Zuckerberg)今年 3 月在 Instagram 上发布了一张自己与黄仁勋的合影后说:”他就像泰勒-斯威夫特(Taylor Swift),不过是科技界的泰勒-斯威夫特。
虽然 61 岁的黄仁勋已经风光无限,但他一直在处理与微软等公司的棘手关系,这些公司在购买 Nvidia 芯片的同时,也在努力减少对这些芯片的依赖。
别成为思科
一次性芯片销售业务存在固有的脆弱性:尽管销售额一直在快速增长,但随着需求不可避免地降温,销售额可能会下降。
对 Nvidia 来说,没有稳定新利润来源的未来可能并不美好:正如许多评论家所指出的那样,2000 年,思科系统公司(Cisco Systems)在互联网泡沫的高峰期,通过销售路由器突然成为世界上最有价值的公司,当时电信公司建立了新的数据中心,但由于基于互联网的收入未能像技术高管和投资者想象的那样实现,这些数据中心被闲置。当思科的硬件成为一种广泛使用的商品时,它经历了销售下滑,至今仍未恢复元气。
黄仁勋曾私下告诉同事,Nvidia 必须确保自己不会落得像思科或 Sun Microsystems 这样的下场。Sun 在 20 世纪 90 年代成为服务器和计算机硬件领域的巨无霸,但在泡沫破灭后,该公司没有抓住蓬勃发展的软件市场,而微软和其他公司抓住了这一市场。”一位 Nvidia 的员工说:”他试图提醒人们不要被’Sunned’。
在过去的几个月里,Nvidia 推出了几款软件产品,希望借此实现硬件业务的多元化。在今年 2 月的财报电话会议上,黄仁勋将 Nvidia AI Enterprise 描述为 “人工智能操作系统”,客户可以用它来训练和运行人工智能。Nvidia 对每块 GPU 每年收取 4500 美元的软件使用费。”我的猜测是,世界上的每家企业、每家软件企业公司……都将在 Nvidia AI Enterprise 上运行,”黄仁勋说。”因此,随着时间的推移,这将可能成为一项非常重要的业务。”Nvidia 表示,设计软件制造商 Adobe 和网络安全公司 CrowdStrike 都是该系统的客户。
帕德瓦尔说:”他不是在卖芯片,而是在卖 GPU、软件和现代数据中心的系统。”人们认为它只是一家 GPU 公司,但它远不止于此。
即使软件业务不能像 Nvidia 希望的那样快速增长,它也能提高公司芯片的忠诚度,并使其核心业务免受更廉价竞争对手的冲击,包括各大云提供商试图出售的人工智能芯片,作为 Nvidia 芯片的替代品。
存储公司 Box 的首席执行官亚伦-列维(Aaron Levie)说:”如果你是 Nvidia,你真正想要的是这个非常强大的飞轮,它能提供更好的软件服务,将客户留在你的轨道上。”Box 租用 Nvidia GPU,并向自己的客户转售 Nvidia 用于运行人工智能的软件。”我认为,[黄]正在很好地执行这一战术”。
与微软角力
为了获得更多的硬件收入,Nvidia 公司正试图对其最大客户购买和安装 GPU 的方式施加更多影响。通常情况下,大型云计算提供商会为自己的客户搭建服务器机架,这些机架被用于其全球数据中心和各种芯片。但据几位参与谈判的人士称,当 Nvidia 就其下一款旗舰芯片 GB200 与客户接触时,Nvidia 试图说服他们完全按照自己的设计购买机架。
今年,微软和 Nvidia 在这个问题上争吵了几个星期。据参与谈判的人士称,Nvidia 公司副总裁安德鲁-贝尔(Andrew Bell)要求微软的同事购买一种服务器机架设计,其尺寸与微软数据中心使用的机架相差几英寸。这种变化将妨碍微软在不同人工智能芯片之间轻松切换的能力。贝尔表示,同意购买英伟达服务器机架设计的客户可以率先获得新芯片,但微软高管对此表示反对。
据一位参与此事的前微软高管称,微软高管已经感到了购买 Nvidia 网络电缆(Nvidia 服务器之间的连接线)的压力,因为他们相信 Nvidia 会优先购买此类产品,而不是那些只涉及其 GPU 的产品。这位人士说,截至 2023 年初,Nvidia 网络芯片和电缆约占微软购买 Nvidia 产品支出的三分之一。
一位相关人士说,关于服务器机架设计的争议最终闹到微软首席技术官凯文-斯科特(Kevin Scott)和首席执行官萨蒂亚-纳德拉(Satya Nadella)的办公桌上。最后,英伟达让步,同意让微软为 GB200 芯片设计自己的定制机架。(据两名 Nvidia 员工称,谷歌和 AWS 也有望为 GB200 生产定制机架)。
但是,Nvidia 最终可能还是要从小客户购买的 GB200 机架上赚取更多的利润。据两名参与该计划的 Nvidia 员工称,与往年不同的是,Nvidia 今年计划先设计和采购容纳 GB200 芯片的服务器和机架的材料,然后再将其交给制造并最终销售这些服务器和机架的服务器制造商。这一变化将损害服务器制造商戴尔、HPE 和 Supermicro 的利益,因为它们过去主要设计此类硬件。据一家大型服务器装配商的经理称,这些公司从自己设计的机架中获得的利润要高于使用 Nvidia 设计的机架。(戴尔和 Supermicro 的发言人和高管没有回应书面置评请求。HPE 发言人拒绝发表评论。)
厚此薄彼
在努力打造新的软件业务的同时,黄仁勋也在试图最大限度地提高硬件销售额的增长,同时确保没有任何一家客户能够凌驾于 Nvidia 之上。这或许可以解释为什么上周甲骨文公司(一家规模相对较小的云服务器提供商)宣布将获得大量 Nvidia 芯片,并在明年初开始将其出租给微软和 OpenAI。微软本希望直接购买这些芯片,但一位知情人士表示,微软可能很难为这么多新芯片找到空间和电源。
黄仁勋还与另一家小型云计算供应商 CoreWeave 保持着特殊的关系,这家公司去年的收入从 2022 年的 2500 万美元飙升至数亿美元,因为它以牺牲大型云计算供应商的利益为代价,获得了 Nvidia GPU 的慷慨分配。微软也不得不从 CoreWeave 租用 GPU 服务器容量来满足自己的需求。
可以肯定的是,Nvidia 的硬件销售并没有面临迫在眉睫的风险。该公司凭借其无与伦比的技术,在截至 4 月份的 9 个月内创造了 400 亿美元的自由现金流,而且该公司表示,今年晚些时候即将推出的下一代旗舰芯片的需求量将达到顶峰。
Nvidia 的 Kress 在 5 月份表示,政府或政府支持的公司购买 GPU 将导致今年的销售额达到 “高个位数十亿”,这意味着客户群还有很大的发展空间。
芯片研究公司 SemiAnalysis 的首席分析师迪伦-帕特尔(Dylan Patel)说,尽管如此,在过去一年里,在云上租用 Nvidia 的 H100 芯片的价格下降了近 30%,这可能预示着放缓即将到来。他说,与去年相比,企业也可以更容易地租用芯片,而无需与云提供商签订多年协议。
另一个问题:虽然最大的科技公司拥有处理 Nvidia 最先进芯片的专业技术,这些芯片需要特殊的冷却和其他条件,但许多初创企业、跨国公司、政府和学术买家却不具备这种技术,据其中一些客户以及与他们有业务往来的公司称。因此,尽管 Nvidia 旗舰 H100 芯片在去年出现长期短缺后,今年变得更容易找到,但不太成熟的买家并没有按照预期的方式使用它们–本质上,这就像他们在缓慢的城市道路上驾驶法拉利一样。
这意味着随着 Nvidia 芯片变得越来越昂贵,其中一些客户可能不想升级。”云计算服务公司 Cloudflare 首席执行官马修-普林斯(Matthew Prince)说:”我们发现,很多时候你并不需要最新一代的 Nvidia GPU 就能获得很好的性能。