OpenAI放弃甲骨文阿比林星门项目扩建的真实原因

0561news 3 0

OpenAI放弃甲骨文阿比林星门项目扩建的真实原因

  作者:安妮莎・加迪齐

  金融与数据中心行业高管们都在热议彭博社上周五的一篇报道:甲骨文与 OpenAI 将不再为这家 ChatGPT 开发商在得州阿比林扩建数据中心 —— 双方正是在此地落地了首批以 “星门” 命名的设施。

  据我后续了解,OpenAI 已于数周前拒绝扩大在该数据中心的使用规模。一名参与谈判的人士透露,甲骨文原本仍计划为其他 AI 客户扩建该园区,但上周末最终决定放弃。

  所有人都在猜测:这一消息是否意味着 AI 算力需求正在降温?

  简单来说:不是。

  OpenAI 放弃扩建,是有明确原因的。

  等到阿比林扩建项目建成时,英伟达将开始交付下一代薇拉・鲁宾(Vera Rubin)芯片系统。OpenAI 希望为这批新芯片另选新址,而非放在现有园区 —— 目前园区使用的是这一代布莱克韦尔(Blackwell)芯片。

  一名 OpenAI 内部人士称,公司不愿在同一园区混用两代英伟达芯片,更倾向于将鲁宾芯片集中部署在可灵活扩建的新设施中。OpenAI 并未解释为何有此偏好。

  根据双方的星门协议,OpenAI 仍在与甲骨文合作开发得州及新墨西哥州的其他数据中心项目,规划总算力规模高达惊人的4.5 吉瓦(GW)。

  现有的阿比林园区已完成 25% 建设,预计今年晚些时候全部完工后,将为 OpenAI 提供约1.2 吉瓦供电容量。

  在 OpenAI 决定不再超此规模扩建后,甲骨文曾找到另一家有意接手的客户。但原因尚不完全明确,甲骨文最终也放弃了这次扩建。

  故事并未就此结束。

  甲骨文此前已与英伟达紧密合作,重新设计扩建楼宇,以便搭载更先进的新一代芯片集群。因此在甲骨文退出后,英伟达希望项目继续推进。

  目前英伟达正洽谈租赁该园区,并已向场地所有者与开发商 Crusoe 支付了1.5 亿美元定金。据交易相关人士透露,英伟达正在与包括 Meta 在内的至少两家意向客户洽谈,目前谈判仍处于初期阶段。

  数据中心延期、取消与涨价将成为今年的一大主题,但这些信号的解读并非总是直白。正如我们此前报道,并非每一次延期都代表同一含义。

  英伟达 GTC 大会:Groq 技术动向

  距离英伟达年度 GTC 开发者大会仅剩一周,我与行业消息人士交流了他们的预期。

  其中最重磅的官宣之一,可能是英伟达推出一款专注于AI 推理(运行模型而非训练模型)的全新芯片,将整合推理芯片设计公司Groq的技术。

  英伟达去年底挖走了 Groq 核心管理团队,并以200 亿美元的价格获得其技术授权。

  我获悉,OpenAI 预计将成为这款新芯片的官宣客户,并可能用于支撑其代码智能体 Codex 产品。《华尔街曰报》此前已报道过这款新芯片,并指出 OpenAI 可能成为大客户。

  考虑到路透社近期报道称 OpenAI 对英伟达 GPU 不满,并将 Codex 的性能问题归咎于芯片,这一官宣将格外值得关注。

  部分受访人士认为,此举更重要的意义在于:英伟达正式承认了行业争论多年的观点 ——

  要处理从代码生成到其他复杂任务的不同 AI 工作负载,可能需要使用多种类型 AI 芯片(异构硬件)。

  长期以来,英伟达的口径一直是其 GPU 能胜任一切。

  或许英伟达认为,Groq 最有机会与英伟达芯片协同实现 AI 推理。无论如何,这笔交易为其他 AI 推理芯片初创公司注入了新活力 —— 这些公司的领导者早已等待证明:英伟达之外的替代方案是必需的。

  下周我将和同事们一同前往圣何塞,欢迎前来打招呼!

  谷歌 TPU 势头崛起

  上周多位行业高管的表态,以及谷歌关联企业的投资者材料,都开始显现一个信号:

  谷歌正在悄悄为自家 AI 芯片(TPU)打造大规模市场,未来有望挑战英伟达的主导地位。

  最新线索来自 ** 博通(Broadcom)** 首席执行官谭永良(Hock Tan)—— 博通为谷歌设计 TPU。

  他在上周财报 *** 会议上表示,预计到 2027 年,Anthropic 的 TPU 使用量将增至三倍,容量超过 3 吉瓦,足以供应三座圣迭戈规模的城市。

  我们认为,这一数字仅包含 Anthropic 直接从博通采购的 TPU;若加上从谷歌云租赁的部分,总功耗还会更高。

  据芯片相关人士估算,1 吉瓦 AI 数据中心可支持超过 70 万个 TPU。若 Anthropic 按谭永良所说的规模扩张,明年其运营 TPU 数量将超过 200 万个,足以匹敌当前其他企业运营的英伟达顶级芯片集群。

  Anthropic 并非谷歌 TPU 的唯一客户。Meta 刚刚与谷歌云签署数十亿美元协议,租赁 TPU 用于训练 AI 模型,未来也可能像 Anthropic 一样直接向博通采购。

  正如我们近期报道,谷歌还与至少一家投资机构达成协议,成立合资公司,向其他客户出租 TPU。

  谭永良在博通财报会上表示:“2027 年及以后,我们预计下一代 TPU 的需求将更加强劲。”

  谷歌计划的另一线索来自一家名为Fluidstack的初创公司。

  该公司 2017 年在伦敦成立,近期迁至纽约,定位为中间商 —— 在谷歌推动 TPU 走出自有基础设施的过程中,帮助建设与运营大型 TPU 集群。Fluidstack 想为 TPU 做的事,就像 CoreWeave 为英伟达 GPU 做的一样。其首个重大项目正是支撑 Anthropic 的 TPU 集群。

  据 Fluidstack 向投资者披露的信息,谷歌已为其在 Anthropic 使用 TPU 的数据中心提供数十亿美元债务担保与一项租赁承诺。该初创公司还在销售用于提升集群效率与可靠性的软件。

  Fluidstack 向投资者表示,预计首批 TPU 集群项目将从 Anthropic 获得12 亿美元软件收入;若合作扩大,合同规模有望接近60 亿美元,但未披露收入实现时间。

  Fluidstack 还向投资者展示了更宏大的目标:为谷歌自身运营 TPU 数据中心。

  这一信号意义重大:可能意味着谷歌内部已无法满足 TPU 需求,需要依赖第三方管理算力,类似微软依靠 CoreWeave 等云服务商获取更多 GPU。

  这种潜在需求,或许就是 Fluidstack 向投资者透露今明两年5 吉瓦数据中心算力需求的原因。目前尚不清楚 Fluidstack 能否满足这一需求,但据两名知情人士透露,该公司正寻求以更高150 亿美元估值进行新一轮融资。