技术教程 · 2026年4月11日 0

xAI的Colossus 2——世界首个千兆瓦级数据中心、独特强化学习方法与融资

关于xAI的Colossus 1已有大量报道。孟菲斯建设的这个项目值得载入史册:122天内从零开始建成的最大AI训练集群。拥有约200,000台H100/H200和约30,000台GB200 NVL72,它至今仍是最大的完全运营的单体集群(除Google外,后者是多数据中心训练的大师)。

然而,与OpenAI、Meta和Anthropic正在建设的千兆瓦级集群相比,Colossus 1的约300兆瓦显得相形见绌。他们的超大规模合作伙伴乐于利用他们的资产负债表,并通过投入大量资金来赢得市场。

xAI的能力是否只是一次性的奇迹?今天我们将公开一些来自我们过去一年行业领先的数据中心模型的数据,这些数据可供客户访问。这是我们预测Oracle交易提前数月的专有数据。

简短回答:不是。xAI仍然处于前沿AI竞赛的前列,并且有望在计算能力上再次超越大多数竞争对手。据我们估计,其单个训练集群的总数据中心容量将在2025年第三季度超过Meta超级智能和Anthropic。数据中心容量将准备就绪,GPU可以移入,再次创造世界上最大的单个数据中心。xAI需要为这些GPU筹集资金,但他们已经从NVIDIA获得了分配,可以在明年初完全大规模训练模型。

埃隆想出了一个新的天才技巧来在上市时间上击败竞争对手。Colossus 2将是比xAI的第一个集群更令人印象深刻的成就。让我们深入探讨。

本报告的前半部分将深入探讨Colossus 2的实力。后半部分将讨论Grok模型、我们对xAI的中长期看法,以及xAI正在使用的独特强化学习方法,这可能会使他们超越OpenAI、Anthropic和Google。

原文: https://semianalysis.com/2025/09/16/xais-colossus-2-first-gigawatt-datacenter/