首页文章详情

打造全球超大型数据中心,到底有多难?

神译局2026-05-05 08:00
目前的共识是:规模必须足够大。

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:一座巨型数据中心,正在倒逼工程师彻底打破行业旧规则。本文来自编译,希望对您有所启发。

人类对更智能(如今意味着更大规模)AI 模型的需求永无止境,再加上现有 AI 技术的全面普及,全球数据中心建设迎来爆发式增长,项目数量与建设规模都创下历史新高。其中最受瞩目的,是Meta 2025 年 6 月官宣、落户美国路易斯安那州的亥伯龙(Hyperion)数据中心,总供电容量高达 5 吉瓦。Meta 首席执行官马克・扎克伯格表示,Hyperion的占地面积将堪比大半个曼哈顿城区;项目一期供电容量 2 吉瓦,计划 2030 年竣工。

虽说 5 吉瓦的超大体量放眼行业无出其右,但如今全球已有数十个同类巨型项目同步推进。建筑数据平台 ConstructConnect 首席经济学家迈克尔・古克斯透露:2025 年 7 月前,全球数据中心投入已突破 270 亿美元;全年总额轻松超 600 亿美元,仅Hyperion一个项目,就占到总投入的四分之一。

对负责落地这些工程的工程师而言,眼下的挑战前所未有。顶尖科技巨头不惜重金,全力加码算力、散热、网络三大核心技术,打造五年前根本不敢想象的超大规模基建。

但极速建设的背后,隐患重重。大型数据中心施工需要涌入大量临时务工人员,直接引发噪音扰民、交通拥堵、环境污染,还常常推高当地电价。而且 AI 数据中心全年 24 小时不间断超高耗电,建成后的环保压力依旧巨大。最新研究显示,仅美国境内,这类数据中心每年碳排放就可达数千万吨二氧化碳当量。

即便问题频发,头部 AI 企业与工程师仍在全速推进巨型数据中心建设。那么,打造一座史无前例的超大型数据中心,究竟要攻克哪些难关呢?

AI 彻底改写建筑设计标准

传统数据中心,都是钢筋混凝土地基搭配钢结构骨架,再浇筑混凝土墙体,只需要搭建稳固的建筑外壳就行。Meta 甚至曾搭建巨型临时帐篷,快速落地简易数据中心。

可顶级 AI 数据中心的超大体量,催生了无数全新难题。建筑咨询公司雅各布副总裁罗伯特・黑利说:最大的难题藏在地下。地基土质松软、易腐蚀、易膨胀,都会延误工期,必须投入高额成本加固改造。

工程设计公司斯坦泰克资深技术负责人阿曼达・卡特补充,土壤导热性同样关键,因为绝大多数电力设施都埋在地下。如果土壤导热差,设备产生的热量散不出去,极易引发故障。开工前,工程师往往要采集成百上千份土壤样本反复检测。

算力硬件:机柜堪比重型设备。如今 AI 数据中心普遍采用机柜级集成系统,比如英伟达 GB200 NVL72 整机柜。单柜集成 72 块 GPU、36 颗 CPU,显存最高可达 13.4TB;机柜高 2.2 米,净重超 1.5 吨。这就要求数据中心必须加厚混凝土、强化钢筋承重,远超普通建筑标准。单个 GB200 机柜最高耗电 120 千瓦。若Hyperion满负荷实现 5 吉瓦供电,园区可部署超 4.1 万套机柜,搭载算力芯片总量突破 300 万块。未来新一代 GPU 功耗、性能更强,最终装机数量会略有缩减,但能耗压力只会更大。

资金投入:千亿级豪砸基建。据统计,2025 年前七个月全球数据中心投入近 270 亿美元,全年预估逼近 600 亿美元。仅 Meta 的 Hyperion 项目,耗资就高达 100 亿美元。如今数据中心建设,已经成了建筑业的核心支柱。在住宅、公共基建需求萎缩的大背景下,ConstructConnect 发布的 2025 年三季度财报直言:若非数据中心新项目狂砸 1100 亿美元托底,建筑业衰退会严重得多。

充足的资金,让企业彻底摒弃传统省钱思路。AI 热潮前,数据中心优先追求低成本、易施工;如今只拼速度、拼规模。超大预制混凝土墙板、楼板全面普及:部分楼板跨度可达 23 米,每平方米承重上限高达 3000 公斤,是通用工业建筑国标上限的两倍多。很多构件还要单独定制,放在过去,根本不具备经济效益。

工期也被大幅压缩:算力基建企业克鲁高管透露,过去 30~36 个月的工期,如今最快 12 个月就能完工。极速赶工之下,人力、物料调配难度陡增。

Hyperion选址路易斯安那州里奇兰乡村教区,当地常住人口仅 2 万,施工期却涌入至少 5000 名临时工。高薪岗位带动周边餐饮、小店短期增收,但也引发居民投诉:交通拥堵、施工噪音、粉尘污染,再加上全天候施工带来的光污染,矛盾不断加剧。同时,施工还会破坏地下水层、影响污水排放,部分依赖井水的居民水质受损,已有美国城市直接出台禁令,拒绝新建数据中心。

电力刚需:基本都是 “自建供电”

电力,是 AI 数据中心的头号难题,也是环保争议的核心。传统数据中心选址,优先靠近供电稳定、响应及时的电力枢纽。美国弗吉尼亚州电力企业会配套新建清洁能源电站,保障园区用电。

但顶级 AI 数据中心的耗电量,早已超出常规电网承载能力。加州劳伦斯伯克利国家实验室数据显示:2014 年,全美所有数据中心总耗电均值仅 8 吉瓦;如今一座顶级 AI 园区耗电就能达到 1 吉瓦,Hyperion更是高达 5 吉瓦。

清洁能源机构项目负责人阿贝・拉马南坦言:数据中心,是各大电力企业最头疼的难题。为应对突发超高用电,很多老旧高污染的化石燃料应急电站本该淘汰,如今又被迫重启服役。

Meta 为解决Hyperion供电,直接和路易斯安那州电力企业安特吉合作,新建三座燃气轮机发电站:两座落地园区周边,一座布局州东南部。安特吉表示,Meta 全额承担电站建设费用,不会增加普通居民电费。但彭博社调研发现,绝大多数落地数据中心的区域,电价都会上涨,Meta 这个案例实属特例。

碳排放压力巨大。2025 年《自然》期刊研究预测:到 2030 年,仅美国数据中心每年碳排放就高达 2400 万至 4400 万吨二氧化碳当量。除了混凝土建材生产排放,绝大部分污染都来自 AI 服务器的超高耗电。Hyperion三座新建燃气电站,全生命周期每年碳排放预估 400 万至 1000 万吨,堪比拉脱维亚整个国家的年度排放量。

数据中心一般以混凝土搭建主体,再用钢材做骨架,加固并支撑混凝土外墙结构。地基通常采用现浇混凝土,而墙体与楼板大多使用预制混凝土板材,最大跨度可达 23 米。楼板采用类似钢梁的加固 T 型结构,最厚处宽度可达 1.2 米。大型数据中心,往往要用上数百块这种混凝土板材。美国水泥协会预计,接下来三年,这波大规模建设热潮会消耗 100 万吨水泥。不过这个用量,在整个水泥行业里占比仍然很小 ——2024 年全美水泥总产量就有约 1.03 亿吨。

这几座发电厂总装机发电量可达 2.26 吉瓦,均采用联合循环燃气轮机,能回收废气中的余热再利用。这种技术可将热效率提升至 60% 以上,让更多燃料转化为可用电能。相比之下,简易循环燃气轮机直接排放废气,热效率仅维持在 40% 左右。

即便用上高效机组,Hyperion 配套电厂的全生命周期年碳排放量,仍会达到 400 万至 1000 万吨二氧化碳,具体取决于机组启用频次与建成后的实际能效标准。排放量最高时,相当于 200 多万辆私家车一年的尾气总和。

好在 Meta 并非所有数据中心都采用这种供电方式。该公司已宣布,俄亥俄州的大型数据中心项目普罗米修斯,计划 2026 年底投产,将全程使用核能供电。但其他科技巨头为了快速建成数据中心,纷纷选择能效更低的供电方案。

极致案例当属落户孟菲斯的 xAI巨神二号数据中心:企业直接运来数十台临时燃气轮机发电机,给这片城郊园区供电。而 OpenAI 落户得州阿比林的星际之门新数据中心(预计 2026 年下半年投用),也配备了总功率最高 300 兆瓦的燃气轮机。这两家使用的都是简易循环机组,能效远低于安特吉为亥伯龙打造的联合循环发电厂。

目前燃气轮机供不应求,新机订单最长要排队七年。部分数据中心为了赶工期,甚至改造翻新退役航空发动机,拿来充当发电轮机。

AI 机柜:新定义承重与能耗

如今对全新稳定电力的迫切需求,根源在于现代 AI 数据中心里功耗惊人的显卡(GPU)。2025 年 1 月,马克・扎克伯格发文宣布:Meta 计划在 2025 年底,投入运营至少 130 万块 GPU。OpenAI 的星际之门数据中心,规划搭载超 45 万块英伟达 GB200 显卡;xAI 的巨神二号(巨神一期扩建项目),设计装机容量更是突破 55 万块 GPU。

目前,GPU 仍是 AI 算力任务的首选核心硬件。它们被集成组装成一体化机柜,尺寸堪比大型柜体;和存放它们的数据中心一样,这些机柜的重量、结构复杂度、耗电量,都在飞速飙升。

除了强悍的算力,英伟达 GB200 NVL72 整机柜还需要超大容量内存。一台 GB200 NVL72 机柜,最高可搭载 13.4TB 高带宽内存。像亥伯龙这种超大型数据园区,整体内存储备至少需要几十 PB。暴涨的需求直接推高了内存价格:2025 年,DRAM 内存(尤其是 DDR5 型号)价格涨幅高达 172%。

亥伯龙数据中心共有 11 栋主楼,总供电容量达 5 吉瓦。按每栋楼配置相近来算,单栋楼耗电接近 500 兆瓦,这电量足以供给大约 420 万户美国家庭使用。单单这座坐落于里奇兰教区的亥伯龙数据中心,耗电量就已是 xAI “巨神” 数据中心的两倍。而后者在 2024 年夏季建成时,还曾是全球规模顶尖的超大型数据中心之一。

英伟达 GB200 NVL72 整机柜系统,是当前 AI 数据中心的主流首选方案。单台机柜内置 72 块显卡、36 颗处理器,最高配备 17TB 内存;机柜高 2.2 米,最重可达 1553 公斤,功耗约 120 千瓦,相当于 100 户美国家庭的总用电量。英伟达表示,这还只是起步阶段,未来单台机柜功耗或将飙升至 1 兆瓦。

维帝公司基础设施解决方案高级副总裁维克托・佩蒂克坦言,AI 整机柜技术迭代太快,倒逼数据中心全面改造升级。他说:新一代 AI 机柜耗电更大、重量更沉,机房必须在不额外占用空间的前提下,为机柜配备多路独立供电线路。

机柜暴涨的用电需求,甚至直接改变了数据中心的整体设计,连占地面积规划都要重新调整。2022 年,Meta 在美国得克萨斯州坦普尔园区动工新建数据中心。据 AI 算力行业分析机构 SemiAnalysis 透露,项目最初沿用 Meta 经典的 H 型建筑布局,和旗下其他数据中心保持一致。

Meta 首席执行官马克・扎克伯格当初一句 “亥伯龙占地堪比大半个曼哈顿”,瞬间引爆热议。很多人误以为它是一栋单体巨型大楼,其实并非如此。亥伯龙实际是一组数据中心建筑群,目前规划建有 11 栋主楼,总建筑面积超 37 万平方米。这个规模,比纽约中央公园还要小不少 —— 而中央公园本身,也只占到曼哈顿总面积的 6%。不过项目后续还有极大扩建空间:整个里奇兰教区地块总占地 1470 万平方米,大约相当于曼哈顿面积的四分之一。而且这 37 万平方米的建筑面积,还没把配套外围设施算进去,比如路易斯安那州电力公司专为该项目新建的三座联合循环燃气发电厂。

不过在 2022 年 12 月,受公司全面复盘旗下数据中心基建规划影响,这项工程中途停工。Meta 最终决定,把已经建好的部分全部拆除,从头重新设计建造。官方从未公开说明停工重建的原因,但业内分析认为,核心问题是原有供电设计,撑不起新一代高功耗 AI 机柜的用电需求。项目在 2023 年重新开工。

新版方案直接舍弃了原本的 H 型楼栋设计,改用简约修长的长方形建筑,每栋楼两侧都配套排布多组燃气轮机发电机组。虽然 Meta 的规划仍有可能调整,但目前敲定的方案是:在占地 13.6 平方公里的里奇兰教区园区内,建成 11 座长方形数据中心,每一座都将搭载数十万块 GPU 算力芯片。

散热与网络全面升级

英伟达超高密度 AI 显卡机柜,不仅凭借超大自重、超高功耗在改写数据中心标准,严苛的散热与带宽需求,也在彻底改变行业设计。

传统数据中心一直采用风冷散热,但这种方式如今已经碰到性能天花板。新加坡国立大学散热研究实验室(CoolestLAB)负责人李宝成表示:用空气当散热介质,本身就存在先天短板。

今后,显卡散热将全面转向液冷方案,可这也大大增加了工程复杂度。李宝成解释:整套改造要落实到机房基建层面,必须配备专业水泵机组,也就是冷却液分配单元(CDU)。还要搭建错综复杂的管道网络,把设备和机柜连通,同时整套系统必须做好多重备用冗余设计。机柜内部,管道会对接每一块显卡上方的水冷散热板;机房外部,管路再连通蒸发冷却设备。他坦言,老旧风冷机房也能改装成液冷,但造价极其高昂。

与此同时,AI 数据中心的网络架构也在为适配新需求全面升级。传统数据中心选址,优先靠近网络枢纽,方便接入全球互联网;而 AI 数据中心,核心是打通显卡与显卡之间的高速互联。

这类互联,既要超大带宽,又要绝对稳定可靠。通信基建厂商 ciena 的副总裁马克・比伯里奇介绍,公司最新一代光纤收发模块WaveLogic 6,单波长带宽最高可达每秒 1.6TB;单根光纤可承载 48 个波长。头部大客户会铺设数百对光纤,整体总带宽能达到每秒数千太比特。

Meta 的亥伯龙数据中心,正在美国路易斯安那州里奇兰教区动工修建,整片园区占地广阔,约相当于四分之一个曼哈顿。(图片来源:Meta)

很多人容易被亥伯龙以及其他大型 AI 数据中心的规模误导,以为关键是单栋建筑做得够大。其实并非如此,亥伯龙并不是一栋大楼,而是多栋建筑组成的建筑群,靠高速光纤网络互联互通。比伯里奇表示:“把各个数据中心互联起来,是必不可少的核心设计。你可以把整套园区看成一座逻辑上统一的 AI 训练中心,只是硬件分散在不同位置。”

英伟达把这种模式称作“横向扩容”,和一味把单栋建筑往大里建的 “纵向扩容” 区分开来。

前路广阔,却暗藏未知

目前,下一代超大算力机柜的功耗、散热、带宽需求,都还没有最终定论,工程师只能提前预判。

但所有人都认准一个核心:规模必须足够大。五年前看似离谱的供电、散热、网络标准,如今已成刚需,行业旧规则被彻底改写。

2025 年科技巨头豪掷数百亿砸向基建,也引发了业内对投入可持续性的质疑。但对一线工程师而言,这是实现技术突破的绝佳机会。

斯坦泰克的工程师直言:我们终于能攻克超高难度难题,这是行业久违的挑战与荣光。

译者:Teresa