人工智能与能源转型
作者: 卓贤 肖娅晨 范炘宜人工智能技术在台前展示的是比特世界的算力、算法和数据,但其“轻盈的灵魂”背后则是土地、能源和水等物理世界“沉重的肉身”。
根据本文三种情境的模拟测算,未来人工智能发展需要可持续的巨量能源支撑,能源转型速度在很大程度决定人工智能的走向。人工智能与能源约束之间的矛盾能否化解,取决于两场“竞赛”的结果:一方面,人工智能算力能效的提升速度能否超越应用场景的扩散速度;另一方面,能源转型速度能否超越人工智能用电增长速度。
一、人工智能快速发展会挤占全球发展资源吗?
以OpenAI推出ChatGPT为标志,人工智能进入快速发展的轨道。当前,生成式人工智能正实现着从文本世界、多媒体世界再到物理世界的技术三级跳。在逐步理解和处理文本、图像、声音、视频等多模态信息之后,人工智能还通过物联网和具身机器人连接物理设备,感知真实环境参数,实现智能决策和自主处理复杂指令。随着技术更新迭代,人工智能的应用场景也在不断拓宽。比如,人工智能有望打破生物医药的“双十困境”(即一款新药研发至少需要投入10亿美元和耗费10年研发周期)。再如,人工智能技术提高了发现和合成新无机化合物的速度和精确性,加快了新材料的问世。
人工智能并非天使,其快速发展也引发人们对其潜在负面影响的讨论。比如,机器换人带来失业和不平等加剧,技术垄断造成消费者福利和社会利益损害,没有与人类价值观“对齐”带来犯罪和恐怖主义风险等。技术中性论认为,技术本身无所谓善恶,技术所产生的影响取决于技术使用者。有鉴于此,一些科技界和企业界的个人或机构发布公开信,呼吁加强人工智能治理以避免出现对人类发展不可逆的风险。
人工智能技术在台前展示的是比特世界的算力、算法、数据,但其“轻盈的灵魂”背后则是土地、能源、水等物理世界“沉重的肉身”。
算力的尽头是电力。据国际能源署数据,2022年美国共有约2700个数据中心,电力消耗占全国总量的4%左右,到2026年这一比例将达到6%。芯片设计公司Arm的首席执行官Rene Haas则表示,如果不提高芯片的效率,到2030年数据中心的耗电量可能高达美国电力需求的20%到25%。
此外,人工智能的快速发展还需要大量的水、土地、劳动力和资金要素的支持。比如,人工智能的耗水主要体现为冷却、发电用水、生产芯片用水等。
由于全球发展资源有限,当一项新技术突破带来新产业热潮时,虽然其在长期可能有利于人类福祉,但在初期会挤占其他领域的发展资源。当前,跨国公司成为全球要素和资源配置的重要主体,尽管科技向善在国际科技企业的社会责任报告中有所体现,但资本的配置导向并不全然是人类福利的最大化。由于目前人工智能产业的高利润,资本的力量推动各类资源向人工智能领域集聚形成热潮和泡沫,有可能影响对人类更有当期价值的其他产业的发展。
作为一项能加速人类发展进程的潜在通用目的技术,人工智能的发展在长期具有正外部性。但在近中期,人工智能发展的收益并不会均匀地分配给全球各国和各收入群体,受益者主要是互联网企业和风险投资者,而隐性成本的承担者主要是发展中国家和低收入群体。在全球发展仍然面临粮食安全、能源安全和水资源安全等问题时,这种负外部性尤为明显:根据联合国相关数据,当前全世界有24亿人无法持续获得食物,有6.75亿人无法用上电,23亿人无法获得清洁烹饪燃料和技术,四分之一人口面临“极高”的水资源短缺压力。
二、人工智能发展需要可持续的巨量能源支撑
提升能量密度的努力贯穿人类发展史。煤炭的广泛使用推动了蒸汽机和铁路的发展,极大地提高生产效率和运输能力,是工业化的加速器。石油为内燃机提供动力,推动汽车、飞机等交通工具的普及,加快了城市化和全球化进程。电网的出现让高密度能量跨越地理限制,促进生产在更广阔地域分布和集聚,是产业分工、产业内分工、产业链分工拾级而上的基础。每一次产业变革背后都有能源革命的驱动力量,并伴随着生产组织模式变革和社会体制变革。
人工智能发展产生大规模电力需求。据SemiAnalysis数据,2023年一季度以来,全球人工智能计算能力一直以50%-60%的季度环比增速快速提升。人工智能对电力的需求主要来自于数据中心。据国际能源署(IEA)数据,2023年全球数据中心消耗约460太瓦时的电量,相当于德国(484太瓦时)全年的全社会用电量。数据中心电力需求的主要来源是服务器、存储设备、通信设备等IT设备,以及照明、空调、冷却系统等配套设施。数据中心标准组织Uptime Institute的研究表明,2022年全球大型数据中心的平均能效比(PUE)约为1.55,即数据中心的IT设备每消耗1度电,其配套设施消耗0.55度电。
图1:未来全球人工智能用电量预测

生成式人工智能的能耗分为训练和推理两个环节。每一轮训练任务持续数周至数月,而且相比普通数据处理具有更高的能耗强度。传统服务器的典型功耗约为1千瓦,但每台人工智能服务器的功耗现在已达数十千瓦。当前,人工智能还远未达到规模法则(Scaling Law)的顶峰,增加模型参数和训练数据量仍然是提升人工智能模型性能的主要路径。参数数量、数据规模和计算资源几何级数的上升,需要配之以更大规模的电力。斯坦福大学的一项研究显示,完成GPT-3训练的耗电量为128.7万度,而完成GPT-4训练的能耗是GPT-3的40倍以上,需要5177万至6232万度电。
未来人工智能推理阶段的用电总量比训练阶段高得多。不同于训练阶段,推理任务的需求和算力在地理分布上相对分散,单位时间的能耗强度低于训练阶段。但随着应用场景的快速扩张,未来推理阶段的用电量将大幅攀升。目前,人工智能的输入输出还主要是互联网的数字世界。当人工智能的触角借助各类传感器进入物理世界后,所需要处理的数据量将出现跃升。
根据市场调研机构Omdia估计,到2023年底,全球物联网设备安装量接近380亿台,每天产生约10亿GB的数据,这一规模可能还达不到全球物理设备的百万分之一。每一个生物体也是一个小宇宙,随着可穿戴设备和与之相关的智能健康行业的发展,未来对生物信息的数据处理规模将提高到更高的量级,同时,这也意味着对电力需求的几何级数增长。
从动态来看,芯片技术创新和算法优化将不断提高人工智能在训练和推理时的用能效率,但这也将拓宽人工智能的应用场景并提升模型复杂度,推动算力需求的更快增长,不断增加总体用电压力。这一预判符合历史上屡屡出现的“杰文斯悖论”,即资源使用效率提高将刺激需求增长,最终提高总消耗量。
主权AI模式带来的重复训练和应用将进一步增加全球能耗。基于安全和效率的平衡,全球人工智能建设会保持一定的冗余。在联合国发布的《以人为本的人工智能治理》报告中,鼓励各国构建本土人工智能生态系统和适应本地需求的模型,促进人工智能初创企业在更多国家和地区进行测试和部署,以确保利益相关方和各国之间的资源平等获取和隐私数据保护。因此,各地区相应的基础设施建设、人工智能模型训练与推理会带来全球能源需求的额外增长。
为获取数量级意义上的预测结果,本文采用三种方法,对人工智能电力需求增长进行情境模拟。
1.基于芯片现实供给能力的模拟。AI芯片是人工智能产业的核心硬件,也是能源消耗主体,依据GPU产量和功耗可大致估算人工智能产业的电力需求。我们假设英伟达H100将成为未来一段时间内GPU的主流产品,以其功耗作为平均数。根据美国银行数据计算,2023年全球人工智能数据中心用电量约为43.8太瓦时。根据英国金融时报报道,2024年H100出货量预计达到150万-200万块,其峰值功耗为700瓦。按英伟达95%的GPU市场份额,估算2024年智能芯片出货量约为158万-210万块。根据TrendForce的预测,到2030年GPU产量年均增速26.1%,同时考虑冷却用电约为服务器功耗的50%,可得2030年全球人工智能用电量将达到195-2455太瓦时。

2.基于信息产业人工智能化的模拟。信息通信业是人工智能渗透速度最快、应用范围最广的产业。Erol Gelenbe(2023)估算出全球ICT行业用电量占总用电量4.3%。根据国际能源署数据,2023年全球总用电量约为2.8万太瓦时,假设年增长率为3.4%,到2030年全球用电量将达到3.5万太瓦时。由此估算2030年全球信息行业用电量约为1505太瓦时。根据Alex de Vries(2023)和SemiAnalysis的评估,一个标准的谷歌搜索使用0.3瓦时的电力,而ChatGPT响应一个标准请求的耗电约为2.9瓦时。由此可认为,人工智能化的信息服务用电量是普通信息服务的9.67倍。由此可知,2030年信息产业智能化后的用电量为1.46万太瓦时,占2023年全球用电量的42%。
3.基于人类生产生活活动人工智能化的模拟。作为一项潜在的通用目的技术,人工智能会影响到各领域的运行方式,从而提高各领域生产、流通和消费行为的用电量。埃森哲(2023)基于美国就业水平,估计各行业可被人工智能化的占比均值为31%。如果这部分可被人工智能替代的生产、流通和消费行为实现人工智能化,即使人类的生产生活规模停留在2023年的水平,未来人类全部活动的用电量也将达8.3万太瓦时,约为2023年全球用电量的3倍,远远超出全球电力供应的增长能力。
需要指出的是,以上三类预测方法基于人工智能和能源技术不变的假定,并不追求具体数据的准确性。特别是后两种预测方法,更多是为了呈现人工智能的电力需求跃升后可能达到的量级。事实上,如果能源技术进步跟不上人工智能的发展,第二种预测情境要以挤占人类其他领域发展资源为代价,而第三种预测情境根本就不可能发生。
三、能源转型速度决定人工智能发展进程
传统化石能源储量无法支撑人工智能的后续发展。由于对自然资源矿产储量上限的评估不同,已有研究对地球上传统化石能源的可持续利用时间有较大的分歧,大致在50年-150年之间。不过,已有的这些研究尚未将人工智能的普遍应用作为未来的分析情境。如前一部分第三种模拟情境,当人工智能充分渗透到各领域之后,所需电力仍将远超出目前人类所有活动总用电量,这将极大透支地球上的可用化石能源储量。因此,仅依赖传统能源,人工智能可以成为社交媒体分享的流量,但无法成为改变世界发展的通用目的技术。
传统能源驱动的人工智能也不具排放意义上的可行性。从全球电力供给端看,碳排放强度较高的化石能源占比仍超过60%。在David Patterson等2021年发表的论文《碳排放和大型神经网络训练》中,根据人工智能数据中心所在地区电网的碳强度,估算出GPT-3训练产生588.9吨二氧化碳当量,相当于128辆乘用车年排放量,尚处于可接受范围。但后续更大模型将使得碳排放量指数级上升。GPT-4的模型参数约为1.8兆,并在13兆令牌(Tokens)上进行训练。而GPT-3的模型参数只有0.175兆,模型令牌规模在0.78兆-5兆之间。即将面世的GPT-5的参数规模或将达到数百兆,这意味着如果数据中心供电结构不变,正在研发的GPT-5训练的碳排放可能接十万量级的燃油车排放规模。