必威最近,在AI领域,微软搞了个大动作,他们打算用核能来给他们的AI项目供电。
据《华尔街日报》报道,微软正在计划利用下一代核反应堆,即所谓的小型模块化反应堆(SMR),来支持其数据中心和AI项目。
不过,现实情况却是,随着核电站的关闭速度超过新建速度,全球核电产量继续下滑。
而且由于政治、监管和经济等一系列原因,目前还没有一个西方国家开始建造SMR。
在这种情况下,微软决定当第一个“吃螃蟹”的人,也是为了保住自身在AI领域的龙头地位。
在最近 OpenAI的CEO 萨姆·奥特曼公布的2024年计划表中。人们赫然发现了GPT-5的字样。
先是 Huggingface 自家的 BLOOM 大模型,有 1760 亿参数,光是前期训练它,就得花掉 43.3 万度电。这相当于大约2082个中国家庭(而且还是三口之家)一个月的用电量。
而最近发表在《焦耳》杂志上的一项研究表明,到2027年,生成式人工智能所消耗的能源能为荷兰大小的国家提供一年的电力,相当于约85-134太瓦时(TWh)。
这就引发了一个关键的问题:要想真正实现AGI(通用人工智能),人类在能源方面,究竟要付出多大的代价?
过去一百年里,全球电动机消耗掉的电量就占到了总发电量的一半,而现在的大模型就相当于新时代的电机。
研究机构New Street Research估计必威,仅在AI方面,谷歌就需要大约40万台服务器,每天消耗62.4吉瓦时,每年消耗22.8太瓦时的能源。
而立陶宛或斯洛文尼亚这样的小国,全年的用电总量也不过在10+太瓦时左右。
也就是说,仅谷歌在AI方面的用电量,就毫无压力地碾压了两个人口数百万的小国……
而AI大模型之所以如此耗电,一个重要的原因,就是其必须从大量数据中“学习”和提取深层次的规律或知识。
AI模型训练,就像是在教电脑学会理解和处理非常复杂的问题,比如学会一种新语言、识别成千上万张图片里的物体,或者预测天气变化。要做到这一点,大模型需要通过查看和分析成千上万甚至上亿的例子(数据)来“学习”。
由于无法像人脑一样“举一反三”,这样的计算,往往需要涉及到模型内部的数十亿甚至数千亿的参数。
打个比方,这就好像参加一场复杂的数学考试必威,人脑仅需一本教材,消耗一个肉包子,就能考60分,而AI可能要啃1亿本教材,耗费上万度电,才能勉强接近人类的水准。
而为了追求更强大的性能,以现阶段的技术路径,人们往往只能持续不断增大模型的参数。例如之前的GPT-3.5是1750亿,GPT-4为1.8 万亿,而去年11月,亚马逊发布的全新大模型Olympus,参数更是达到了2万亿。
随着模型的复杂度和规模不断增长,AI对算力的需求也在迅速增加。而用于训练的GPU,也会随之遇到性能瓶颈,从而达到其能效的物理极限,导致功耗显著增加。
而所谓“能效的物理极限”,指的是GPU在每消耗一定量的电能时,能够完成的最大计算量。
这就像是一辆汽车在每公升油能行驶的最远距离。当GPU接近或达到这个极限时,要想进行更多的计算,它们就需要更多的电力。
这就像是一台已经非常节油的汽车,要增加行驶距离,就必须加更多的油(电力)。以目前的AI服务器DGX A100为例,其搭载的8颗A100 80GB GPU,最大系统功耗达到了6500W。
芯片研究公司SemiAnalysis研究报告称,使用大模型进行问题搜索所消耗的能源是常规关键词搜索的10倍。
倘若标准Google搜索消耗0.3瓦时的电量,而与大模型每次互动的耗电量为3瓦时。如果人们每次在谷歌搜索都使用AI工具,每年大约需要29.2太瓦时的电力。
这些炸裂的数据,也让人想到了一个细思极恐的事实,那就是:倘若目前仅一万多亿参数的GPT-4这类模型,耗电量就如此可怕,那将来更强大的GPT-5,或是其他更先进的模型,耗电量又会是什么地步?
一个可以预见的事实是:只要目前的大模型,继续沿着“参数越大,能力越大”的技术方向走下去,那么下一代更强的通用模型,在能耗上必然是倍增的。
微软打算建造的这个小型核反应堆(SMR),也可以被看做大号的“核电池”,使用的还是核裂变技术,每台SMR反应堆发电装机容量不超过300兆瓦,不到传统核反应堆装机容量的三分之一。
目前整个美国只有 NuScale Power一家公司拿到了SMR的监管批文。
而光是为了拿批文,NuScale在整个审批过程就花费了超过5亿美元必威,总共提交了1.2万页的申请表,相关的文件、材料则超过200万页……
首先一点,就是之前提到的大模型“参数越大,能力越大”的桎梏。在这样的技术路径下,模型性能每提升一个层次,其参数和消耗的电能,也会随之倍增。
咨询机构Tirias Research曾预测,到了2028年,数据中心功耗将接近4250兆瓦,比2023年增加212倍,数据中心基础设施加上运营成本总额或超760亿美元。
于是,在这种电力和模型功耗“你追我赶”的趋势下,化石燃料的成本、能量密度的瓶颈很快就会显现。
而SMR的出现,则为这种看似无止境的“追赶游戏”,画上了一个暂时的休止符。
因为与传统的化石燃料相比,甚至与一般的大型核电站相比,SMR最大的优势之一,就是无需频繁地更换燃料。
与传统核电厂1~2年换料周期相比,基于SMR的发电厂换料频率低,可以每3~7年进行一次燃料更换。甚至一些SMR设计可在不更换燃料的情况下运行长达30年。
而SMR之所以那么“耐用”,主要是因为SMR通常使用更高富集度的低浓缩铀(LEU)燃料。这意味着燃料中铀-235的百分比高于传统的核电站使用的LEU。高富集度的燃料可以提供更高的能量密度,从而延长燃料循环的长度。
而相较之下,大型核电站的核心设计和操作参数,通常是基于传统的低富集铀燃料(通常为3%到5% U-235)进行优化的。这些设计限制决定了大型核电站的燃料循环效率。
正是这样“干得多,吃得少”的特点,让SMR在长期运营的过程中,拉开了与化石燃料的成本差距。
除了长期成本的考虑外,微软选择SMR,也是在美国能源大战略下的一种决定。
当前,拜登政府将能源战略重点放在了清洁能源革命上。2021年11月,拜登推动国会两院通过《基础设施投资和就业法案》,向能源领域投资约620亿美元。目标是在2035年前实现美国的无碳电力。
实际上,在当前碳中和和全球能源转型的大背景下,可再生能源与化石燃料之争,已经不仅仅是一种成本、效率的问题,而是意味着世界工业又进入了大变革时期。
纵观工业革命的历史,这类变化不仅会带来海量“发财”的机会,也会在某种程度上重塑世界权力的格局。
毕竟,在第二次工业革命时,美国正是在内燃机的发明和汽车的普及的背景下,因其在石油生产和加工方面的领先地位,一跃成为了工业强国。
而在现在这个能源转型的路口,美国为在清洁能源领域确立自身的优势,也开始出台各种政策,扶持可再生能源,抑制碳排放。
例如在碳税方面,参议员怀特·豪斯在2021年提出了《清洁竞争法案》(Clean Competition Act,简称CCA)。
从2024年开始,不论是美国产品还是进口产品,如果碳含量超过基准线美元/吨的碳税,这个碳税标准每年上浮5%。