人工智能发展如火如荼,正引爆全球科技革命与生产力革命。算力的旺盛需求与高速发展,不仅刺激着前端芯片产业的技术进步,也考验着电力资源这种底层基础设施的长期稳定供应。
未来算力规模将受到六个方面的影响
从影响因素来看,未来我国的算力规模及其电力需求,将受到国家发展战略、产业发展和科技实力经济实力的不断推进、新兴领域的需求驱动、政策支持与基础设施建设、产业升级、区域协调发展、资本投资驱动等方面的综合影响。
一是国家发展的战略布局。从国家层面,国家通过出台一系列政策文件明确算力产业的战略地位,并提供资金和政策支持。如《全国一体化大数据中心协同创新体系算力枢纽实施方案》《算力基础设施高质量发展行动计划》等,构建全国一体化算力体系,优化算力基础设施布局,推进东西部算力协同发展和算力资源多元化供给,将有助于提升国产算力市场空间。
二是国际竞争的贸易博弈。受全球高端技术供应链规则变化影响,高性能芯片进口受限,驱动我国国产自主可控的算力技术开发和产业链发展升级。芯片及上游产业聚合各方技术优势解决软硬件卡脖子技术攻关。叠加大模型落地应用带动需求高速增长,加快解决国内“算不起,算不好,供不上”等问题,不断降低成本,促进算力普适性、普惠化。
三是“东数西算”的协同影响。在“东数西算”战略下,存量AI算力资源将在不同地区得到更合理的布局和优化配置,促进区域间整体协调发展。算力建设作为战略性新兴产业集群,成为内需新引擎。通过不同地区算力服务相互渗透和高效的算力调度,提高算力资源利用率,实现算力服务区域性拓展。
四是技术迭代与产业升级。当前主流的智能算力AI芯片技术路线分为通用型AI芯片GPU(图像处理器)、半定制化AI芯片FPGA(现场可编辑门阵列)、ASIC(专用集成电路)。GPU灵活性好、冗余度大、功耗高,FPGA通用可编辑、冗余适中、功耗低,ASIC以硬件实现软件算法、定制化无冗余、功耗最低。预测未来三种芯片类型将在不同的产业行业内不断深化应用场景,不断升级产业链供应链,并最终形成三足鼎立态势。
五是规模发展的资本驱动。资本市场对算力产业的认可度不断提升,投资规模增长反映出资本对算力产业的长期发展潜力。许多企业通过上市融资扩展其基础设施建设,在研发上加大投入以提升竞争力,特别是在高性能GPU算力数据中心成为主流解决方案的背景下,这将进一步拉动对高性能算力的需求。
六是应用市场的需求波动。人工智能发展尤其是大模型训练对智能算力的需求将日趋增长,驱动算力产业快速发展,MR(混合现实技术)、车载等新型应用场景带来新需求。边缘计算将成为智能互联世界的新型基础设施。行业应用对算力需求较为迫切,如电力金融等数据密集型企业,对算力服务需求不断增长,市场规模有望呈指数型增长。
未来算力电力需求需考虑硬件和软件的进步
我国未来的算力发展,除其本身对电能质量的需求外,其电力负荷的影响因素复杂,包括:算力硬件层面的整体规模、算力芯片技术路线、技术进步等因素,算力软件层面的模型性能、任务复杂度、算力调度算法等因素,算力运营侧的数据中心PUE(电能利用效率)、上架率、能源电力价格等因素,算力市场侧的市场需求、设备负载率等因素,均会对未来算力的电力需求产生影响。
除算力设备的规模总量的增长外,算力芯片的类型及芯片本身的能耗技术进步也是未来算力电力需求的核心影响因素。就算力芯片类型而言,新型智算芯片或能实现算力能效的大幅提升。就芯片技术进步而言,GPU芯片技术的能效提升仍有空间。
算力企业的算力中心PUE和设备负载率,直接关系着用电总量。就电能利用效率而言,2023年全国在用算力中心平均PUE为1.48,与2022年的1.52相比有所提升。未来我国算力中心PUE将进一步降低,国家明确要求“东数西算”八大枢纽和十大集群的数据中心,西部PUE低于1.2,其他地区低于1.25。就负载率而言,算力企业无法做到服务器满载运行,待机、轻载与重载的能耗水平也存在非线性变化。
软件技术方面,大模型等新一代人工智能的迭代升级需要被纳入考虑。当前国内外人工智能处于高速发展阶段,截至2024年10月,我国现有完成备案并上线为公众提供服务的生成式人工智能服务大模型近200个,不同大模型的参数、预训练量、训练时长等因素均会影响其电力需求。生成式AI接连突破了语言生成、图片生成和视频生成三种任务类型,任务复杂度的提升也是推动AI能耗快速增长的一个关键因素。此外,大模型下算力芯片调度和负载平衡的算法与规则,也一定程度上影响算力的整体能耗。
至2030年,算力规模将逐渐成为影响其电力负荷增长的决定性因素,最大的不确定性来源于能耗相关的技术进步速度。分析认为,随着算力集群在大模型训练中的高效与高可靠性问题逐渐解决,我国算力将逐渐从单卡、多卡模式向千卡、万卡集群演进,在以集群弥补单卡性能不足的同时,单池万卡集群液冷等相关技术将广泛应用,使PUE显著降低,算力的PUE降低与规模增长将在能耗方面形成抵消。各种压降负荷的利好因素将逐步减弱,算力规模将逐渐成为影响负荷增长的决定性因素,最大的不确定性来源于智能算力芯片在能耗方面的技术进步。考虑技术进步等因素,我国算力满载负荷约为0.90亿千瓦,届时约占全国总负荷的4.09%;用电量约为0.45万亿千瓦时,届时约占全国总用电量的3.37%。
(作者单位:国网能源研究院有限公司)