科学智能(AI for Science,AI4S),是指人工智能技术驱动的科学研究,主要应用在探索未知的科学领域。AI4S概念由中国科学院院士、北京大学教授鄂维南于2018年首次提出。AI4S开启了一种利用人工智能学习深奥的科学原理来创造科学模型,以解决那些曾被认为无解的实际问题的科研新范式。2021年,随着英国“深度思维”(DeepMind)公司发布阿尔法折叠(AlphaFold),AI4S成为全球关注的焦点。2023年以来,以ChatGPT为代表的大模型的崛起,推动了人工智能从科研方法、科研技术向行业实践的实际应用的转变。
(来源:微信公众号“能源评论•首席能源观” 作者:蒲天骄 王新迎 赵琦)
驱动科学研究新范式
AI4S这一概念自2018年首次被提出以来,在学术界和政府机构中引发了广泛的讨论,它的内涵特征主要体现在两个方面:作为科学范式的变革者,它推动了对科学原理的新发现;作为科学实践的加速器,它加快了理论向实践的转化,促进了科研成果的应用落地。
AI4S的科学本质值得深度思考。科学研究中某些问题做不到使用基本原理来解决,它们依赖于多个独立变量,维数(自由度)过多,计算量呈指数增加,形成“维数灾难”,既有的数据分析工具不再适用,只能用非常粗糙的近似方法来试图解决。
以深度学习为代表的人工智能技术在高维问题(图像分类、人脸生成、围棋对弈、蛋白质预测等)上取得的成功,表明了其是逼近高维函数更有效的工具,有助于解决那些受“维数灾难”困扰的问题,这也是AI4S的出发点。
AI4S通过人工智能技术引导科学假设生成、融合科学实验与仿真、分析科学数据,为科学研究提供新方法和工具,推动科学研究加速创新和突破,成为继实验观察、理论推导、计算仿真、数据驱动之后的科学研究“第五范式”。目前,AI4S已经在多领域取得了显著研究成果。
AI4S引导科学假设生成。针对领域科学知识进行压缩表示,形成跨领域知识交互推理库,引导科学研究发现问题与提出假设,辅助科学研究设计与分析。例如谷歌基于提出的阿尔法几何(AlphaGeometry)模型,利用自然语言大模型和上亿个几何结构数据进行训练,实现了人工智能几何推理与证明。中国科学技术大学研究团队提出AI-Chemist模型,通过学习数万篇化学领域文献和相关跨学科知识,辅助科学家利用材料完成火星环境下析氧反应催化剂的制备,极大地简化了催化剂合成与性能优化过程。
AI4S助力科学实验仿真。针对成熟科学方法进行数据驱动增强,提升算法执行效率与效果。例如,华为基于“盘古”气象大模型,在中长期气象预测精度与计算效率方面超越传统数值预报方法。DeepMind利用强化学习方法成功实现托卡马克装置磁控制主要功能,解决了传统控制器参数设计困难且耗时的问题。
AI4S辅助科学数据分析。针对待解科学问题进行一般化抽象,利用海量数据确定抽象模型参数,形成对未知机理的合理假设及预测。例如,DeepMind基于AlphaFold进行蛋白质结构预测,解决了传统实验方法成本高效率低的痛点,极大地推动了结构生物学的发展。此外,DeepMind提出的GNoME用于新材料预测,并已发现多种理论上稳定但实验未实现的晶体结构,为储能、超导等未来变革性技术提供了丰富参考。
鉴于人工智能技术对科学发展的潜在巨大助力,多国政府以及公司、研究机构纷纷投入大量资源,推动第四次技术革命。我国也积极推进该领域专项工作,科技部会同国家自然科学基金委员会于2023年3月启动“人工智能驱动的科学研究”AI4S专项部署工作。
加速电力革命进程
随着大规模可再生能源的接入及负荷侧的再电气化过程,大量特性各异的源、荷、储等装备以电力电子为接口接入现有电力系统,使系统向着高比例可再生能源和高比例电力电子设备(即“双高”)趋势快速发展。
“双高”电力系统具有全新的、更加复杂的动力学特征,不仅体现在设备元件数量、种类的大幅增加,还体现在供给侧、需求侧随机性带来的扰动影响。这些特征造成了与系统相关的许多预测、分析、优化、控制问题呈现“高维”特性,直接建模极为复杂,机理方法难以处理,往往只能通过试错或靠经验来解决。
面对“双高”电力系统带来的问题和挑战,AI4S能够提供一系列解决方案。通过其在假设生成、实验仿真和数据分析三个方面的能力,为电力领域的研究和实践提供新的视角和工具。
——在假设生成方面,电力领域可利用人工智能技术对历史数据进行分析和学习,生成关于系统未来运行趋势的科学假设,指导研究人员进行更深入的研究分析。在电力装备研发领域,美国通用电气公司运用人工智能技术预测合金成分,并推动燃气轮机用高温合金的设计,大幅缩减了新材料的研发周期与成本。在电网仿真分析领域,中国电科院将人工智能技术与大电网仿真技术相结合,从仿真数据分析角度出发,提出大电网仿真分析、潮流计算调整和稳定控制决策等人工智能模型和算法,从而为大电网仿真分析开辟一条新的技术途径。
——在实验仿真方面,电力领域可利用人工智能技术助力海量跨学科知识数据实现交叉融合,在复杂系统的计算模拟中减少计算时间,提高仿真模型的准确性。在配电网计算推演领域,中国电科院利用人工智能技术,综合分析电网运行数据、负荷特性、设备状态以及环境因素等多维度信息,构建精细化的仿真模型,提升最小化采集下的配电网参数、拓扑、状态以及未来态势透明化感知水平,有效提升配电网的可观测、可描述、可计算能力。
——在数据分析方面,电力领域可利用人工智能技术进行高维复杂数据处理,辅助研究人员分析科学数据的结构性、关联性,从而减少计算时间并降低计算成本。在电力系统运行优化领域,中国电科院面向电力调度优化问题(如机组组合、市场出清等)的求解需求,提出面向大规模混合整数规划求解的人工智能和数学规划互补协同方法,实现了海量场景下快速确定混合整数规划关键变量,从而提高电力调度优化问题的求解效率。
中国电科院在AI4S的电力领域应用方面做了积极探索和实践,突破了数据知识融合建模方法,提出了机理-跨模态数据融合的电网设备智能感知与诊断技术、电网运行可行域降维结合强化学习的源网荷储智能调控技术、分层博弈的综合能源自治协同技术,依托自主攻关的国家重点研发计划“电力物联网关键技术”,在天津滨海全域全面示范应用,有效提升了电网典型业务场景的智能运维、新能源消纳以及用户服务水平,加速推动电网数字化转型和智能化升级。后续,中国电科院将利用大量电力领域数据知识,开展实验仿真、优化决策等上层应用,助力AI4S在电力领域的科学范式变革及落地应用加速。
电力行业的AI4S研究仍处于探索阶段。尽管已有个别优秀的先行应用案例(大都源于其自身特点与电力业务场景紧密契合),但尚未进入行业性的大规模推广和体系化发展阶段。
面临三大挑战
AI4S的未来充满无限可能,但要实现这一愿景,必须正视并解决当前研究和应用中遇到的难题。当下,推动电力行业AI4S研究面临以下三大挑战。
一是高质量数据获取难。数据质量对于人工智能模型的训练和性能至关重要,电力行业数据涉及生产、运行和管理等领域,这些数据在维度、尺度上很难形成统一规范,采集到的数据存在缺失、异常等问题,使得获取高质量数据面临挑战。
二是计算资源需求大。科学研究通常需要处理和分析大量的数据,电力行业需要处理的数据规模大且类型复杂,部分场景还对计算时间有严格的要求。此外,人工智能模型的训练和优化过程也非常耗时,这些都对计算资源和计算效率提出了很高的要求。
三是跨学科人才储备不足。电力行业AI4S融合了电力、计算机、数学、物理等多个学科知识,需要具备深厚电力知识又精通人工智能技术的跨学科人才。由于电力行业本身的性质,跨学科的交流和合作不足,跨学科人才储备亟待增加。
为了进一步加快电力行业AI4S创新工作,并迅速孕育出重大的应用成果,建议在基础研究、创新平台、人才队伍三个方面进行重点布局。
一是加强AI4S基础研究攻关。加快布局“人工智能驱动的科学研究”前沿科技研发体系,统筹规划形成切实可行的AI4S应用落地路径,明确AI4S在电力领域的基础研究方向,开发具有较强泛化能力、能够适应不同场景的AI4S算法模型,从本质上助推电网高质量发展。
二是加快建设统一开放的AI4S创新服务平台。打造AI4S创新平台,集数据整合、高性能智算、资源共享、跨学科交流等多项功能于一体,为电力领域科学研究提供强大的技术支撑和智能基座,服务能源电力行业AI4S创新发展。
三是加强AI4S方面人才队伍建设。多渠道多方位引进学科带头人和核心产业领域高层次人才,集聚和稳定一批具有较高专业水平与影响力的领军人才及青年骨干,积极推进跨专业科学研究交叉融合,培养具有跨学科思维和创新能力的人才队伍,高效协作引领电力行业AI4S快速发展。
(作者分别系中国电力科学研究院副总工程师兼人工智能应用研究中心主任,人工智能应用研究中心大数据应用研究室主任、工程师)