电子是具有根本重要性的基本粒子。它们之间以及与原子核之间的量子力学相互作用产生了化学和材料科学中观察到的多种现象。了解和控制物质的电子结构可以深入了解分子的反应性、行星内的结构和能量传输以及材料失效的机制。
科学挑战越来越多地通过计算建模和模拟、利用高性能计算的能力来解决。然而,实现具有量子精度的真实模拟的一个重大障碍是缺乏将高精度与跨不同长度和时间尺度的可扩展性结合起来的预测建模技术。
经典原子模拟方法可以处理大型复杂系统,但其对量子电子结构的省略限制了其适用性。相反,不依赖于经验建模和参数拟合(第一原理方法)等假设的模拟方法提供了高保真度,但计算要求较高。例如,密度泛函理论(DFT)是一种广泛使用的第一原理方法,它表现出随系统尺寸的三次缩放,从而将其预测能力限制在小尺度上。
10000多个铍原子的深度学习模拟快照。这种材料中电子的分布可视化为红色(离域电子)和蓝色(靠近原子核的电子)点云。使用传统的DFT计算该模拟是不可行的。多亏了MALA,仅使用150个中央处理单元,该过程在大约5分钟内就完成了。图形过滤器已用于提高模拟的清晰度。边缘的白色区域也是由滤镜造成的。背景中的方案暗示了深度学习的工作原理。图片来源:HZDR/CASUS
基于深度学习的混合方法
研究人员团队现在提出了一种新颖的模拟方法,称为材料学习算法(MALA)软件堆栈。在计算机科学中,软件堆栈是算法和软件组件的集合,它们组合在一起创建用于解决特定问题的软件应用程序。
伦茨·费德勒博士CASUS的学生兼MALA的主要开发人员解释说:“MALA将机器学习与基于物理的方法相结合来预测材料的电子结构。它采用了一种混合方法,利用一种称为深度学习的成熟机器学习方法来准确预测局部量,并辅以物理算法来计算感兴趣的全局量。”
MALA软件堆栈将空间中原子的排列作为输入,并生成称为双谱分量的指纹,对笛卡尔网格点周围原子的空间排列进行编码。MALA中的机器学习模型经过训练,可以根据该原子邻域预测电子结构。MALA的一个显着优势是其机器学习模型能够独立于系统规模,使其能够根据小型系统的数据进行训练并以任何规模进行部署。
研究小组在其出版物中展示了这一策略的显着有效性。与传统算法相比,他们在由数千个原子组成的较小系统尺寸上实现了超过1000倍的加速。此外,该团队还证明了MALA能够准确执行大规模电子结构计算,涉及超过100000个原子。值得注意的是,这一成就是通过适度的计算工作实现的,揭示了传统DFT代码的局限性。
CASUS极端条件下物质部门代理主管AttilaCangi解释道:“随着系统规模的增加和涉及更多原子,DFT计算变得不切实际,而MALA的速度优势持续增长。MALA的关键突破在于其能够在局部原子环境中运行,从而实现受系统尺寸影响最小的准确数值预测。这一突破性的成就开启了曾经被认为无法实现的计算可能性。”
预计将推动应用研究
Cangi旨在通过利用机器学习来突破电子结构计算的界限:“我们预计MALA将引发电子结构计算的变革,因为我们现在有一种方法可以以前所未有的速度模拟更大的系统。未来,研究人员将能够在显着改善的基础上解决广泛的社会挑战,包括开发新疫苗和用于储能的新型材料、对半导体器件进行大规模模拟、研究材料缺陷以及探索化学将大气中的温室气体二氧化碳转化为气候友好型矿物质的反应。”
此外,MALA的方法特别适合高性能计算(HPC)。随着系统规模的增长,MALA可以在其使用的计算网格上进行独立处理,从而有效地利用HPC资源,特别是图形处理单元。
桑迪亚国家实验室的科学家兼并行计算专家SivaRajamanickam解释说:“MALA的电子结构计算算法很好地映射到具有分布式加速器的现代HPC系统。分解工作并在不同加速器上并行执行不同网格点的能力使MALA成为HPC资源上可扩展机器学习的理想匹配,从而在电子结构计算中实现无与伦比的速度和效率。”
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】