机器学习势函数驱动的高压材料全局结构搜索：以铋基化合物为例-尧图企业网站定制

1. 项目概述当机器学习势函数遇上高压材料探索在材料科学的前沿尤其是在高压物理和新型功能材料设计领域我们面临着一个核心挑战如何在浩瀚的原子构型空间中高效且准确地找到能量最低、最稳定的晶体结构这个问题就是晶体结构预测。传统上我们依赖第一性原理计算比如基于密度泛函理论的方法来精确计算给定原子排列下的能量。但问题在于对于一个稍微复杂点的二元或三元体系可能的原子排列方式几乎是天文数字。用DFT去逐一计算其计算成本是任何超级计算机都难以承受的。这就好比要在整个太平洋里找一颗特定的珍珠用最精密的仪器DFT去检测每一滴水理论上可行但现实中不可能。这就是机器学习势函数大显身手的地方。简单来说我们可以把它理解为一个“超级速算员”。我们先让DFT这位“精密测量师”计算出成千上万个不同原子构型的能量和受力然后用这些数据去训练一个机器学习模型。一旦训练完成这个MLP模型就能在瞬间通常是DFT计算时间的百万分之一甚至更短给出一个新构型的能量预测而且精度可以非常接近DFT。这样一来我们就能用这个“速算员”去快速筛选太平洋里的海水迅速定位到那些可能藏有珍珠的区域然后再请“精密测量师”DFT去做最终确认。我这次分享的工作正是将这套“MLP速算员DFT精算师”的组合拳应用到了一个非常具体且有趣的领域高压下的铋基二元化合物体系。为什么是铋铋本身是一种具有独特电子结构和物理性质的后过渡金属其高压相变非常丰富。而它与碱金属、碱土金属、稀土金属形成的化合物常常展现出超导、拓扑绝缘体、热电等诱人的性质。在高压下这些性质可能被进一步调控甚至激发出全新的物态。然而这些体系在高压下的相图尤其是那些尚未被实验发现的亚稳相很大程度上仍是未知领域。我们的目标很明确利用基于机器学习势函数的随机结构搜索方法系统性地对十个铋基二元体系K-Bi, Mg-Bi, Ca-Bi, Sr-Bi, Ba-Bi, Sc-Bi, Y-Bi, La-Bi, Eu-Bi, Gd-Bi在0到20 GPa的压力范围内进行地毯式的全局结构搜索。我们不仅想验证已知的实验结构更希望能像探矿一样挖掘出大量隐藏在相图深处、尚未被报道的热力学稳定化合物为后续的高压实验合成和物性研究绘制一份详尽的“藏宝图”。这项工作对于从事计算材料学、高压物理、以及新型功能材料设计的同行来说是一次方法论上的完整实践也提供了丰富的数据参考。2. 核心方法解析MLP-RSS工作流与关键技术细节要把这个“大海捞针”的任务系统化需要一个严谨、高效且可复现的工作流程。我们采用的核心方法是“机器学习势函数驱动的随机结构搜索”其完整流程可以拆解为几个关键环节每个环节都有需要注意的“坑”和技巧。2.1 第一性原理数据集构建质量的基石一切始于高质量的训练数据。MLP的性能上限很大程度上由训练数据的质量和广度决定。我们的策略是针对每一个A-Bi二元体系分别训练一个专用的MLP。数据生成策略我们并非漫无目的地生成结构。初始数据集来源于几个方面已知晶体结构数据库从ICSD等数据库中提取该二元体系及纯组元A和Bi在常压和高压下已知的晶体结构。主动学习迭代这是核心。我们先用一个小的初始数据集训练一个“粗糙”的MLP然后用它驱动随机结构搜索。在搜索过程中会生成大量新的、能量较低的候选结构。我们从中选取一部分代表性结构例如能量接近凸包、或结构多样性高的用DFT进行精确的单点能或弛豫计算将这些新的输入结构DFT能量/受力对加入训练集。扰动与畸变对已知稳定结构进行小幅度的晶格畸变、原子位置扰动以增强MLP对势能面局部变化的敏感性。实操心得数据平衡的艺术训练数据不仅要“广”还要“平衡”。如果数据集中全是能量很低的结构MLP对高能区域的预测会非常不准导致在搜索中无法正确翻越能量势垒。我们通常会确保数据覆盖从低能到较高能比如高于凸包50-100 meV/atom的广泛区域。同时各化学成分比例的数据量也要大致均衡避免模型偏向某个组分。DFT计算参数所有DFT计算我们使用VASP软件采用PAW赝势和PBE泛函。平面波截断能设置为520 eVk点网格密度保证倒易空间采样间距约0.03 Å⁻¹。对于含Eu和Gd的体系由于4f电子的强关联效应我们采用了DFTU方法U值根据文献设置为7.0 eV。这些参数是在精度和计算成本间的折衷经验证足以提供可靠的训练数据。2.2 机器学习势函数模型选择与训练我们选择了多项式机器学习势函数。与现在流行的神经网络势函数相比多项式势函数虽然在表达极端复杂势能面时能力稍弱但其具有物理可解释性强、训练稳定、推理速度极快对超大规模搜索至关重要的优点。对于金属和金属间化合物体系其势能面相对“平滑”多项式模型通常能取得很好的效果。描述符是关键我们使用原子中心对称函数作为描述符它将每个原子周围的局部化学环境转化为一组数学向量。对于二元体系我们考虑了A-A, A-Bi, Bi-Bi三种原子对的径向对称函数以及三种组合的角向对称函数。截断半径通常设为5-6 Å以包含足够的近邻原子信息。训练与验证数据集按8:1:1的比例随机划分为训练集、验证集和测试集。训练目标是最小化模型预测的能量、受力与DFT值之间的损失函数。我们密切监控验证集上的误差随训练周期的变化一旦验证误差开始上升过拟合就提前停止训练。最终我们要求测试集上每个原子的能量均方根误差低于2-3 meV受力的RMSE低于0.1 eV/Å。这个精度足以可靠地区分能量差在5-10 meV/atom以上的结构。2.3 随机结构搜索与凸包构建拥有训练好的MLP后就可以进行大规模的RSS了。对于每个A-Bi体系在每个目标压力点0, 5, 10, 15, 20 GPa我们进行以下操作结构生成使用随机晶格向量和随机原子位置生成数千至上万个初始结构。每个结构的原胞原子数Z覆盖一个范围例如4到32个原子以探索不同化学计量比。MLP预筛选与弛豫用训练好的MLP快速计算每个初始结构的能量并基于MLP进行结构弛豫最小化原子受力。由于MLP评估一次仅需毫秒级这步可以快速淘汰掉大量明显不合理的极高能结构。聚类与去重对弛豫后的结构通过比较其晶格参数、原子位置和指纹函数如SOAP进行聚类去除重复或极其相似的结构保留能量最低的几百个独特候选结构。DFT精修与凸包计算将MLP筛选出的低能候选结构用DFT进行严格的几何优化和能量计算。最后利用这些DFT精修后的能量绘制该压力下该体系的形成焓-成分凸包图。落在凸包上的点即对应热力学稳定的化合物凸包上方的点则为亚稳相。注意事项压力处理在MLP训练和RSS中压力是一个外部变量。我们的做法是将压力作为描述符的一个额外输入特征或者更常见的是在每次弛豫时固定目标压强通过设置VASP的PSTRESS参数让MLP/DFT在恒压条件下优化晶胞体积。这样训练出的MLP或进行的DFT计算直接对应特定压力下的能量。3. 结果深度解读十个铋基二元体系的高压相图宝藏经过上述系统性的搜索我们得到了十个体系在0-20 GPa压力下丰富的成果。这里我挑几个有代表性的体系深入聊聊我们发现的有趣结构和背后的物理。3.1 碱土金属体系Mg-Bi, Ca-Bi, Sr-Bi, Ba-Bi从简单到复杂Mg-Bi体系相对简单但仍有新发现。在常压下已知的稳定相是Mg3Bi2反La2O3型结构。我们的搜索不仅确认了这一点还在高压下预测了一系列新的富Mg或富Bi的稳定化合物例如Mg5Bi、Mg7Bi3、MgBi2等它们具有诸如P3m1、I4/mmm、C2/m等空间群。这些结构大多由Mg和Bi原子层交替堆叠或形成特定的多面体配位构成。一个有趣的趋势是随着压力增加高对称性的结构如立方相往往更倾向于向低对称性单斜、正交转变因为压力可以稳定更复杂的配位多面体。Ca-Bi, Sr-Bi, Ba-Bi体系则展现出丰富的结构化学。这些碱土金属原子半径较大与Bi形成的化合物结构类型更多样。我们预测了大量实验未报道的稳定相。例如在Ca-Bi体系中除了已知的Ca3Bi2我们还发现了Ca11Bi3 (Cmmm)、Ca5Bi3 (Mn5Si3型)、Ca4Bi3 (Th3P4型) 等一系列新相。特别值得注意的是许多这些预测的稳定结构都属于典型的“Zintl相”或极性金属间化合物结构原型如CuAu型、Th3P4型、Mn5Si3型等。这说明在高压下电负性差异带来的电荷转移效应依然显著并驱动形成了这些具有特定价电子规则的相。实操心得如何判断一个“新结构”是否合理当RSS吐出一堆空间群和晶体结构时不能只看形成焓。我们有一套“合理性检查清单”几何优化稳定性DFT弛豫后所有原子受力是否真的接近零0.01 eV/Å晶胞应力是否平衡动力学稳定性计算声子谱确认在整个布里渊区没有虚频软模。有虚频意味着结构在某个振动模式下不稳定可能会畸变成其他结构。热力学稳定性不仅对纯组元稳定还要对分解成其他预测的二元相稳定即落在凸包上。化学直观性检查键长、配位数是否合理。例如Bi-Bi键长不应过短金属-Bi键长应在典型范围内。不合理的配位如Bi的配位数异常低可能预示着计算问题。3.2 稀土金属体系Sc-Bi, Y-Bi, La-Bi, Eu-Bi, Gd-Bif电子的挑战与机遇稀土体系因其f电子的强关联和可能存在的磁性而更具挑战性但也因此可能蕴含更奇特的物性。Sc-Bi与Y-Bi体系Sc和Y没有f电子相对“干净”。我们预测了众多新相如Sc6Bi、Sc5Bi3、ScBi2等。一个有趣的发现是在Sc-Bi中除了常见的NiAs型ScBi我们还预测了R3m和FeSi型的ScBi相它们能量非常接近可能是竞争相。在Y-Bi体系中YBi以NaCl型结构稳定存在这与许多稀土-主族化合物一致。La-Bi体系La的4f轨道为空但其体积较大。我们预测的稳定相包括La3Bi (Cu3Au型)、La2Bi (多种变体)、LaBi (CuAu型)等。这些结构中La与Bi之间显示出强烈的离子-共价混合键合特征。Eu-Bi与Gd-Bi体系这是本次研究的难点和亮点。Eu和Gd具有半满和近半满的4f电子壳层磁性效应显著。为了平衡计算成本与精度我们在主搜索中采用了将4f电子处理为核电子冻结在芯态的赝势。令人惊喜的是即使在这个近似下我们的MLP-RSS方法仍然成功地预测出了许多已知的含Eu/Gd的铋化物结构例如Ho11Ge10型的Eu11Bi10、Th3P4型的Eu4Bi3/Gd4Bi3、Mn5Si3型的Eu5Bi3/Gd5Bi3。这说明对于这些化合物的结构稳定性几何堆积和静电相互作用可能起着主导作用而f电子的精细关联效应对其晶体结构的影响是第二位的。为了验证这一点我们专门对Eu3Bi、EuBi、EuBi3、Gd3Bi、GdBi等几个关键相用包含了4f价电子的赝势并开启DFTU进行了额外的电子结构计算。如图21和22所示对于富Bi的化合物如EuBi3、EuBi、GdBi两种赝势计算得到的费米能级附近的态密度DOS非常接近晶格参数变化也很小1%。然而对于富稀土相的Eu3BiDOS在Eu的p、d轨道投影上显示出明显差异晶格参数变化更大从5.16 Å到5.31 Å。这证实了我们的判断在富稀土相中f电子的离域性和关联效应确实对电子结构和晶格常数有更明显的影响但对整体结构类型的预测影响相对有限。3.3 纯组元高压相方法的试金石在搜索二元化合物之前我们对所有纯金属Na, K, Mg, Ca, Sr, Ba, Sc, Y, La, Eu, Gd, Bi在0-20 GPa下的稳定相也进行了预测这相当于对我们MLP在单质体系精度的检验。结果总体令人满意。例如我们成功预测了Na和K从BCC到FCC的相变Ca和Sr从FCC到BCC的相变Ba从BCC到HCP的相变以及Sc、Y、La等稀土金属的一系列复杂相变序列如HCP - α-Sm型 - α-La型。这些预测与已知的高压实验数据基本吻合证明了我们训练的MLP在描述元素金属高压行为方面的可靠性。关于Bi的一个小插曲对于纯Bi已知其在高压下有一系列复杂相变Bi-I, Bi-II, Bi-III, Bi-V。我们的MLP搜索到了Bi-III宿主-客体结构和Bi-VBCC相但未能直接找到最稳定的Bi-IA7相而是找到了一个能量极其接近的Imma空间群结构。这与之前专门针对Bi训练的MLP工作结果一致。这提醒我们MLP的预测能力存在边界对于某些具有特殊电子关联或非常局域化键合的结构可能需要更专门的数据集或更复杂的模型架构。不过由于Bi-I和Imma结构能量几乎简并这个微小偏差对后续二元化合物稳定性的判断影响甚微。4. 技术价值与实操启示MLP-RSS的威力与边界通过这十个体系的研究我们可以更深刻地体会到MLP驱动的高通量全局结构搜索在材料发现中的巨大价值同时也看清了其当前的局限性。4.1 方法论的威力效率与覆盖度的革命搜索空间的海量覆盖传统的基于DFT的直接搜索受限于计算成本通常只能探索几百到几千个结构。而我们的MLP-RSS方法在每个成分-压力点都能轻松生成并评估数万甚至数十万个结构。图11-20中展示的每个子图里密密麻麻的点局部极小值结构就是这种覆盖度的直观体现。许多能量略高于凸包但结构新颖的亚稳相也被挖掘出来为研究动力学形成路径提供了线索。凸包预测的高精度尽管MLP存在微小误差但通过“MLP粗筛DFT精修”的两步策略最终基于DFT能量绘制的凸包图11-20中的(b)子图非常清晰可靠。MLP预测的凸包(a)子图与DFT结果高度一致这说明MLP出色地学习了势能面的整体拓扑能够准确识别出真正的低能区域。新材料的“预测-验证”闭环本研究预测了上百个实验未报道的、在热力学上稳定的铋化物新相。这些预测结果本身就是给实验学家的一份“采购清单”。例如预测的某些化合物具有已知超导或拓扑材料的原型结构如NaCl型、CuAu型这强烈暗示它们可能具备类似的优异性质值得优先开展高压合成实验进行验证。4.2 实操中的挑战与应对策略尽管成果丰硕但在实际运行这样一套流程时会遇到不少挑战数据生成与MLP训练的循环成本主动学习迭代虽然高效但每一轮都需要进行新的DFT计算整个过程是串行的总耗时依然可观。我们的策略是并行化与自动化编写脚本自动管理结构生成、MLP训练、RSS运行、DFT任务提交和结果分析流程。同时利用计算集群并行计算多个不同化学成分或压力的点。“维度灾难”与搜索效率即使有MLP在超高维的构型空间中盲目随机搜索效率仍可能低下。我们结合了对称性约束在生成随机结构时施加可能的空间群和基于已知结构原型的衍生对已知稳定结构进行元素替换、晶格畸变作为RSS的补充以更有针对性地探索潜在的低能区域。MLP的“外推风险”MLP在训练数据覆盖的区域内内插预测很准但对于完全陌生的原子环境外推可能给出荒谬的结果。在RSS中我们设置了一个能量阈值过滤器如果MLP弛豫后的结构能量异常高我们会用DFT快速计算一个单点能进行校验如果DFT能量与MLP预测严重不符则将该结构加入训练集重新训练MLP。这是一个重要的在线学习环节。磁性、强关联与自旋轨道耦合如Eu/Gd体系所示对于磁性体系标准的非自旋极化MLP会失效。我们的解决方案是使用非磁性或顺磁性的DFT数据训练MLP进行结构搜索因为晶体结构主要由几何和静电因素决定。在找到候选稳定结构后再使用包含磁性的DFT进行最终的能量排序和性质计算。对于自旋轨道耦合效应显著的重元素如Bi本身在最终DFT精修时需要考虑进去但这通常不纳入MLP训练因其对总能量的贡献相对较小且计算昂贵。4.3 对未来工作的展望基于这次的经验我认为这个领域有几个明确的下一步方向从二元走向多元目前的成功证明了方法在二元体系的威力。自然的延伸是三元甚至四元体系。挑战在于组合爆炸需要发展更高效的描述符和主动学习策略以及可能考虑使用图神经网络等更能捕捉复杂化学环境的MLP模型。集成性质预测不仅预测稳定结构还能同步预测其基本电子性质如带隙、态密度、声子谱。可以训练“多任务”MLP模型或在MLP弛豫后用超快但近似的方法如紧束缚模型、预训练的神经网络进行性质初筛。动力学过程模拟利用MLP进行纳秒甚至微秒级的分子动力学模拟研究高压下的相变路径、成核动力学而不仅仅是零温下的热力学稳定性。这对于理解实验上观测到的亚稳相形成至关重要。与实验的深度互动将计算预测的X射线衍射图谱、拉曼光谱等与高压原位实验数据直接对比实现“计算引导实验、实验验证计算”的实时互动模式加速新材料的确证过程。回过头看这项工作的核心价值在于它不仅仅是一份关于铋基化合物的高压相图报告更是一次对**“机器学习势函数全局结构搜索”** 这一现代计算材料学研究范式的完整演示和压力测试。它证明了通过精心设计的流程和对其局限性的清醒认识我们确实有能力系统性地探索未知的材料空间将新材料发现从“偶然邂逅”逐步推向“理性设计”的新阶段。对于想进入这个领域的研究者我的建议是从一个小而具体的二元体系开始亲手走通“数据生成-MLP训练-RSS搜索-DFT验证-结果分析”的全流程踩过里面所有的坑你对这个强大工具的理解才会真正深入骨髓。

相关新闻

SC-CRAM：基于磁隧道结的存内随机计算架构解析与应用

面向卫星边缘计算的FPGA视频编码硬件优化：量化、运动估计与熵编码的深度定制

Zotero Format Metadata：终极文献元数据格式化插件完全指南

【总结】HugeGraph Client 从 1.2.0 升级到 1.7.0 的 7 个坑

书匠策AI：你的毕业论文“急救包“——2025年写论文这件事，早就不该用笨办法了

强力解锁Switch游戏PC运行：Ryujinx模拟器完全指南

免费IDM激活终极指南：永久解锁下载加速神器

5分钟掌握LGTV Companion：让你的LG电视与电脑智能同步开关机

英伟达VR200服务器MLCC用量暴增30%：被动元件板块涨停潮深度解析

Unity ML-Agents 环境配置避坑指南：Python+CUDA+Unity 版本精准匹配

毕业设计 yolov11骨折检测医疗辅助系统（源码+论文）

别再死记硬背了！用5个生活化比喻彻底搞懂Linux进程的fork、exec和wait

为什么你的AI Agent总在跨境清关环节“失语”？揭秘NLP+规则引擎混合推理的5个关键断点

【AI Agent行业落地黄金法则】：20年架构师亲授7大避坑指南与3个已验证千万级ROI场景

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪 技术地位与核心优势

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪技术地位与核心优势