赝势选择对机器学习势函数在辐射损伤模拟中精度的影响研究-尧图企业网站定制

1. 项目概述赝势选择如何影响机器学习势函数在辐射损伤模拟中的表现在计算材料科学领域分子动力学模拟是研究材料在极端条件下行为的核心工具尤其是在核材料、半导体器件辐照效应等涉及辐射损伤的场景中。模拟的基石是原子间相互作用势函数其精度直接决定了模拟结果的物理可信度。近年来机器学习势函数凭借其能够以接近第一性原理计算的精度、同时保持经典分子动力学计算效率的优势迅速成为该领域的研究热点。然而一个常被忽视但至关重要的问题是用于生成机器学习势函数训练数据的第一性原理计算本身其精度也依赖于计算参数的选取其中赝势的选择就是一个关键变量。本项目深入探讨了在训练用于辐射损伤模拟的机器学习势函数时选择不同的赝势特别是标准赝势与包含半核电子处理的“硬”赝势所带来的系统性影响。我们以金属镍为模型体系系统对比了基于不同赝势密度泛函理论数据训练出的Tabulated Gaussian Approximation Potentials (tabGAP)并评估了它们在阈值位移能、初级辐射损伤级联以及大规模重叠级联模拟中的预测差异。研究发现尽管两种势函数在平衡态性质上表现高度一致但在描述短程强排斥相互作用时存在显著区别这直接影响了级联损伤的累积预测并与实验观测的卢瑟福背散射谱结果进行了对比验证。此外我们还探索了在势函数训练完成后修正其排斥相互作用的可行性为开发面向极端条件的高可靠性机器学习势函数提供了新的思路和实用策略。2. 核心原理与背景从第一性原理到机器学习势函数要理解赝势的影响首先需要厘清从量子力学计算到可执行分子动力学模拟的机器学习势函数这一完整链条。2.1 第一性原理计算中的赝势精度与效率的权衡密度泛函理论作为第一性原理计算的主流方法通过求解Kohn-Sham方程来获得材料的电子结构及总能量。然而直接处理所有电子尤其是内核电子计算量巨大。赝势方法通过用平滑的势场替代原子核与内核电子的强相互作用从而只需处理价电子极大地提升了计算效率。关键区别在于“软”与“硬”标准赝势通常只明确处理价电子。对于过渡金属如镍其3p电子被视为内核电子被“赝化”处理。这种赝势计算效率高但在描述两个原子非常接近时的短程排斥相互作用时可能因为内核电子的波函数重叠未被准确描述而偏“软”。半核赝势将一些能量较高的内核电子如镍的3p电子也作为价电子处理。这使得赝势的“硬度”增加能更准确地描述电子密度在核附近的振荡行为从而更精确地刻画短程强排斥作用。代价是计算需要更高的平面波截断能计算成本相应增加。在辐射损伤模拟中初级碰撞原子可能获得高达数keV的动能导致原子间距离被压缩到远小于平衡距离。此时势函数在短程区的精度至关重要因为它直接决定了碰撞过程中的能量传递、反冲原子轨迹以及最终产生的缺陷数量与类型。2.2 机器学习势函数的工作原理与训练流程机器学习势函数的核心思想是绕过求解复杂的量子力学方程用一个经过训练的机器学习模型来直接映射原子构型由一组原子坐标和种类描述到系统的总能量和原子受力。典型的训练流程如下构建训练数据集利用第一性原理计算通常是DFT生成大量涵盖不同原子构型的能量和力数据。这些构型应包括平衡结构如完美晶体、表面、点缺陷、非平衡结构如拉伸/压缩晶体、液态以及极端短程构型模拟高能碰撞。选择描述符将原子的局部化学环境转化为一组固定长度的数学向量描述符如原子对距离、键角等。描述符需要满足旋转、平移和原子置换不变性。模型训练使用机器学习算法如高斯过程回归、神经网络学习从描述符到能量/力的复杂函数关系。模型会在训练数据上不断调整参数以最小化预测值与DFT参考值之间的误差。势函数生成与验证训练好的模型被封装成一个势函数文件可供LAMMPS等分子动力学软件调用。在使用前必须对势函数进行严格的验证包括测试其在训练集外构型上的泛化能力以及计算一系列材料的本征属性如晶格常数、弹性常数、缺陷形成能等是否与DFT或实验值相符。本项目的特殊之处在于我们保持训练数据集的结构、机器学习模型架构和超参数完全不变唯一变量是生成这些训练数据时所使用的DFT赝势。这使我们能够孤立地研究赝势选择这一单一因素对最终机器学习势函数性能特别是在辐射损伤模拟这一特定应用场景下的影响。3. 研究方法与模型构建细节为了进行严谨的对比我们构建了两个几乎完全相同的镍金属tabGAP势函数仅在训练数据的DFT计算层面存在差异。3.1 势函数模型Tabulated Gaussian Approximation Potential (tabGAP)我们选择tabGAP作为机器学习势函数的实现框架。它是高斯近似势的一种高效表格化版本通过将能量贡献映射到低维网格并使用三次样条插值进行快速求值实现了比原始GAP高数个数量级的计算速度使其能够处理百万原子级别的大规模辐射级联模拟。势函数的总能量表达式包含了四个主要部分E_total E_repulsive E_2b E_3b E_eam排斥势能 (E_repulsive)用于精确描述短程强排斥作用。我们采用了基于全电子DFT数据重新拟合的Ziegler-Biersack-Littmark类型势。该势在约1.0-2.2 Å的截断范围内起作用确保与中长程的机器学习部分平滑衔接。两体项 (E_2b)依赖于原子对距离的贡献由机器学习模型学习。三体项 (E_3b)依赖于三个原子形成的键角环境的贡献用于描述键的方向性由机器学习模型学习。嵌入原子法项 (E_eam)依赖于局域电子密度的贡献模拟金属键的离域特性同样由机器学习模型学习。两个对比势函数的定义Ni-tabGAP基于标准Ni赝势平面波截断能500 eV生成的DFT数据训练。Ni-pv-tabGAP基于包含半核处理的Ni pv赝势平面波截断能650 eV生成的DFT数据训练。除了DFT计算参数两个势函数所使用的训练数据集结构、测试集划分、模型超参数以及外部排斥势完全相同。这确保了观察到的任何差异都可归因于赝势选择。3.2 模拟与分析方法为了全面评估势函数性能我们进行了一系列从基础到应用的模拟计算基础物性验证计算晶格常数、弹性常数、空位和间隙原子形成能、表面能、熔化温度等与DFT及实验值对比确保势函数在平衡态附近的可靠性。二聚体曲线与体积-能量曲线直接考察势函数在短程~0.5 Å到中程范围内的排斥行为以及在高压缩状态下的稳定性。准静态拖动计算模拟一个原子沿特定晶体学方向被缓慢拖动的过程记录系统总能变化。这是一种评估势函数在位移事件路径上能量剖面的有效方法与阈值位移能相关。阈值位移能计算法在低温10 K下从晶格中随机选取一个原子初级碰撞原子PKA赋予其特定方向的动能。过程以2 eV为步长递增PKA能量进行分子动力学模拟直到产生一个稳定的Frenkel对一个空位和一个间隙原子。统计对800个随机方向进行采样获得TDE的方向分布及平均值。初级辐射损伤级联模拟设置在300 K热化的系统中引入一个具有特定能量如5 keV, 10 keV的PKA。过程模拟级联演化过程约50 ps包含电子阻止本领对动能高于10 eV的原子施加摩擦项。分析使用Wigner-Seitz方法统计最终稳定的Frenkel对数量使用位错提取算法分析产生的位错类型和长度。大规模重叠级联模拟目的模拟高剂量辐照下的累积损伤更接近真实实验条件。方法在同一个模拟原胞中依次随机引入大量如数千个低能5 keVPKA事件每个事件模拟20 ps后让系统弛豫。最终状态用于与卢瑟福背散射/沟道谱实验对比。与实验对比将重叠级联模拟产生的损伤结构输入到RBSADEC代码中计算3.5 MeV He离子背散射产额并与真实的RBS/c实验谱图进行直接比较。4. 结果分析与讨论赝势差异的微观体现与宏观影响4.1 基础物性与短程相互作用差异的源头首先从最基本的验证指标来看两个tabGAP势函数的表现令人惊讶地一致。表格 1: 两个tabGAP势函数的基础物性对比部分性质Ni-tabGAPNi-pv-tabGAPDFT参考值实验值晶格常数 (Å)3.5183.5173.5193.524空位形成能 (eV)1.471.441.49~1.79100间隙形成能 (eV)4.134.204.07-弹性常数 C11 (GPa)281289273247(100)面表面能 (mJ/m²)220822482210~1940熔化温度 (K)16901725-1726如表所示两者在平衡性质上的差异微乎其微均能很好地再现DFT计算结果。体积-能量曲线在直到约20 eV/atom的高能压缩状态下也几乎重叠。这表明对于绝大多数近平衡态性质标准赝势提供的训练数据已经足够。然而差异在二聚体曲线上显露无遗。当我们将二聚体能量与原子间距的关系绘制在双对数坐标下时可以清晰地看到在0.5 Å到1.5 Å的关键短程区间内Ni-pv-tabGAP的排斥势比Ni-tabGAP更“硬”即相同距离下能量更高。Ni-pv-tabGAP的曲线能更平滑地过渡到外部ZBL排斥势而Ni-tabGAP在此区间表现出一定程度的“软化”。关键发现与解释这种“软化”并非模型缺陷而是机器学习模型忠实学习其训练数据的结果。Ni-tabGAP的训练数据来自标准赝势DFT计算其在短程区本身就比包含半核处理的赝势计算更“软”。尽管两个模型都连接了相同的外部ZBL势但机器学习部分在衔接区~1.0-2.2 Å学到了不同的行为。这揭示了一个重要教训为机器学习势函数添加一个ZBL排斥势并不能自动保证短程排斥作用的准确性最终行为严重依赖于训练数据在该区域的覆盖度和精度。4.2 阈值位移能出人意料的相似性阈值位移能是辐射损伤研究中的一个基本参数。直觉上更“硬”的短程排斥意味着原子更难被推开可能需要更高的能量才能产生位移即TDE可能更高。我们的计算结果却显示了一个微妙而有趣的图景方向分布两种势函数预测的TDE空间分布模式高度相似低能区40 eV主要集中在100和110方向附近高能区则出现在其他方向。平均值Ni-tabGAP的平均TDE约为43 eV而Ni-pv-tabGAP的平均TDE约为48 eV。尽管后者略高但差异~5 eV远小于使用不同经典势函数如Bonny势函数预测的平均TDE可达70 eV带来的差异。Stoller的经典势函数结果与Ni-pv-tabGAP非常接近。表格 2: 不同势函数的阈值位移能对比 (eV)方向/平均值Ni-tabGAPNi-pv-tabGAPStoller EAMBonny EAM实验范围1002224263823-601102426224220-50111788276105-平均 (球面平均)43484670~40 (ASTM推荐)深度分析TDE并非只由最近邻的刚性排斥决定。位移事件是一个动态过程涉及能量沿晶格的耗散、聚焦碰撞序列以及最终缺陷的稳定化。更“硬”的排斥可能使初始碰撞更“局域化”能量更不易传递出去但同时可能产生更强烈的局部激发反而有助于克服势垒。这两种竞争效应可能导致TDE对短程排斥硬度的变化并不敏感。这一结果提示平均TDE可能不是一个区分势函数短程精度的敏感指标。4.3 初级损伤与重叠级联差异被放大当模拟从单个位移事件扩展到完整的辐射损伤级联时赝势选择带来的差异开始显著显现。对于单个初级损伤级联如5 keV PKAFrenkel对数量使用Ni-pv-tabGAP模拟产生的稳定Frenkel对数量平均比使用Ni-tabGAP时减少约10%-15%。物理图像“更硬”的势函数导致原子在碰撞的初始阶段受到更强的减速碰撞级联的的空间范围可能更紧凑能量在更小的体积内沉积。这使得能量通过热峰效应以原子振动热的形式耗散的比例增加而用于永久性原子位移产生缺陷的比例相应减少。对于大规模重叠级联模拟模拟高剂量辐照这种差异被进一步放大并与实验产生了有意义的关联。我们将模拟产生的损伤结构空位和间隙原子团簇、位错环等输入到RBS/c模拟代码中计算了背散射产额随深度的变化。核心发现使用Ni-pv-tabGAP势函数模拟得到的RBS/c谱与实验测量结果符合得更好。Ni-tabGAP倾向于高估了实验观测到的损伤浓度。这是因为在重叠级联中新产生的点缺陷会与先前存在的缺陷如空位团、位错环发生相互作用。更“硬”的势函数产生的初始缺陷更少同时可能影响缺陷的迁移和聚集行为最终导致不同的累积损伤微观结构这种微观结构上的差异在RBS/c谱这种对缺陷分布敏感的宏观测量中得以体现。实操心得这项对比突显了验证势函数时需要与应用场景匹配的重要性。即使两个势函数在基础物性和TDE上表现相似它们在预测真实辐照条件下的累积损伤时可能给出系统性不同的结果。与实验可观测量的直接对比如RBS/c谱是评估势函数用于特定模拟场景可靠性的黄金标准。4.4 训练后修正排斥相互作用的尝试鉴于短程排斥的重要性一个很自然的问题是能否在机器学习势函数训练完成后对其短程部分进行修正或“硬化”而无需重新进行昂贵的DFT计算和模型训练我们测试了两种思路“硬化”处理直接替换tabGAP两体项在短距离处的表格值用更“硬”的排斥势如基于更精确计算的ZBL势数据覆盖并通过一个平滑切换函数与中程的原始机器学习部分衔接。这种方法类似于经典势函数中常用的“势硬化”技术。势函数融合将Ni-tabGAP和Ni-pv-tabGAP的两个两体项表格在短程区进行平滑融合。例如在很短的距离使用Ni-pv-tabGAP的“硬”数据随着距离增加逐渐过渡到Ni-tabGAP的数据。初步测试表明方法1“硬化”在技术上是可行的能够生成一条符合预期的、更硬的二聚体曲线。然而这种“外科手术式”的修改破坏了模型内在的一致性。机器学习势函数是一个高度非线性的整体强行修改其一个组成部分两体项可能引发不可预料的副作用例如在其他非训练构型如特定缺陷构型、液态上产生不物理的行为。方法2融合则面临如何确定最优切换区域参数的挑战且其物理依据不如方法1明确。注意事项训练后修正是一把双刃剑。它为解决已训练模型的已知短板提供了快速途径但必须进行极其广泛的验证包括计算各种缺陷形成能、声子谱、高温液态性质等以确保修改没有引入新的、更严重的问题。最稳健的方案仍然是在构建训练数据库时就使用能准确描述短程相互作用的DFT设置如半核赝势来生成数据。5. 结论与对从业者的启示本研究通过一个控制变量清晰的对比实验系统揭示了第一性原理计算中赝势选择对后续机器学习势函数性能特别是在辐射损伤模拟这一苛刻应用中的传导性影响。主要结论如下短程精度依赖训练数据机器学习势函数在短程排斥区域的准确性直接继承自其训练数据。使用描述短程相互作用更精确的“硬”赝势如包含半核处理的赝势是获得可靠短程行为的根本。平衡性质不敏感动态过程敏感赝势选择对势函数预测的平衡态材料性质晶格常数、弹性模量等影响很小但对远离平衡的动力学过程——特别是辐射损伤级联中缺陷的产生效率——有显著影响。Ni-pv-tabGAP预测的缺陷产生率低于Ni-tabGAP。阈值位移能可能不是敏感指标尽管短程排斥行为不同但两种势函数给出的平均阈值位移能非常接近。这表明TDE作为单一标量参数可能无法全面反映势函数在复杂碰撞级联中的行为差异。累积损伤预测差异显著在模拟高剂量辐照的重叠级联时由赝势差异引发的缺陷产生率差异会被放大导致最终预测的损伤微观结构和宏观实验观测谱RBS/c出现明显不同。与Ni-tabGAP相比Ni-pv-tabGAP的预测与实验符合得更好。训练后修正需谨慎虽然可以通过“势硬化”或融合技术对已训练势函数的短程部分进行事后修正但这可能破坏模型的内禀一致性需要伴随大量的重新验证工作。对计算材料学与辐照效应研究者的实用建议明确应用目标如果模拟主要关注平衡态或近平衡态性质如扩散、晶界迁移标准赝势训练出的机器学习势函数可能已足够。若研究涉及高能粒子碰撞、冲击压缩、辐射损伤等极端条件必须优先考虑使用能精确描述短程相互作用的DFT设置来生成训练数据。系统验证不可或缺评估一个用于辐射损伤模拟的势函数绝不能止步于基础物性验证。必须包含短程测试二聚体曲线、高压缩体积-能量曲线、动态测试阈值位移能分布、初级级联缺陷产额以及与实验的对比如可能。数据库构建策略在构建训练数据库时应有意识地包含足够多的高能、短原子间距的构型。这些构型的DFT计算应使用更精确的赝势和更高的截断能。报告计算细节在发表基于机器学习势函数的模拟工作时应详细说明训练数据生成的DFT参数赝势类型、截断能、交换关联泛函等这有助于他人评估势函数的适用范围和潜在局限性。本项工作表明机器学习势函数为实现高精度辐射损伤模拟带来了巨大希望但其预测能力的“天花板”在很大程度上由底层第一性原理数据的质量决定。在追求模型架构创新的同时夯实数据基础特别是对极端条件下关键物理过程的准确描述是提升整个模拟链条可信度的重中之重。

相关新闻

Android包体积优化：聚焦混淆技术深度解析

Box64跨架构兼容指南：在ARM/RISC-V设备上运行x86_64程序的终极解决方案

乌尔都语反语检测实战：从传统机器学习到LLaMA 3大模型的迁移学习方案

LangGraph工作流引擎到工程实践的量化分析

别再为MMD模型导入UE5的物理bug头疼了！手把手教你搞定Blender缩放与单位设置

温差发电驱动轻型电动车：热电模块与催化燃烧器的系统集成实践

如何用Neat Bookmarks免费解决Chrome书签管理混乱难题

UE5.1升级后MetaHuman动不了？别慌，手把手教你搞定增强输入系统（附蓝图节点替换清单）

微信PC版自动化避坑指南：我踩过的5个雷，希望你别再踩了

【AI Daily】AI日报 | 2026-05-24

Go语言MongoDB文档数据库操作指南

【前端无障碍】无障碍测试：确保你的应用对所有人友好

为什么你的AI Agent总在跨境清关环节“失语”？揭秘NLP+规则引擎混合推理的5个关键断点

【AI Agent行业落地黄金法则】：20年架构师亲授7大避坑指南与3个已验证千万级ROI场景

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪 技术地位与核心优势

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪技术地位与核心优势