1. 项目概述为什么我们需要一个更快的GST势函数如果你在材料模拟领域工作过尤其是研究过像锗锑碲Ge₂Sb₂Te₅简称GST这样的相变存储材料那你一定对“算力焦虑”深有体会。GST之所以是下一代非易失性存储器的理想候选者核心在于它能在非晶态和晶态之间快速、可逆地切换这两种状态迥异的电阻率或反射率正好对应着二进制的“0”和“1”。但要真正理解这个相变过程在原子尺度上是如何发生的比如晶核如何形成、生长界面如何移动就需要进行大规模的分子动力学MD模拟。传统的路径有两条但都有各自的瓶颈。一条路是使用经验势比如Lennard-Jones势计算飞快但对于GST这种电子结构起关键作用的复杂体系精度远远不够无法捕捉到其竞争性的结构基元。另一条路是诉诸量子力学精度的密度泛函理论DFT进行从头算分子动力学AIMD。精度是够了但代价是惊人的计算成本。模拟一个几百个原子的体系跑上几十皮秒可能就需要消耗海量的计算资源想要模拟器件尺度的百万原子体系、纳秒乃至微秒级的相变循环几乎是不可能完成的任务。于是机器学习势函数MLP应运而生成为了连接高精度DFT与大规模MD模拟的“桥梁”。它的核心思想很直观我们不直接求解复杂的薛定谔方程而是用机器学习模型去学习DFT计算出来的“标准答案”——即不同原子构型下的能量和受力。一旦模型训练好在预测新构型时它就能以接近经验势的速度给出接近DFT精度的结果。近年来高斯近似势GAP等模型在GST上已经取得了成功但GAP模型本身的计算复杂度依然较高模拟大尺度、长时标的体系仍然充满挑战。这就引出了我们工作的核心基于原子簇展开ACE框架为GST构建一个计算效率提升数个量级的机器学习势函数。我们不仅采用了传统的直接从DFT数据学习的策略还探索了一种称为“间接学习”的新方法先用GAP模型生成海量的训练数据再用这些数据来训练ACE势函数。这相当于用已经训练好的“教师模型”GAP来教导一个更轻量、更高效的“学生模型”ACE。最终我们得到的ACE势函数在精度上与GAP相当但计算速度提升了三个数量级并且通过GPU加速还能再获得一到两个数量级的提升。这使得在普通计算资源上对百万原子级别的GST器件进行纳秒级的反复相变模拟成为了现实。2. 核心思路拆解ACE框架与两种学习策略2.1 为什么选择原子簇展开ACE框架在众多机器学习势函数框架中如神经网络势、GAP等我们选择ACE主要是看中了它在表达效率和计算速度之间的绝佳平衡。你可以把构建势函数想象成用一组基函数去拟合一个极其复杂的多维曲面势能面。ACE框架提供了一套完整的、具有物理对称性平移、旋转、同种原子置换不变性的多体基函数。它的核心公式描述了原子i的局域环境属性ϕ_i^(p) Σ_{ν2}^{ν_max} Σ_{μnlm} c̃_{μiμnlm}^{(p)} A_{iμnlm}看起来复杂但我们可以拆解一下ν代表多体项的阶数从2体对势开始一直到我们设定的最大阶数ν_max这里取6。这意味着ACE能系统地包含二体、三体乃至更高阶的相互作用这对于描述GST中复杂的键合环境至关重要。μ代表化学元素种类Ge, Sb, Te。n, l, m是基函数索引其中径向部分R_{nl}我们采用了指数缩放的切比雪夫多项式角向部分则由球谐函数Y_{lm}描述。A_{iμnlm}就是这些基函数在原子i局域环境下的具体值。ACE的巧妙之处在于它通过引入广义克莱布什-戈丹系数将旋转不对称的基函数A变换为具有旋转和反演对称性的基函数B来进行训练。训练完成后再变换回A来进行高效的力和能量评估。这种设计使得ACE既能表达复杂的多体相互作用又保持了极高的计算效率。此外我们采用了类似Finnis-Sinclair势的非线性能量依赖形式E_i ϕ_i^{(1)} - sqrt(ϕ_i^{(2)})这有助于用更低的体阶数达到收敛进一步提升了模型的表现力。2.2 直接学习 vs. 间接学习策略背后的权衡训练一个可靠的MLP高质量且充足的训练数据是基石。这里我们面临两种策略选择直接学习这是最经典的方法。我们使用Zhou等人公开的GST的GAP模型训练数据集。这个数据集非常全面包含了元素、二元和三元GST的不同构型如二聚体、非晶/部分非晶结构、多种晶体结构等。我们直接用这些构型对应的DFT计算出的能量和原子受力来训练我们的ACE势函数记为ACE-Dir。这种方法直接对接“金标准”DFT理论上是信息损失最小的路径。间接学习这是一种新兴且颇具潜力的思路。我们不再直接使用昂贵的DFT数据而是以训练好的GAP模型作为“数据生成器”。我们对相同的构型用GAP重新计算其能量和受力然后用这些GAP生成的数据来训练ACE势函数记为ACE-Indir1。这听起来有点“二手学习”的味道但其优势巨大它可以极大地扩充训练集。DFT计算成本高昂生成数十万构型的数据已是极限。而GAP虽然比DFT慢但比DFT快得多我们可以用GAP轻松生成百万甚至千万级别的构型数据覆盖更广泛的相空间例如在不同密度下进行等容降温采集大量平衡态构型。我们用这种方式生成了一个包含144万原子环境的扩展训练集并训练了第二个间接学习势函数ACE-Indir2。关键考量间接学习会损失精度吗这是所有人最关心的问题。我们的核心验证工作之一就是对比ACE-Dir和ACE-Indir1。如果两者在物理性质预测上表现一致那就证明GAP这个“教师”已经足够好能够将其从DFT学到的知识“蒸馏”给ACE这个“学生”而不会引入显著的误差。这为在缺乏大规模DFT数据的新体系上快速构建高效MLP提供了新思路。3. 模型构建与训练实操要点3.1 数据准备与预处理我们直接利用了已发表的GAP训练集这保证了对比的公平性。原始数据集包含二聚体构型但在我们的训练中我们移除了所有二聚体。这是因为我们发现试图在PACE训练中同时包含二聚体和块体GST构型会导致对相互作用偏向更高的能量从而在凝聚相的高温模拟中产生不稳定性。此外二聚体的局域环境与我们所关注的块体凝聚相截然不同。最终我们用于直接和间接学习基础版的训练集包含340,709个原子环境。对于扩展的间接学习ACE-Indir2我们利用GAP模拟了12条不同密度5.85 到 6.40 g/cm³的等容降温路径从1200 K到300 K。每条路径上我们每隔5 K保存一个构型。将这些新构型与原始的GAP训练集合并得到了总计1,441,445个原子环境的大数据集。这个数据集不仅包含了多样的结构和化学计量还囊括了大量在目标热力学条件下平衡的构型。3.2 ACE模型训练参数与损失函数我们使用PACE实现进行所有ACE势函数的训练。关键参数设置如下截断半径r_cut: 设为5.5 Å与GAP模型的截断半径保持一致确保学习相同的相互作用范围。内层排斥势: 在1 Å以内采用一个经验性的径向核排斥势U_rep U_0 * exp(-σr²)/r其中U_0 100 eV·Åσ 5 Å⁻²这是PACE的默认值用于防止原子在模拟中过度接近。体阶数ν_max: 设置为6以充分捕捉GST中可能存在的复杂多体效应。损失函数权重κ: 损失函数同时惩罚能量和力的预测误差。参数κ用于调整两者权重力分量的权重为κ能量分量的权重为1-κ。我们测试发现在0.3 ≤ κ ≤ 0.7的范围内误差几乎不变。最终所有训练均采用κ 0.3给予能量稍高的权重。训练/测试集划分: 随机将80%的构型用于训练20%用于测试以评估模型的泛化能力。3.3 训练结果与误差分析在测试集上的均方根误差RMSE是我们评估模型拟合精度的第一道关卡ACE-Dir(直接学习): 能量误差 19.92 meV/atom力误差 148.95 meV/Å。ACE-Indir1(间接学习基础集): 能量误差 19.23 meV/atom力误差 88.01 meV/Å。ACE-Indir2(间接学习扩展集): 能量误差 26.90 meV/atom力误差 91.48 meV/Å。这些误差与近期其他GST的MLP工作能量误差~1-10 meV/atom力误差~10-100 meV/Å处于同一量级。一个有趣的现象是直接学习模型的力误差明显高于两个间接学习模型。这其实是预期的因为GAP等MLP本身会对DFT计算的势能面进行平滑而间接学习的数据源GAP已经是平滑后的结果所以ACE在拟合时面对的是一个更“规整”的目标函数。实操心得不要过分迷信测试集的RMSE数字。它固然重要但只是模型在“已知分布”数据上的表现。一个在测试集上误差很低的模型在实际模拟中尤其是远离训练数据分布的极端条件可能完全失效。因此对模型进行全面的物理性质验证比单纯看误差指标更重要。这也是我们下一部分工作的重点。4. 模型验证从能量、结构到相变行为4.1 直接学习与间接学习的等价性验证我们首先在一条快速等容淬火路径上1200 K - 300 K密度 6.00 g/cm³对比了ACE-Dir和ACE-Indir1。如图3所示两者在整个温度范围内的势能曲线几乎完全重合。同时它们也都能复现GAP模型在同一路径上的结果。这初步证明了间接学习并未牺牲精度。更严格的测试是等压降温模拟1 bar 1200 K - 300 K 40 ns。如图4(a)所示两个模型都预测在大约630 K发生尖锐的液-晶相变且在整个液相和晶相中的势能值定量一致。相变温度的微小差异和晶相势能的细微差别主要源于晶体成核过程的随机性。最有力的证据来自结构对比。我们计算了900 K液态和600 K晶态GST的结构因子S(q)。如图4(b)和(c)所示无论是液态的宽化衍射峰还是晶态的尖锐布拉格峰ACE-Dir和ACE-Indir1预测的结果都几乎无法区分。这表明两种学习策略得到的模型在预测GST的原子排布这一核心结构信息上是一致的。结论对于当前这个高质量、多样化的GAP训练集间接学习可以取得与直接学习同等效果的ACE势函数。这意味着当我们有一个已经训练好的、可靠的“教师”MLP时我们可以用它来廉价地生成海量数据从而训练出更高效的“学生”模型而无需进行额外的昂贵DFT计算。4.2 扩展训练集的效果与模型极限探索既然间接学习可行一个自然的问题是用更大的数据集训练模型会更好吗我们对比了ACE-Indir1基础集和ACE-Indir2扩展集。结果发现在扩展集包含的多种密度等容淬火路径上两个模型的能量预测依然高度一致图5。这说明原始的GAP训练集已经足够多样和全面对于ACE模型来说单纯增加同类平衡构型的数量带来的边际收益很小。避坑指南这个发现提示我们训练集的质量多样性远比单纯的数量更重要。一个精心设计的、能覆盖目标相空间关键区域如不同化学计量、缺陷、表面、过渡态等的小数据集可能比一个庞大但单一的平衡态构型数据集更有效。我们在尝试用仅包含12条等容路径的构型不含原始GAP集的多样结构训练ACE时得到的模型完全无法描述晶体环境这从反面印证了多样性不可或缺。4.3 与实验及GAP的全面结构对标一个优秀的势函数必须能复现实验可观测的量。我们重点验证了ACE-Indir2因其使用了最大数据集。结构因子 S(q)如图6(a)(b)所示ACE预测的液态900 K和晶态550 KGST的结构因子与实验数据以及GAP的预测结果吻合得非常好。峰的位置和形状几乎一致。偏径向分布函数 g(r)图6(c)-(h)展示了Ge-Ge, Ge-Sb, Sb-Sb, Ge-Te, Te-Te, Sb-Te所有原子对的g(r)。ACE的预测曲线与GAP的预测几乎重叠这表明模型在原子对层次的局部结构上也捕捉准确。配位数与键角分布在300 K非晶态下ACE预测的Ge、Sb、Te的平均配位数截断半径3.15 Å分别为4.4、3.7和3.0与DFT研究报道的4.2、3.7和2.9非常接近。Te-Ge-Te和Te-Sb-Te的键角分布P(θ)图7在90°和170°附近出现特征峰这与非晶GST局域立方序的特征一致也与已发表的GAP模拟数据相符。这些全面的结构验证表明我们的ACE模型不仅忠实地继承了GAP的知识也能准确地反映实验观测到的GST结构特征。5. 计算性能与大规模模拟演示5.1 速度提升从CPU到GPU的飞跃计算效率是ACE模型的最大亮点。在相同的硬件资源8个CPU节点上模拟504个原子的GST体系GAP模型完成一段模拟需要近27天。ACE模型完成相同模拟仅需不到23分钟。速度提升超过1700倍。这直接归功于ACE框架本身的高效算法实现。更重要的是ACE原生支持GPU加速。图8展示了不同计算配置下的性能。使用4块GPU配合4个CPU核心相比单CPU核心的情况可以获得高达76.5倍的加速相比我们常用的8 CPU核心配置也有约10.2倍的加速。这意味着对于包含10^3到10^4原子的典型模拟体系GPU加速能将计算时间从“天”缩短到“小时”甚至“分钟”级别。5.2 器件尺度模拟百万原子与多次相变凭借这种效率我们实现了之前难以企及的大尺度模拟百万原子结晶我们模拟了一个包含1,008,000个原子的GST体系在600 K下的结晶过程时长1纳秒图9。通过追踪体系势能和结晶度百分比可以清晰看到晶核形成、生长并最终达到准完全结晶的过程。整个模拟在4 GPU 4 CPU的配置下仅用了10天左右完成。反复相变循环我们模拟了一个100,800原子体系在周期性热循环下的相变行为图10。体系在900 K熔化快速淬火至300 K形成玻璃态再加热至600 K结晶如此循环5次总时长10.5纳秒。这直接模拟了相变存储器中“写-擦-写”的数据编码过程证明了我们的模型能够稳定、高效地模拟GST的核心功能特性。这些演示表明ACE模型使得在可接受的计算成本和时间内研究器件尺度的GST相变动力学、成核生长、缺陷影响等实际问题成为可能。6. 模型局限性分析与使用注意事项没有任何模型是完美的清楚认识其边界至关重要。我们的ACE模型在重现GST结构和热力学性质上表现优异但在一些对应力张量特别敏感的物理量上与实验存在可察的偏差。6.1 密度与压力的偏差在1个大气压下ACE模型预测的液态GST密度在整个温度范围内系统地低于实验值约1%到2.5%图11a。换言之如果在实验中观测到的密度下进行模拟模型给出的压力会高于实际大气压。这种压力标度的偏差在分子模拟中很常见因为压力对势函数的细节极其敏感。应对策略在进行需要精确控制压力的模拟时如NPT系综建议以实验密度而非实验压力作为模拟条件。或者在分析结果时需要意识到这一系统偏差。6.2 熔点与动力学的偏差我们采用“界面法”测得的平衡熔点 T_m^(ACE) 796 K低于实验值约900 K。同时通过格林-久保关系计算的剪切粘度η也系统地低于实验值图11b。与之对应自扩散系数则高于DFT预测值。这些迹象都指向同一个结论我们的ACE模型高估了GST原子的流动性。这种增强的流动性也导致了晶体生长速率的加快。如图12所示虽然ACE模型成功预测了晶体生长速率随温度的非单调变化在约0.75 T_m处出现最大值但其绝对数值比实验值快了几倍。6.3 偏差根源探讨与改进尝试这些偏差很可能并非源于ACE模型本身而是其训练数据源——基于PBEsol泛函的DFT计算——的固有局限。DFT泛函在描述长程色散范德华相互作用方面存在不足。我们尝试为ACE模型添加了常用的D2色散修正。经过参数调试我们找到一组能保持结构不变的参数s60.75 sr1.15。加入修正后熔点提高至865 K更接近实验值但粘度并未得到显著改善而密度则被过度修正高于实验值约5%。这表明应力相关性质的准确再现对底层电子结构方法的细节非常敏感。近期另一项使用不同泛函的AIMD工作甚至高估了粘度。因此当前ACE模型在动力学性质粘度、扩散、晶体生长速率上提供的是定性或半定量的趋势而非精确的定量值。重要提示使用本ACE势函数研究GST的相变动力学时务必意识到其动力学过程如结晶速度比实际实验更快。这既是局限也可能成为优势——它允许我们在有限的模拟时间内探索更宽泛的热力学或约束条件下的结晶行为变化趋势。7. 总结与资源获取我们成功基于原子簇展开框架通过直接和间接学习策略开发了用于GST的高效机器学习势函数。关键结论如下间接学习策略有效在拥有高质量“教师”模型GAP的前提下通过间接学习训练的ACE势函数ACE-Indir1在物理性质预测上与直接学习模型ACE-Dir表现一致。这为快速构建新材料的高效MLP开辟了低成本路径。ACE模型效率卓越相比之前的GAP模型ACE在CPU上实现了超过3个数量级的加速结合GPU还可再提升1-2个数量级。这使得百万原子、纳秒尺度的器件模拟在普通计算资源上变得可行。模型精度可靠在结构S(q) g(r) 配位数键角、热力学相变温度、能量等核心性质上ACE模型与GAP及实验数据吻合良好。明确其适用范围模型在应力相关性质密度、压力、粘度和动力学扩散、晶体生长速率上存在定量偏差使用时需注意。它非常适合用于研究结构演变、相变机理、成核生长模式等结构敏感的问题而在需要精确动力学定量的场合应谨慎对待。模型获取训练好的ACE势函数已公开在Zenodo上DOI: 10.5281/zenodo.12173540供学术界和工业界的研究者免费使用。相关的分子动力学轨迹和扩展训练集构型也可根据合理请求从通讯作者处获取。个人体会这项工作让我深刻体会到在机器学习势函数领域“没有免费的午餐”定理依然适用。我们通过巧妙的模型框架ACE和学习策略间接学习用计算效率换取了接近DFT的精度并实现了大规模模拟的能力。然而最终模型的精度上限依然被其训练数据——即底层DFT计算的质量——所锚定。未来一个值得探索的方向是将不同来源的高质量DFT数据或许使用更先进的泛函或包含色散修正与间接学习策略结合以期在保持ACE超高效计算优势的同时进一步提升其对动力学性质的预测精度。对于材料模拟的实践者来说理解手中工具的强项与边界比盲目追求某个指标的提升更为重要。
基于ACE框架的GST机器学习势函数:高效模拟相变存储材料
1. 项目概述为什么我们需要一个更快的GST势函数如果你在材料模拟领域工作过尤其是研究过像锗锑碲Ge₂Sb₂Te₅简称GST这样的相变存储材料那你一定对“算力焦虑”深有体会。GST之所以是下一代非易失性存储器的理想候选者核心在于它能在非晶态和晶态之间快速、可逆地切换这两种状态迥异的电阻率或反射率正好对应着二进制的“0”和“1”。但要真正理解这个相变过程在原子尺度上是如何发生的比如晶核如何形成、生长界面如何移动就需要进行大规模的分子动力学MD模拟。传统的路径有两条但都有各自的瓶颈。一条路是使用经验势比如Lennard-Jones势计算飞快但对于GST这种电子结构起关键作用的复杂体系精度远远不够无法捕捉到其竞争性的结构基元。另一条路是诉诸量子力学精度的密度泛函理论DFT进行从头算分子动力学AIMD。精度是够了但代价是惊人的计算成本。模拟一个几百个原子的体系跑上几十皮秒可能就需要消耗海量的计算资源想要模拟器件尺度的百万原子体系、纳秒乃至微秒级的相变循环几乎是不可能完成的任务。于是机器学习势函数MLP应运而生成为了连接高精度DFT与大规模MD模拟的“桥梁”。它的核心思想很直观我们不直接求解复杂的薛定谔方程而是用机器学习模型去学习DFT计算出来的“标准答案”——即不同原子构型下的能量和受力。一旦模型训练好在预测新构型时它就能以接近经验势的速度给出接近DFT精度的结果。近年来高斯近似势GAP等模型在GST上已经取得了成功但GAP模型本身的计算复杂度依然较高模拟大尺度、长时标的体系仍然充满挑战。这就引出了我们工作的核心基于原子簇展开ACE框架为GST构建一个计算效率提升数个量级的机器学习势函数。我们不仅采用了传统的直接从DFT数据学习的策略还探索了一种称为“间接学习”的新方法先用GAP模型生成海量的训练数据再用这些数据来训练ACE势函数。这相当于用已经训练好的“教师模型”GAP来教导一个更轻量、更高效的“学生模型”ACE。最终我们得到的ACE势函数在精度上与GAP相当但计算速度提升了三个数量级并且通过GPU加速还能再获得一到两个数量级的提升。这使得在普通计算资源上对百万原子级别的GST器件进行纳秒级的反复相变模拟成为了现实。2. 核心思路拆解ACE框架与两种学习策略2.1 为什么选择原子簇展开ACE框架在众多机器学习势函数框架中如神经网络势、GAP等我们选择ACE主要是看中了它在表达效率和计算速度之间的绝佳平衡。你可以把构建势函数想象成用一组基函数去拟合一个极其复杂的多维曲面势能面。ACE框架提供了一套完整的、具有物理对称性平移、旋转、同种原子置换不变性的多体基函数。它的核心公式描述了原子i的局域环境属性ϕ_i^(p) Σ_{ν2}^{ν_max} Σ_{μnlm} c̃_{μiμnlm}^{(p)} A_{iμnlm}看起来复杂但我们可以拆解一下ν代表多体项的阶数从2体对势开始一直到我们设定的最大阶数ν_max这里取6。这意味着ACE能系统地包含二体、三体乃至更高阶的相互作用这对于描述GST中复杂的键合环境至关重要。μ代表化学元素种类Ge, Sb, Te。n, l, m是基函数索引其中径向部分R_{nl}我们采用了指数缩放的切比雪夫多项式角向部分则由球谐函数Y_{lm}描述。A_{iμnlm}就是这些基函数在原子i局域环境下的具体值。ACE的巧妙之处在于它通过引入广义克莱布什-戈丹系数将旋转不对称的基函数A变换为具有旋转和反演对称性的基函数B来进行训练。训练完成后再变换回A来进行高效的力和能量评估。这种设计使得ACE既能表达复杂的多体相互作用又保持了极高的计算效率。此外我们采用了类似Finnis-Sinclair势的非线性能量依赖形式E_i ϕ_i^{(1)} - sqrt(ϕ_i^{(2)})这有助于用更低的体阶数达到收敛进一步提升了模型的表现力。2.2 直接学习 vs. 间接学习策略背后的权衡训练一个可靠的MLP高质量且充足的训练数据是基石。这里我们面临两种策略选择直接学习这是最经典的方法。我们使用Zhou等人公开的GST的GAP模型训练数据集。这个数据集非常全面包含了元素、二元和三元GST的不同构型如二聚体、非晶/部分非晶结构、多种晶体结构等。我们直接用这些构型对应的DFT计算出的能量和原子受力来训练我们的ACE势函数记为ACE-Dir。这种方法直接对接“金标准”DFT理论上是信息损失最小的路径。间接学习这是一种新兴且颇具潜力的思路。我们不再直接使用昂贵的DFT数据而是以训练好的GAP模型作为“数据生成器”。我们对相同的构型用GAP重新计算其能量和受力然后用这些GAP生成的数据来训练ACE势函数记为ACE-Indir1。这听起来有点“二手学习”的味道但其优势巨大它可以极大地扩充训练集。DFT计算成本高昂生成数十万构型的数据已是极限。而GAP虽然比DFT慢但比DFT快得多我们可以用GAP轻松生成百万甚至千万级别的构型数据覆盖更广泛的相空间例如在不同密度下进行等容降温采集大量平衡态构型。我们用这种方式生成了一个包含144万原子环境的扩展训练集并训练了第二个间接学习势函数ACE-Indir2。关键考量间接学习会损失精度吗这是所有人最关心的问题。我们的核心验证工作之一就是对比ACE-Dir和ACE-Indir1。如果两者在物理性质预测上表现一致那就证明GAP这个“教师”已经足够好能够将其从DFT学到的知识“蒸馏”给ACE这个“学生”而不会引入显著的误差。这为在缺乏大规模DFT数据的新体系上快速构建高效MLP提供了新思路。3. 模型构建与训练实操要点3.1 数据准备与预处理我们直接利用了已发表的GAP训练集这保证了对比的公平性。原始数据集包含二聚体构型但在我们的训练中我们移除了所有二聚体。这是因为我们发现试图在PACE训练中同时包含二聚体和块体GST构型会导致对相互作用偏向更高的能量从而在凝聚相的高温模拟中产生不稳定性。此外二聚体的局域环境与我们所关注的块体凝聚相截然不同。最终我们用于直接和间接学习基础版的训练集包含340,709个原子环境。对于扩展的间接学习ACE-Indir2我们利用GAP模拟了12条不同密度5.85 到 6.40 g/cm³的等容降温路径从1200 K到300 K。每条路径上我们每隔5 K保存一个构型。将这些新构型与原始的GAP训练集合并得到了总计1,441,445个原子环境的大数据集。这个数据集不仅包含了多样的结构和化学计量还囊括了大量在目标热力学条件下平衡的构型。3.2 ACE模型训练参数与损失函数我们使用PACE实现进行所有ACE势函数的训练。关键参数设置如下截断半径r_cut: 设为5.5 Å与GAP模型的截断半径保持一致确保学习相同的相互作用范围。内层排斥势: 在1 Å以内采用一个经验性的径向核排斥势U_rep U_0 * exp(-σr²)/r其中U_0 100 eV·Åσ 5 Å⁻²这是PACE的默认值用于防止原子在模拟中过度接近。体阶数ν_max: 设置为6以充分捕捉GST中可能存在的复杂多体效应。损失函数权重κ: 损失函数同时惩罚能量和力的预测误差。参数κ用于调整两者权重力分量的权重为κ能量分量的权重为1-κ。我们测试发现在0.3 ≤ κ ≤ 0.7的范围内误差几乎不变。最终所有训练均采用κ 0.3给予能量稍高的权重。训练/测试集划分: 随机将80%的构型用于训练20%用于测试以评估模型的泛化能力。3.3 训练结果与误差分析在测试集上的均方根误差RMSE是我们评估模型拟合精度的第一道关卡ACE-Dir(直接学习): 能量误差 19.92 meV/atom力误差 148.95 meV/Å。ACE-Indir1(间接学习基础集): 能量误差 19.23 meV/atom力误差 88.01 meV/Å。ACE-Indir2(间接学习扩展集): 能量误差 26.90 meV/atom力误差 91.48 meV/Å。这些误差与近期其他GST的MLP工作能量误差~1-10 meV/atom力误差~10-100 meV/Å处于同一量级。一个有趣的现象是直接学习模型的力误差明显高于两个间接学习模型。这其实是预期的因为GAP等MLP本身会对DFT计算的势能面进行平滑而间接学习的数据源GAP已经是平滑后的结果所以ACE在拟合时面对的是一个更“规整”的目标函数。实操心得不要过分迷信测试集的RMSE数字。它固然重要但只是模型在“已知分布”数据上的表现。一个在测试集上误差很低的模型在实际模拟中尤其是远离训练数据分布的极端条件可能完全失效。因此对模型进行全面的物理性质验证比单纯看误差指标更重要。这也是我们下一部分工作的重点。4. 模型验证从能量、结构到相变行为4.1 直接学习与间接学习的等价性验证我们首先在一条快速等容淬火路径上1200 K - 300 K密度 6.00 g/cm³对比了ACE-Dir和ACE-Indir1。如图3所示两者在整个温度范围内的势能曲线几乎完全重合。同时它们也都能复现GAP模型在同一路径上的结果。这初步证明了间接学习并未牺牲精度。更严格的测试是等压降温模拟1 bar 1200 K - 300 K 40 ns。如图4(a)所示两个模型都预测在大约630 K发生尖锐的液-晶相变且在整个液相和晶相中的势能值定量一致。相变温度的微小差异和晶相势能的细微差别主要源于晶体成核过程的随机性。最有力的证据来自结构对比。我们计算了900 K液态和600 K晶态GST的结构因子S(q)。如图4(b)和(c)所示无论是液态的宽化衍射峰还是晶态的尖锐布拉格峰ACE-Dir和ACE-Indir1预测的结果都几乎无法区分。这表明两种学习策略得到的模型在预测GST的原子排布这一核心结构信息上是一致的。结论对于当前这个高质量、多样化的GAP训练集间接学习可以取得与直接学习同等效果的ACE势函数。这意味着当我们有一个已经训练好的、可靠的“教师”MLP时我们可以用它来廉价地生成海量数据从而训练出更高效的“学生”模型而无需进行额外的昂贵DFT计算。4.2 扩展训练集的效果与模型极限探索既然间接学习可行一个自然的问题是用更大的数据集训练模型会更好吗我们对比了ACE-Indir1基础集和ACE-Indir2扩展集。结果发现在扩展集包含的多种密度等容淬火路径上两个模型的能量预测依然高度一致图5。这说明原始的GAP训练集已经足够多样和全面对于ACE模型来说单纯增加同类平衡构型的数量带来的边际收益很小。避坑指南这个发现提示我们训练集的质量多样性远比单纯的数量更重要。一个精心设计的、能覆盖目标相空间关键区域如不同化学计量、缺陷、表面、过渡态等的小数据集可能比一个庞大但单一的平衡态构型数据集更有效。我们在尝试用仅包含12条等容路径的构型不含原始GAP集的多样结构训练ACE时得到的模型完全无法描述晶体环境这从反面印证了多样性不可或缺。4.3 与实验及GAP的全面结构对标一个优秀的势函数必须能复现实验可观测的量。我们重点验证了ACE-Indir2因其使用了最大数据集。结构因子 S(q)如图6(a)(b)所示ACE预测的液态900 K和晶态550 KGST的结构因子与实验数据以及GAP的预测结果吻合得非常好。峰的位置和形状几乎一致。偏径向分布函数 g(r)图6(c)-(h)展示了Ge-Ge, Ge-Sb, Sb-Sb, Ge-Te, Te-Te, Sb-Te所有原子对的g(r)。ACE的预测曲线与GAP的预测几乎重叠这表明模型在原子对层次的局部结构上也捕捉准确。配位数与键角分布在300 K非晶态下ACE预测的Ge、Sb、Te的平均配位数截断半径3.15 Å分别为4.4、3.7和3.0与DFT研究报道的4.2、3.7和2.9非常接近。Te-Ge-Te和Te-Sb-Te的键角分布P(θ)图7在90°和170°附近出现特征峰这与非晶GST局域立方序的特征一致也与已发表的GAP模拟数据相符。这些全面的结构验证表明我们的ACE模型不仅忠实地继承了GAP的知识也能准确地反映实验观测到的GST结构特征。5. 计算性能与大规模模拟演示5.1 速度提升从CPU到GPU的飞跃计算效率是ACE模型的最大亮点。在相同的硬件资源8个CPU节点上模拟504个原子的GST体系GAP模型完成一段模拟需要近27天。ACE模型完成相同模拟仅需不到23分钟。速度提升超过1700倍。这直接归功于ACE框架本身的高效算法实现。更重要的是ACE原生支持GPU加速。图8展示了不同计算配置下的性能。使用4块GPU配合4个CPU核心相比单CPU核心的情况可以获得高达76.5倍的加速相比我们常用的8 CPU核心配置也有约10.2倍的加速。这意味着对于包含10^3到10^4原子的典型模拟体系GPU加速能将计算时间从“天”缩短到“小时”甚至“分钟”级别。5.2 器件尺度模拟百万原子与多次相变凭借这种效率我们实现了之前难以企及的大尺度模拟百万原子结晶我们模拟了一个包含1,008,000个原子的GST体系在600 K下的结晶过程时长1纳秒图9。通过追踪体系势能和结晶度百分比可以清晰看到晶核形成、生长并最终达到准完全结晶的过程。整个模拟在4 GPU 4 CPU的配置下仅用了10天左右完成。反复相变循环我们模拟了一个100,800原子体系在周期性热循环下的相变行为图10。体系在900 K熔化快速淬火至300 K形成玻璃态再加热至600 K结晶如此循环5次总时长10.5纳秒。这直接模拟了相变存储器中“写-擦-写”的数据编码过程证明了我们的模型能够稳定、高效地模拟GST的核心功能特性。这些演示表明ACE模型使得在可接受的计算成本和时间内研究器件尺度的GST相变动力学、成核生长、缺陷影响等实际问题成为可能。6. 模型局限性分析与使用注意事项没有任何模型是完美的清楚认识其边界至关重要。我们的ACE模型在重现GST结构和热力学性质上表现优异但在一些对应力张量特别敏感的物理量上与实验存在可察的偏差。6.1 密度与压力的偏差在1个大气压下ACE模型预测的液态GST密度在整个温度范围内系统地低于实验值约1%到2.5%图11a。换言之如果在实验中观测到的密度下进行模拟模型给出的压力会高于实际大气压。这种压力标度的偏差在分子模拟中很常见因为压力对势函数的细节极其敏感。应对策略在进行需要精确控制压力的模拟时如NPT系综建议以实验密度而非实验压力作为模拟条件。或者在分析结果时需要意识到这一系统偏差。6.2 熔点与动力学的偏差我们采用“界面法”测得的平衡熔点 T_m^(ACE) 796 K低于实验值约900 K。同时通过格林-久保关系计算的剪切粘度η也系统地低于实验值图11b。与之对应自扩散系数则高于DFT预测值。这些迹象都指向同一个结论我们的ACE模型高估了GST原子的流动性。这种增强的流动性也导致了晶体生长速率的加快。如图12所示虽然ACE模型成功预测了晶体生长速率随温度的非单调变化在约0.75 T_m处出现最大值但其绝对数值比实验值快了几倍。6.3 偏差根源探讨与改进尝试这些偏差很可能并非源于ACE模型本身而是其训练数据源——基于PBEsol泛函的DFT计算——的固有局限。DFT泛函在描述长程色散范德华相互作用方面存在不足。我们尝试为ACE模型添加了常用的D2色散修正。经过参数调试我们找到一组能保持结构不变的参数s60.75 sr1.15。加入修正后熔点提高至865 K更接近实验值但粘度并未得到显著改善而密度则被过度修正高于实验值约5%。这表明应力相关性质的准确再现对底层电子结构方法的细节非常敏感。近期另一项使用不同泛函的AIMD工作甚至高估了粘度。因此当前ACE模型在动力学性质粘度、扩散、晶体生长速率上提供的是定性或半定量的趋势而非精确的定量值。重要提示使用本ACE势函数研究GST的相变动力学时务必意识到其动力学过程如结晶速度比实际实验更快。这既是局限也可能成为优势——它允许我们在有限的模拟时间内探索更宽泛的热力学或约束条件下的结晶行为变化趋势。7. 总结与资源获取我们成功基于原子簇展开框架通过直接和间接学习策略开发了用于GST的高效机器学习势函数。关键结论如下间接学习策略有效在拥有高质量“教师”模型GAP的前提下通过间接学习训练的ACE势函数ACE-Indir1在物理性质预测上与直接学习模型ACE-Dir表现一致。这为快速构建新材料的高效MLP开辟了低成本路径。ACE模型效率卓越相比之前的GAP模型ACE在CPU上实现了超过3个数量级的加速结合GPU还可再提升1-2个数量级。这使得百万原子、纳秒尺度的器件模拟在普通计算资源上变得可行。模型精度可靠在结构S(q) g(r) 配位数键角、热力学相变温度、能量等核心性质上ACE模型与GAP及实验数据吻合良好。明确其适用范围模型在应力相关性质密度、压力、粘度和动力学扩散、晶体生长速率上存在定量偏差使用时需注意。它非常适合用于研究结构演变、相变机理、成核生长模式等结构敏感的问题而在需要精确动力学定量的场合应谨慎对待。模型获取训练好的ACE势函数已公开在Zenodo上DOI: 10.5281/zenodo.12173540供学术界和工业界的研究者免费使用。相关的分子动力学轨迹和扩展训练集构型也可根据合理请求从通讯作者处获取。个人体会这项工作让我深刻体会到在机器学习势函数领域“没有免费的午餐”定理依然适用。我们通过巧妙的模型框架ACE和学习策略间接学习用计算效率换取了接近DFT的精度并实现了大规模模拟的能力。然而最终模型的精度上限依然被其训练数据——即底层DFT计算的质量——所锚定。未来一个值得探索的方向是将不同来源的高质量DFT数据或许使用更先进的泛函或包含色散修正与间接学习策略结合以期在保持ACE超高效计算优势的同时进一步提升其对动力学性质的预测精度。对于材料模拟的实践者来说理解手中工具的强项与边界比盲目追求某个指标的提升更为重要。