1. 量子机器学习与冷原子模拟一场范式融合的深度解析量子计算和人工智能的交叉正催生一个激动人心的新领域量子机器学习。这不仅仅是两个热门词汇的简单叠加而是一场深刻的范式融合。其核心思想在于利用量子系统本身固有的并行性和纠缠特性来处理那些在经典计算机上计算成本高昂的复杂数据尤其是量子数据本身。对于从事冷原子量子模拟实验的我们来说这无异于打开了一扇全新的大门。过去我们从量子气体显微镜或里德堡原子阵列中获得的海量“快照”数据往往需要依赖物理直觉和预设模型进行分析过程繁琐且容易遗漏隐藏在数据深处的关联。现在量子机器学习提供了一套强大的工具集让我们能够以数据驱动的方式直接从这些测量结果中提取物理规律甚至发现全新的现象。无论是表征复杂的量子态、检测微妙的相变还是反演系统背后的哈密顿量这些方法都展现出了超越传统分析手段的潜力。这篇文章我将结合近年的前沿研究和我们团队的一些实践思考为你深入拆解量子机器学习在冷原子模拟中的核心应用从波函数网络到哈密顿量学习希望能为同行和感兴趣的初学者提供一份扎实的参考。2. 核心原理为什么量子系统是天然的机器学习平台在深入具体应用前我们必须先理解其底层逻辑。量子机器学习在冷原子平台上的可行性根植于量子系统与机器学习模型在结构和功能上的深刻相似性。2.1 量子数据的天然优势并行性与高维嵌入冷原子实验如光学晶格中的超冷原子或里德堡原子阵列能够制备和探测高度可控的量子多体态。一次投影测量projective measurement会坍缩整个量子态产生一个经典比特串例如每个格点上有原子/无原子或自旋向上/向下。重复实验数千次我们就获得了一个由这些“快照”组成的集合。注意这里的“快照”并非系统的完整量子态而是量子态在某个特定测量基下的一次随机投影结果。完整的统计信息蕴含在所有快照的分布中。这些快照数据天然具有两个适合机器学习处理的特性高维特征空间一个包含N个格点的系统其单次快照可以视为一个N维向量。对于机器学习模型尤其是神经网络这正是其擅于处理的输入格式。蕴含非局域关联量子纠缠使得相隔很远的格点状态之间存在关联。这种关联不是简单的局部模式而是复杂的全局模式。卷积神经网络CNN等模型能够自动提取这种空间层级特征无需人工构造复杂的关联函数。2.2 从波函数到网络一种全新的数据表征传统上我们用量子波函数 $\psi(\sigma_1, \sigma_2, ..., \sigma_N)$ 来描述系统这是一个定义在指数大配置空间上的复数函数。直接处理波函数极其困难。一个巧妙的思路是将波函数的“结构”映射到一个网络Graph上这就是“波函数网络”的概念。具体构建方法如下节点每一个可能的量子态配置例如所有格点的自旋排列构成网络的一个节点。连边与权重两个节点配置之间的连边权重由它们对应的波函数振幅的相似性决定。一种常见的定义是权重正比于 $|\langle \sigma_i | \psi \rangle \langle \psi | \sigma_j \rangle|$ 或更复杂的关联度量。从实验数据推断我们无法直接得到波函数但可以从大量实验快照中估计不同配置出现的概率 $P(\sigma) |\langle \sigma | \psi \rangle|^2$进而推断配置之间的“关联强度”从而近似构建这个网络。为什么这样做有价值量子相变伴随着波函数结构的根本性改变。在无序相波函数振幅分布相对均匀且随机对应的网络也更接近随机网络。而在有序相如量子磁体波函数会集中在某些特定的、具有长程关联的配置上这使得网络结构呈现出“无标度”特性——即少数节点关键配置拥有大量连接。通过分析实验快照构建的网络的拓扑性质如度分布、聚类系数我们可以无损且直观地“看到”相变的发生。Mendes-Santos等人2024年在里德堡原子阵列中的工作正是展示了这一点随着系统被驱动穿过量子相变点网络结构从随机向无标度过渡直接反映了多体波函数中长程关联的建立和复杂性的降低。2.3 量子硬件作为计算资源混合与模拟范式除了处理量子数据量子系统本身可以作为执行机器学习算法的硬件。这在里德堡原子阵列中尤为突出其可编程性和天然的多体相互作用使其成为理想的平台。混合数字-模拟量子学习如Lu等人2025提出的方案在里德堡平台上交替执行数字单量子比特门和模拟时间演化在原生里德堡哈密顿量下。这种混合方式利用了模拟演化的高效性和数字门的精确性。在图像分类如MNIST任务中图像数据被编码到量子电路的初始态演化后的测量结果用于分类在量子相检测中直接输入多体哈密顿量的基态波函数进行处理。关键在于里德堡哈密顿量的参数如由阻塞半径决定的晶格参数被用作算法的超参数。实测发现这种混合方案在噪声鲁棒性和所需电路深度方面均优于纯数字方案因为模拟演化更“自然”地利用了系统的物理特性对某些噪声不敏感。量子储备计算这是一种全模拟范式。将量子系统的动力学本身作为一个固定的“储备池”。输入数据可以是经典的如时间序列或图像特征通过调制全局脉冲、局部失谐或原子位置等方式编码到里德堡哈密顿量的参数中。随后系统进行一段时间的模拟量子演化最后的投影测量结果作为数据的“特征嵌入”再输入给一个经典的分类器如线性模型或浅层神经网络。Fujii, Nakajima以及Kornjaca等人的实验表明QRC在时间序列预测、图像分类甚至分子性质预测等任务上取得了与纯经典方法相竞争的结果。其优势在于复杂的量子动力学本身完成了高维非线性特征变换而训练只发生在轻量的经典读出层极大降低了训练成本。量子循环神经网络Bravo等人2022提出将相互作用的里德堡原子视为量子神经元其动力学自然编码了记忆和决策能力。这为处理序列数据如语音、文本的量子算法提供了新的物理实现蓝图。3. 核心应用场景一强关联量子系统的相变探测理解量子多体系统中的相和相变是凝聚态物理的核心。机器学习特别是深度学习为从实验数据中自动、无偏地识别相变提供了强大工具。下面我们以费米-哈伯德和玻色-哈伯德模型为例看机器学习如何大显身手。3.1 费米-哈伯德模型从磁性到奇异金属费米-哈伯德模型是描述强关联电子系统的基石模型与高温超导等前沿问题密切相关。在冷原子实验中通过量子气体显微镜我们可以获得格点分辨的原子排布快照。监督学习的成功实践磁性相变识别Ch‘ng等人2017的开创性工作使用CNN对通过行列式量子蒙特卡洛模拟产生的3D Hubbard模型辅助场构型进行分类训练。网络成功从这些构型中学会了区分顺磁和反铁磁相并准确预测了 Néel 温度 $T_N$与蒙特卡洛结果高度吻合见图5a。更厉害的是通过迁移学习仅在半满一个粒子一个格点数据上训练的网络能够泛化到掺杂系统暗示了反铁磁序在至少5%空穴掺杂下仍然存在。理论模型甄别当理论本身存在争议时机器学习可以充当“裁判”。Bohrdt等人2019训练CNN来区分实验快照和两种竞争理论几何弦理论 vs. π-通量量子自旋液体态产生的模拟图像。训练好的网络将实验快照一致地分类为“弦状”而非自旋液体状图5b这为理解掺杂Mott绝缘体中隐藏的关联提供了有力证据。实操心得在训练这类“判别”网络时构建平衡且具有代表性的理论模拟数据集至关重要。需要确保两种理论的数据在预处理如噪声添加、成像保真度模拟上完全一致否则网络可能学到的是数据生成过程的差异而非物理本质的区别。走向可解释性 深度学习常被诟病为“黑箱”。在量子多体物理中理解网络“为什么”做出判断至关重要。关联子CNNMiles等人2021提出了CCNNs其非线性层被设计为显式计算N点关联函数。当用于FH模型快照分类时CCNNs学会使用的是诸如自旋-自旋、密度-密度等物理上可解释的关联子。在区分弦理论和自旋液体理论时CCNN识别出四阶关联是区分两者的最关键特征。影响函数分析Dawid等人2020利用影响函数来量化每个训练样本对特定测试输入预测的贡献。这可以帮助我们判断网络是否依赖于物理上有意义的特征进行决策为网络决策提供了事后解释的途径。无监督学习的探索t-SNE与自动编码器Ch‘ng等人2018将t-SNE和卷积自编码器用于Hubbard模型数据。t-SNE在捕捉三维系统的磁性相变方面表现优异降维后的数据聚类特征能够紧密跟踪底层模型的物理观测量如反磁结构因子。复杂度与熵Ibarra-Garcia-Padilla等人2024发现FH快照的结构复杂度通过对图像进行一系列粗粒化步骤计算的行为与系统的每格点熵相似。这或许为超冷原子模拟器中估算熵提供了一种简单方法。3.2 玻色-哈伯德模型超流-莫特绝缘体转变玻色-哈伯德模型描述了光学晶格中超冷玻色子的行为其最著名的特性是超流-莫特绝缘体相变。动量空间与实空间分析动量空间图像分类Rem等人2019在具有谐波势阱的三角晶格玻色-哈伯德实验中采集了动量空间的干涉图像。他们训练CNN来区分深度超流区和深度莫特绝缘体区的图像。令人印象深刻的是训练好的网络能够准确预测整个势阱中由于化学势不均匀实际同时存在多种局部密度的相变边界其性能甚至优于传统的全局观测量如凝聚体分数或干涉峰可见度图6a。这是因为CNN学会了捕捉动量分布中细微的、局域的特征模式而这些模式在空间平均的全局观测中被掩盖了。实空间占据数分类Huembeli等人2018直接在实空间占据数数据上训练CNN成功再现了BH模型的莫特瓣相图。无监督异常检测 Kottmann等人2020展示了自编码器在发现新相方面的威力。他们在扩展一维玻色-哈伯德模型包含最近邻相互作用V中仅在超流相参数空间原点附近的数据上训练一个自编码器。当将这个训练好的网络应用于参数空间其他区域的数据时重构误差会显著增大清晰地标出了超流相到密度波相、超固态相的边界图6b。这种方法无需任何先验的相标签完全由数据驱动发现相变。注意事项自编码器异常检测的有效性依赖于一个假设同一相内的数据在潜在空间具有相似的分布不同相的数据分布则不同。如果两个相在数据表征上非常相似或者训练数据未能覆盖某个相内的全部变异该方法可能会失效。4. 核心应用场景二哈密顿量学习与量子态重构除了识别相我们更想理解系统背后的微观机制。哈密顿量学习旨在从测量数据中直接反演出描述系统的哈密顿量参数而量子态重构则试图重建完整的量子态。4.1 哈密顿量学习从快照中反演微观耦合在类比量子模拟中我们精心设计实验系统来模拟某个目标哈密顿量。但实验实现与理想模型总有偏差。哈密顿量学习提供了一种校准和验证量子模拟器的方法。里德堡阵列的参数重构Simard等人2025表明图神经网络可以仅利用小规模团簇的训练数据就能准确重构大规模里德堡原子阵列的底层哈密顿量参数如相互作用强度、失谐等。这大大降低了实验校准的成本。提取有效物理在FH模型中Schlömer等人2023利用哈密顿量学习来量化移动掺杂空穴对反铁磁背景的影响图5c。他们从多体快照中获取高度非局域的关联信息通过梯度下降方法定量地得到了一个描述背景自旋的有效受挫J1-J2模型。这表明空穴的运动会驱使自旋环境进入强受挫区域这可能为某些相图中量子自旋液体的出现提供了条件。纠缠哈密顿量学习Kokail等人2021a和Joshi等人2023在 trapped-ion 模拟器上实验性地学习子系统的纠缠哈密顿量。方法是通过局部变形系统的哈密顿量运行类比量子动力学并结合经典优化循环来重构纠缠哈密顿量。这不仅能验证量子场论的预测还能揭示基态和激发态的纠缠结构。4.2 神经网络量子态与量子态层析完全重构量子态层析是量子信息中的核心任务但传统方法随粒子数指数缩放。神经网络量子态用参数化的神经网络来表示波函数 $\psi_\theta(\sigma)$将指数大的希尔伯特空间映射到相对少量的参数 $\theta$ 上。从测量数据中重构训练利用大量投影测量得到的快照 ${\sigma}$ 及其频率训练神经网络如受限玻尔兹曼机RBM、循环神经网络RNN来拟合概率分布 $P(\sigma) |\psi_\theta(\sigma)|^2$。提取信息一旦训练好NQS我们不仅可以计算局域观测量如磁化强度还能提取非局域信息如纠缠熵。Torlai等人2018在横场伊辛模型和XXZ模型上成功做到了这一点重构态的二阶Rényi熵与精确对角化结果吻合图7a。处理实验噪声Torlai等人2019将包含定制噪声层的RBM应用于里德堡原子阵列的实验数据成功重构了量子态并提取了互信息图7b。关键在于在神经网络架构或损失函数中明确考虑实验噪声模型如探测误差、串扰可以显著提高重构保真度。作为变分波函数 NQS也可以不依赖于数据直接作为变分蒙特卡洛计算中的试探波函数。而混合方法则结合了二者的优点数据增强的变分蒙特卡洛Czischek等人2022和Moss等人2024先使用数值模拟或实验快照对RNN进行预训练得到一个接近目标相的初始波函数然后再通过变分优化最小化能量进行微调。这种方法比从随机初始化开始的纯变分优化收敛更快、效果更好。混合训练方案Lange等人2025提出了一种用于Transformer量子态的混合训练方案同时结合了测量快照和来自多个测量基的期望值信息如自旋-自旋关联。这种方案利用可编程量子模拟器的数据在大型二维自旋系统上实现了鲁棒高效的基态学习图7c。实操心得选择NQS架构时需权衡表达能力和训练效率。RBM结构简单易于训练但对某些长程纠缠态表达能力有限RNN或Transformer表达能力更强但需要更多数据和更复杂的训练技巧。对于具有特定对称性如平移、旋转对称性的系统在神经网络中显式编码这些对称性如使用等变网络可以大幅提升学习效率和精度。5. 实验辅助用机器学习优化量子实验本身机器学习不仅能分析数据还能直接帮助优化实验过程实现更高效、更智能的量子态制备和探测。5.1 状态制备的优化制备高保真度的量子态如BEC、反铁磁态需要精细控制多个实验参数激光功率、频率、磁场、蒸发冷却节奏等。这是一个高维、耗时且通常非凸的优化问题。贝叶斯优化BO是实验优化的利器。它通过高斯过程等模型对控制参数与目标函数如原子数、相空间密度、态保真度的关系进行建模并基于采集函数如期望提升EI智能地选择下一个待测参数点。BEC快速制备Vendeiro等人2022用BO优化了55个控制参数在575毫秒内制备出铷原子BEC比传统手动方案快得多且获得了更高的相空间密度图8a。BO自动发现了结合拉曼冷却和蒸发冷却的高效序列。反铁磁态制备Xie等人2022在Heisenberg反铁磁模型中用BO优化控制路径将80个自旋系统的态保真度提升到96%以上图8b。BO找到了能减少非绝热效应、增强长程反铁磁关联的操控方案。强化学习RL将实验控制建模为序贯决策过程。实时冷却控制Reinschmidt等人2024利用RL根据磁光阱中荧光图像的实时流调整激光失谐和磁场实现了更高效的原子装载。稳健BEC制备Milson等人2023的RL智能体通过同时控制30个参数学会了稳健地制备BEC。注意事项BO和RL都需要定义明确的目标函数奖励。这个函数需要仔细设计既要反映最终目标如高保真度又要考虑实验约束如总时间、原子损失。不合理的奖励函数会导致算法收敛到非物理或不可行的解。5.2 成像与探测的增强量子气体显微镜的成像过程存在噪声和失真。机器学习可以用于提升成像保真度。自动编码器降噪Impertro等人2023使用卷积自编码器处理CCD捕获的原始荧光图像图8c。编码器将图像压缩到瓶颈层解码器从中重构出清晰的图像。训练后瓶颈层的表示实际上是一个高保真度的二值化原子占据图。这种方法能有效抑制噪声提高格点占据判读的准确率。从实空间推断动量空间Lode等人2021证明一个在少量量子气体显微镜实空间快照上训练的神经网络可以准确预测一阶和二阶观测量甚至可以从实空间图像推断动量空间分布。这有可能在未来替代部分飞行时间测量。6. 挑战、展望与实操建议尽管前景广阔量子机器学习在冷原子领域的应用仍面临诸多挑战。1. 数据饥渴与实验成本深度学习模型通常需要大量训练数据。而冷原子实验每个数据点尤其是高保真度快照的获取都可能耗时且昂贵。解决方案包括使用迁移学习先在大量、快速的数值模拟数据上预训练模型再用少量实验数据微调。开发数据高效的架构利用物理先验如对称性、局域性设计等变网络或小样本学习模型。主动学习与自适应测量如Lange等人2023所示利用当前对量子态的估计智能地选择下一个测量基以最大化信息增益减少所需总测量次数。2. 可解释性与物理洞察我们不能满足于一个高精度的“黑箱”分类器。必须发展并结合可解释性工具使用 inherently interpretable 的模型如之前提到的CCNNs其学到的特征直接对应物理关联子。事后解释方法如影响函数分析、显著性图Saliency Map、探针技术在输入数据中引入微小扰动观察输出变化。将网络输出与物理理论直接对比像Bohrdt等人2019做的那样用网络来判别竞争的理论模型。3. 噪声与误差缓解实验数据充满噪声探测误差、串扰、热涨落等。必须在分析流程中显式地考虑噪声在训练数据中注入噪声使用包含模拟噪声的数据集进行训练使模型对噪声鲁棒。在损失函数或网络架构中嵌入噪声模型如Torlai等人2019在RBM中增加噪声层。量子误差缓解与神经误差缓解结合Bennewitz等人2022提出先用含噪声量子设备运行变分算法再用NQS重构量子态最后在目标哈密顿量下对这个重构态进行变分优化以提升最终结果。4. 计算资源与部署训练大型神经网络需要GPU等计算资源。对于实验组需要考虑从轻量级模型开始不要一开始就追求最复杂的Transformer简单的CNN或全连接网络可能对许多任务已经足够。利用云服务或协作将模型训练任务外包给计算集群。模型压缩与蒸馏训练一个大模型后将其知识“蒸馏”到一个更小、更快的小模型中便于在实验控制电脑上实时部署。量子机器学习不是要取代物理学家而是成为一个强大的“协作者”。它将我们从繁琐的数据模式和关联函数计算中解放出来让我们能更专注于提出物理问题、设计实验和解释深层机制。这个领域正在飞速发展新的架构、算法和应用不断涌现。对于实验研究者而言最好的入门方式就是选择一个具体的、数据丰富的小问题例如用CNN区分你实验中两个已知的相亲手实践整个流程数据准备、模型构建、训练、验证和解释。在这个过程中积累的经验和直觉将是应对更复杂挑战的宝贵财富。
量子机器学习赋能冷原子模拟:从相变探测到哈密顿量学习
1. 量子机器学习与冷原子模拟一场范式融合的深度解析量子计算和人工智能的交叉正催生一个激动人心的新领域量子机器学习。这不仅仅是两个热门词汇的简单叠加而是一场深刻的范式融合。其核心思想在于利用量子系统本身固有的并行性和纠缠特性来处理那些在经典计算机上计算成本高昂的复杂数据尤其是量子数据本身。对于从事冷原子量子模拟实验的我们来说这无异于打开了一扇全新的大门。过去我们从量子气体显微镜或里德堡原子阵列中获得的海量“快照”数据往往需要依赖物理直觉和预设模型进行分析过程繁琐且容易遗漏隐藏在数据深处的关联。现在量子机器学习提供了一套强大的工具集让我们能够以数据驱动的方式直接从这些测量结果中提取物理规律甚至发现全新的现象。无论是表征复杂的量子态、检测微妙的相变还是反演系统背后的哈密顿量这些方法都展现出了超越传统分析手段的潜力。这篇文章我将结合近年的前沿研究和我们团队的一些实践思考为你深入拆解量子机器学习在冷原子模拟中的核心应用从波函数网络到哈密顿量学习希望能为同行和感兴趣的初学者提供一份扎实的参考。2. 核心原理为什么量子系统是天然的机器学习平台在深入具体应用前我们必须先理解其底层逻辑。量子机器学习在冷原子平台上的可行性根植于量子系统与机器学习模型在结构和功能上的深刻相似性。2.1 量子数据的天然优势并行性与高维嵌入冷原子实验如光学晶格中的超冷原子或里德堡原子阵列能够制备和探测高度可控的量子多体态。一次投影测量projective measurement会坍缩整个量子态产生一个经典比特串例如每个格点上有原子/无原子或自旋向上/向下。重复实验数千次我们就获得了一个由这些“快照”组成的集合。注意这里的“快照”并非系统的完整量子态而是量子态在某个特定测量基下的一次随机投影结果。完整的统计信息蕴含在所有快照的分布中。这些快照数据天然具有两个适合机器学习处理的特性高维特征空间一个包含N个格点的系统其单次快照可以视为一个N维向量。对于机器学习模型尤其是神经网络这正是其擅于处理的输入格式。蕴含非局域关联量子纠缠使得相隔很远的格点状态之间存在关联。这种关联不是简单的局部模式而是复杂的全局模式。卷积神经网络CNN等模型能够自动提取这种空间层级特征无需人工构造复杂的关联函数。2.2 从波函数到网络一种全新的数据表征传统上我们用量子波函数 $\psi(\sigma_1, \sigma_2, ..., \sigma_N)$ 来描述系统这是一个定义在指数大配置空间上的复数函数。直接处理波函数极其困难。一个巧妙的思路是将波函数的“结构”映射到一个网络Graph上这就是“波函数网络”的概念。具体构建方法如下节点每一个可能的量子态配置例如所有格点的自旋排列构成网络的一个节点。连边与权重两个节点配置之间的连边权重由它们对应的波函数振幅的相似性决定。一种常见的定义是权重正比于 $|\langle \sigma_i | \psi \rangle \langle \psi | \sigma_j \rangle|$ 或更复杂的关联度量。从实验数据推断我们无法直接得到波函数但可以从大量实验快照中估计不同配置出现的概率 $P(\sigma) |\langle \sigma | \psi \rangle|^2$进而推断配置之间的“关联强度”从而近似构建这个网络。为什么这样做有价值量子相变伴随着波函数结构的根本性改变。在无序相波函数振幅分布相对均匀且随机对应的网络也更接近随机网络。而在有序相如量子磁体波函数会集中在某些特定的、具有长程关联的配置上这使得网络结构呈现出“无标度”特性——即少数节点关键配置拥有大量连接。通过分析实验快照构建的网络的拓扑性质如度分布、聚类系数我们可以无损且直观地“看到”相变的发生。Mendes-Santos等人2024年在里德堡原子阵列中的工作正是展示了这一点随着系统被驱动穿过量子相变点网络结构从随机向无标度过渡直接反映了多体波函数中长程关联的建立和复杂性的降低。2.3 量子硬件作为计算资源混合与模拟范式除了处理量子数据量子系统本身可以作为执行机器学习算法的硬件。这在里德堡原子阵列中尤为突出其可编程性和天然的多体相互作用使其成为理想的平台。混合数字-模拟量子学习如Lu等人2025提出的方案在里德堡平台上交替执行数字单量子比特门和模拟时间演化在原生里德堡哈密顿量下。这种混合方式利用了模拟演化的高效性和数字门的精确性。在图像分类如MNIST任务中图像数据被编码到量子电路的初始态演化后的测量结果用于分类在量子相检测中直接输入多体哈密顿量的基态波函数进行处理。关键在于里德堡哈密顿量的参数如由阻塞半径决定的晶格参数被用作算法的超参数。实测发现这种混合方案在噪声鲁棒性和所需电路深度方面均优于纯数字方案因为模拟演化更“自然”地利用了系统的物理特性对某些噪声不敏感。量子储备计算这是一种全模拟范式。将量子系统的动力学本身作为一个固定的“储备池”。输入数据可以是经典的如时间序列或图像特征通过调制全局脉冲、局部失谐或原子位置等方式编码到里德堡哈密顿量的参数中。随后系统进行一段时间的模拟量子演化最后的投影测量结果作为数据的“特征嵌入”再输入给一个经典的分类器如线性模型或浅层神经网络。Fujii, Nakajima以及Kornjaca等人的实验表明QRC在时间序列预测、图像分类甚至分子性质预测等任务上取得了与纯经典方法相竞争的结果。其优势在于复杂的量子动力学本身完成了高维非线性特征变换而训练只发生在轻量的经典读出层极大降低了训练成本。量子循环神经网络Bravo等人2022提出将相互作用的里德堡原子视为量子神经元其动力学自然编码了记忆和决策能力。这为处理序列数据如语音、文本的量子算法提供了新的物理实现蓝图。3. 核心应用场景一强关联量子系统的相变探测理解量子多体系统中的相和相变是凝聚态物理的核心。机器学习特别是深度学习为从实验数据中自动、无偏地识别相变提供了强大工具。下面我们以费米-哈伯德和玻色-哈伯德模型为例看机器学习如何大显身手。3.1 费米-哈伯德模型从磁性到奇异金属费米-哈伯德模型是描述强关联电子系统的基石模型与高温超导等前沿问题密切相关。在冷原子实验中通过量子气体显微镜我们可以获得格点分辨的原子排布快照。监督学习的成功实践磁性相变识别Ch‘ng等人2017的开创性工作使用CNN对通过行列式量子蒙特卡洛模拟产生的3D Hubbard模型辅助场构型进行分类训练。网络成功从这些构型中学会了区分顺磁和反铁磁相并准确预测了 Néel 温度 $T_N$与蒙特卡洛结果高度吻合见图5a。更厉害的是通过迁移学习仅在半满一个粒子一个格点数据上训练的网络能够泛化到掺杂系统暗示了反铁磁序在至少5%空穴掺杂下仍然存在。理论模型甄别当理论本身存在争议时机器学习可以充当“裁判”。Bohrdt等人2019训练CNN来区分实验快照和两种竞争理论几何弦理论 vs. π-通量量子自旋液体态产生的模拟图像。训练好的网络将实验快照一致地分类为“弦状”而非自旋液体状图5b这为理解掺杂Mott绝缘体中隐藏的关联提供了有力证据。实操心得在训练这类“判别”网络时构建平衡且具有代表性的理论模拟数据集至关重要。需要确保两种理论的数据在预处理如噪声添加、成像保真度模拟上完全一致否则网络可能学到的是数据生成过程的差异而非物理本质的区别。走向可解释性 深度学习常被诟病为“黑箱”。在量子多体物理中理解网络“为什么”做出判断至关重要。关联子CNNMiles等人2021提出了CCNNs其非线性层被设计为显式计算N点关联函数。当用于FH模型快照分类时CCNNs学会使用的是诸如自旋-自旋、密度-密度等物理上可解释的关联子。在区分弦理论和自旋液体理论时CCNN识别出四阶关联是区分两者的最关键特征。影响函数分析Dawid等人2020利用影响函数来量化每个训练样本对特定测试输入预测的贡献。这可以帮助我们判断网络是否依赖于物理上有意义的特征进行决策为网络决策提供了事后解释的途径。无监督学习的探索t-SNE与自动编码器Ch‘ng等人2018将t-SNE和卷积自编码器用于Hubbard模型数据。t-SNE在捕捉三维系统的磁性相变方面表现优异降维后的数据聚类特征能够紧密跟踪底层模型的物理观测量如反磁结构因子。复杂度与熵Ibarra-Garcia-Padilla等人2024发现FH快照的结构复杂度通过对图像进行一系列粗粒化步骤计算的行为与系统的每格点熵相似。这或许为超冷原子模拟器中估算熵提供了一种简单方法。3.2 玻色-哈伯德模型超流-莫特绝缘体转变玻色-哈伯德模型描述了光学晶格中超冷玻色子的行为其最著名的特性是超流-莫特绝缘体相变。动量空间与实空间分析动量空间图像分类Rem等人2019在具有谐波势阱的三角晶格玻色-哈伯德实验中采集了动量空间的干涉图像。他们训练CNN来区分深度超流区和深度莫特绝缘体区的图像。令人印象深刻的是训练好的网络能够准确预测整个势阱中由于化学势不均匀实际同时存在多种局部密度的相变边界其性能甚至优于传统的全局观测量如凝聚体分数或干涉峰可见度图6a。这是因为CNN学会了捕捉动量分布中细微的、局域的特征模式而这些模式在空间平均的全局观测中被掩盖了。实空间占据数分类Huembeli等人2018直接在实空间占据数数据上训练CNN成功再现了BH模型的莫特瓣相图。无监督异常检测 Kottmann等人2020展示了自编码器在发现新相方面的威力。他们在扩展一维玻色-哈伯德模型包含最近邻相互作用V中仅在超流相参数空间原点附近的数据上训练一个自编码器。当将这个训练好的网络应用于参数空间其他区域的数据时重构误差会显著增大清晰地标出了超流相到密度波相、超固态相的边界图6b。这种方法无需任何先验的相标签完全由数据驱动发现相变。注意事项自编码器异常检测的有效性依赖于一个假设同一相内的数据在潜在空间具有相似的分布不同相的数据分布则不同。如果两个相在数据表征上非常相似或者训练数据未能覆盖某个相内的全部变异该方法可能会失效。4. 核心应用场景二哈密顿量学习与量子态重构除了识别相我们更想理解系统背后的微观机制。哈密顿量学习旨在从测量数据中直接反演出描述系统的哈密顿量参数而量子态重构则试图重建完整的量子态。4.1 哈密顿量学习从快照中反演微观耦合在类比量子模拟中我们精心设计实验系统来模拟某个目标哈密顿量。但实验实现与理想模型总有偏差。哈密顿量学习提供了一种校准和验证量子模拟器的方法。里德堡阵列的参数重构Simard等人2025表明图神经网络可以仅利用小规模团簇的训练数据就能准确重构大规模里德堡原子阵列的底层哈密顿量参数如相互作用强度、失谐等。这大大降低了实验校准的成本。提取有效物理在FH模型中Schlömer等人2023利用哈密顿量学习来量化移动掺杂空穴对反铁磁背景的影响图5c。他们从多体快照中获取高度非局域的关联信息通过梯度下降方法定量地得到了一个描述背景自旋的有效受挫J1-J2模型。这表明空穴的运动会驱使自旋环境进入强受挫区域这可能为某些相图中量子自旋液体的出现提供了条件。纠缠哈密顿量学习Kokail等人2021a和Joshi等人2023在 trapped-ion 模拟器上实验性地学习子系统的纠缠哈密顿量。方法是通过局部变形系统的哈密顿量运行类比量子动力学并结合经典优化循环来重构纠缠哈密顿量。这不仅能验证量子场论的预测还能揭示基态和激发态的纠缠结构。4.2 神经网络量子态与量子态层析完全重构量子态层析是量子信息中的核心任务但传统方法随粒子数指数缩放。神经网络量子态用参数化的神经网络来表示波函数 $\psi_\theta(\sigma)$将指数大的希尔伯特空间映射到相对少量的参数 $\theta$ 上。从测量数据中重构训练利用大量投影测量得到的快照 ${\sigma}$ 及其频率训练神经网络如受限玻尔兹曼机RBM、循环神经网络RNN来拟合概率分布 $P(\sigma) |\psi_\theta(\sigma)|^2$。提取信息一旦训练好NQS我们不仅可以计算局域观测量如磁化强度还能提取非局域信息如纠缠熵。Torlai等人2018在横场伊辛模型和XXZ模型上成功做到了这一点重构态的二阶Rényi熵与精确对角化结果吻合图7a。处理实验噪声Torlai等人2019将包含定制噪声层的RBM应用于里德堡原子阵列的实验数据成功重构了量子态并提取了互信息图7b。关键在于在神经网络架构或损失函数中明确考虑实验噪声模型如探测误差、串扰可以显著提高重构保真度。作为变分波函数 NQS也可以不依赖于数据直接作为变分蒙特卡洛计算中的试探波函数。而混合方法则结合了二者的优点数据增强的变分蒙特卡洛Czischek等人2022和Moss等人2024先使用数值模拟或实验快照对RNN进行预训练得到一个接近目标相的初始波函数然后再通过变分优化最小化能量进行微调。这种方法比从随机初始化开始的纯变分优化收敛更快、效果更好。混合训练方案Lange等人2025提出了一种用于Transformer量子态的混合训练方案同时结合了测量快照和来自多个测量基的期望值信息如自旋-自旋关联。这种方案利用可编程量子模拟器的数据在大型二维自旋系统上实现了鲁棒高效的基态学习图7c。实操心得选择NQS架构时需权衡表达能力和训练效率。RBM结构简单易于训练但对某些长程纠缠态表达能力有限RNN或Transformer表达能力更强但需要更多数据和更复杂的训练技巧。对于具有特定对称性如平移、旋转对称性的系统在神经网络中显式编码这些对称性如使用等变网络可以大幅提升学习效率和精度。5. 实验辅助用机器学习优化量子实验本身机器学习不仅能分析数据还能直接帮助优化实验过程实现更高效、更智能的量子态制备和探测。5.1 状态制备的优化制备高保真度的量子态如BEC、反铁磁态需要精细控制多个实验参数激光功率、频率、磁场、蒸发冷却节奏等。这是一个高维、耗时且通常非凸的优化问题。贝叶斯优化BO是实验优化的利器。它通过高斯过程等模型对控制参数与目标函数如原子数、相空间密度、态保真度的关系进行建模并基于采集函数如期望提升EI智能地选择下一个待测参数点。BEC快速制备Vendeiro等人2022用BO优化了55个控制参数在575毫秒内制备出铷原子BEC比传统手动方案快得多且获得了更高的相空间密度图8a。BO自动发现了结合拉曼冷却和蒸发冷却的高效序列。反铁磁态制备Xie等人2022在Heisenberg反铁磁模型中用BO优化控制路径将80个自旋系统的态保真度提升到96%以上图8b。BO找到了能减少非绝热效应、增强长程反铁磁关联的操控方案。强化学习RL将实验控制建模为序贯决策过程。实时冷却控制Reinschmidt等人2024利用RL根据磁光阱中荧光图像的实时流调整激光失谐和磁场实现了更高效的原子装载。稳健BEC制备Milson等人2023的RL智能体通过同时控制30个参数学会了稳健地制备BEC。注意事项BO和RL都需要定义明确的目标函数奖励。这个函数需要仔细设计既要反映最终目标如高保真度又要考虑实验约束如总时间、原子损失。不合理的奖励函数会导致算法收敛到非物理或不可行的解。5.2 成像与探测的增强量子气体显微镜的成像过程存在噪声和失真。机器学习可以用于提升成像保真度。自动编码器降噪Impertro等人2023使用卷积自编码器处理CCD捕获的原始荧光图像图8c。编码器将图像压缩到瓶颈层解码器从中重构出清晰的图像。训练后瓶颈层的表示实际上是一个高保真度的二值化原子占据图。这种方法能有效抑制噪声提高格点占据判读的准确率。从实空间推断动量空间Lode等人2021证明一个在少量量子气体显微镜实空间快照上训练的神经网络可以准确预测一阶和二阶观测量甚至可以从实空间图像推断动量空间分布。这有可能在未来替代部分飞行时间测量。6. 挑战、展望与实操建议尽管前景广阔量子机器学习在冷原子领域的应用仍面临诸多挑战。1. 数据饥渴与实验成本深度学习模型通常需要大量训练数据。而冷原子实验每个数据点尤其是高保真度快照的获取都可能耗时且昂贵。解决方案包括使用迁移学习先在大量、快速的数值模拟数据上预训练模型再用少量实验数据微调。开发数据高效的架构利用物理先验如对称性、局域性设计等变网络或小样本学习模型。主动学习与自适应测量如Lange等人2023所示利用当前对量子态的估计智能地选择下一个测量基以最大化信息增益减少所需总测量次数。2. 可解释性与物理洞察我们不能满足于一个高精度的“黑箱”分类器。必须发展并结合可解释性工具使用 inherently interpretable 的模型如之前提到的CCNNs其学到的特征直接对应物理关联子。事后解释方法如影响函数分析、显著性图Saliency Map、探针技术在输入数据中引入微小扰动观察输出变化。将网络输出与物理理论直接对比像Bohrdt等人2019做的那样用网络来判别竞争的理论模型。3. 噪声与误差缓解实验数据充满噪声探测误差、串扰、热涨落等。必须在分析流程中显式地考虑噪声在训练数据中注入噪声使用包含模拟噪声的数据集进行训练使模型对噪声鲁棒。在损失函数或网络架构中嵌入噪声模型如Torlai等人2019在RBM中增加噪声层。量子误差缓解与神经误差缓解结合Bennewitz等人2022提出先用含噪声量子设备运行变分算法再用NQS重构量子态最后在目标哈密顿量下对这个重构态进行变分优化以提升最终结果。4. 计算资源与部署训练大型神经网络需要GPU等计算资源。对于实验组需要考虑从轻量级模型开始不要一开始就追求最复杂的Transformer简单的CNN或全连接网络可能对许多任务已经足够。利用云服务或协作将模型训练任务外包给计算集群。模型压缩与蒸馏训练一个大模型后将其知识“蒸馏”到一个更小、更快的小模型中便于在实验控制电脑上实时部署。量子机器学习不是要取代物理学家而是成为一个强大的“协作者”。它将我们从繁琐的数据模式和关联函数计算中解放出来让我们能更专注于提出物理问题、设计实验和解释深层机制。这个领域正在飞速发展新的架构、算法和应用不断涌现。对于实验研究者而言最好的入门方式就是选择一个具体的、数据丰富的小问题例如用CNN区分你实验中两个已知的相亲手实践整个流程数据准备、模型构建、训练、验证和解释。在这个过程中积累的经验和直觉将是应对更复杂挑战的宝贵财富。