量子机器学习新突破:利用克尔相干态构建可编程弯曲特征空间

量子机器学习新突破:利用克尔相干态构建可编程弯曲特征空间 1. 项目概述与核心价值量子机器学习这个领域最近几年火得不行但说实话很多研究要么停留在理论层面离实际应用太远要么就是对硬件要求太高在目前嘈杂的中等规模量子设备上根本跑不起来。我们团队在折腾各种量子核方法时发现了一个挺有意思的突破口特征空间的几何结构。传统量子核方法比如基于位移算符或压缩态的内积其对应的特征空间往往是平直的欧几里得空间。但现实世界的数据其内在结构可复杂多了周期性、层次性、流形结构比比皆是。用一个平直的空间去“装”这些数据就像试图用一张平面地图去精确描绘地球表面总会产生扭曲和失真。这就引出了我们这次工作的核心利用非线性光学中的克尔相干态来构建量子特征空间。克尔效应大家都不陌生它在非线性光学里描述的是介质的折射率随光强变化的特性。我们把这种“非线性”的思想引入到量子态构建中得到了克尔相干态。这玩意儿妙在哪呢它不是一个固定的东西而是一个可调谐的家族。通过调节一个关键的物理参数——克尔参数 λ我们可以让这个特征空间在双曲几何和球面几何之间平滑切换。λ 0 时空间是负曲率的双曲面λ 0 时空间是正曲率的球面。这个曲率还不是随便定的它直接由光的频率和克尔参数的比值决定。这意味着我们不再是把数据生硬地扔进一个预设的高维空间而是可以根据数据的内在特性“捏”出一个最贴合它的几何形状的特征空间。这就像是为数据量身定制了一套“坐标系”分类边界自然就更容易划清了。这项工作的价值我认为主要体现在三个方面。第一是理论上的优雅与统一。克尔相干态在数学上统一了 su(1,1) 和 su(2) 相干态甚至包含了压缩态作为其特例。这为我们理解不同量子态在机器学习中的作用提供了一个更上层的视角。第二是极强的实用性和鲁棒性。我们通过大量实验证明基于克尔相干态的核函数在合成数据集和真实的医学影像数据集上其分类性能F1分数和准确率 consistently 优于传统的径向基函数核和压缩态核。更重要的是当我们在数据或核的振幅中人为注入高达15%的高斯噪声时克尔核的表现依然稳健降幅远小于其他方法。这对于未来在真实、嘈杂的量子硬件上运行算法至关重要。第三是开辟了新的可能性。它将量子机器学习与微分几何、流形学习联系了起来。我们不再只是谈论高维希尔伯特空间而是开始讨论具有恒定曲率的黎曼或伪黎曼流形。这为“量子流形优化”和“双曲机器学习”这些前沿方向提供了一个天然的、由物理系统实现的 playground。所以这篇文章不仅仅是提出了几个新的核函数公式。它更想传达的是在量子机器学习中特征空间的几何属性是一个尚未被充分挖掘的、强大的设计维度。通过引入像克尔效应这样的物理相互作用我们可以编程化地控制这个几何结构从而让机器学习模型获得对复杂数据模式更强的捕捉能力。下面我就把这套方法的里里外外、实操细节和踩过的坑给大家掰开揉碎了讲清楚。2. 理论基础从相干态到克尔相干态要理解克尔相干态为什么牛得先回到起点看看量子核方法到底在干什么。2.1 量子核方法的核心思想量子核方法的套路其实很直观。假设我们有一堆经典数据点{x_i}。传统机器学习里核技巧是把每个数据点x通过一个特征映射Φ(x)映射到一个高维甚至无限维的特征空间然后在这个空间里做内积K(x_i, x_j) ⟨Φ(x_i)|Φ(x_j)⟩。这个内积函数K就是核函数。支持向量机这类算法其实只依赖核函数计算出的格拉姆矩阵而不需要显式知道Φ(x)长什么样这就是核技巧的威力。量子核方法做了件类似但更“物理”的事我们把数据点x编码成一个量子态|ψ(x)⟩。这个编码过程通常通过一个参数化的量子线路U(x)来实现即|ψ(x)⟩ U(x)|0⟩。那么两个数据点之间的“相似度”就可以用它们对应量子态的内积来定义K(x_i, x_j) |⟨ψ(x_i)|ψ(x_j)⟩|^2。这个量在物理上对应着两个量子态之间的重叠概率是可以通过量子线路测量得到的。一个最经典的例子就是基于相干态的核。相干态是谐振子的“最经典”的量子态。用位移算符D(α) exp(αa† - α*a)作用在真空态|0⟩上就能得到相干态|α⟩。如果我们把数据x映射为复数α(x)那么相干态的内积⟨α(x_i)|α(x_j)⟩ exp(-|α_i - α_j|^2/2)这恰恰就是机器学习里大名鼎鼎的径向基函数核你看一个物理上自然产生的态其内积自动给出了一个非常有效的核函数。这揭示了量子核方法的一个本质优势许多复杂的、高维的经典核函数可能对应着某个简单量子系统的自然演化。2.2 克尔相干态的引入与数学形式但是相干态对应的特征空间是平直的。我们想给它加点“弯曲”的能力。这就引入了非线性相干态的概念。传统相干态的产生湮灭算符a, a†满足对易关系[a, a†] 1是线性的。非线性相干态则使用形如A f(n)a和A† a†f†(n)的变形算符其中n a†a是粒子数算符f(n)是一个关于n的函数。这个变形引入了非线性。克尔相干态就是一种特殊的非线性相干态它源于描述光学克尔效应的哈密顿量H ωn (λ/2)n^2。这个n^2项就是非线性的来源它使得能级间隔不再均匀见图5中的非谐振子。基于这个哈密顿量我们可以定义克尔湮灭算符A和产生算符A†。具体形式依赖于克尔参数 λ 的正负对于 λ 0:A sqrt(λ/2) a * sqrt(2j - 1 n),A† sqrt(λ/2) sqrt(2j - 1 n) a†对于 λ 0:A sqrt(|λ|/2) a * sqrt(2j 1 - n),A† sqrt(|λ|/2) sqrt(2j 1 - n) a†这里的j是一个额外的参数可以是整数或半整数它控制着希尔伯特空间的维度对于 λ0维度是 2j1。有了变形算符我们就可以定义克尔位移算符D(α) exp(αA† - α*A)。将它作用在真空态|0⟩上就得到了克尔相干态|α; λ, j⟩。通过算符的高斯分解技巧我们可以得到它的显式表达式对于 λ 0 (双曲情况):|α; λ, j⟩ cosh^{-2j}(sqrt(λ/2) |α|) * Σ_{n0}^∞ sqrt(Γ(2jn)/(Γ(2j)n!)) * e^{-inϕ} * tanh^n(sqrt(λ/2)|α|) |n⟩对于 λ 0 (球面情况):|α; λ-, j⟩ cos^{2j}(sqrt(|λ|/2) |α|) * Σ_{n0}^{2j} sqrt((2j)!/((2j-n)!n!)) * e^{-inϕ} * tan^n(sqrt(|λ|/2)|α|) |n⟩这里α |α|e^{iϕ}。这两个表达式是理解一切的基础。你会发现当λ2, j1/2时正克尔相干态退化为压缩态。当λ2时正克尔相干态就是su(1,1) 相干态。当λ-2时负克尔相干态就是su(2) 相干态。所以克尔相干态是一个涵盖更广的家族通过调节 λ 和 j我们可以连续地在不同种类的相干态之间切换。注意这里的j参数在物理实现中有具体含义。在 su(1,1) 或 su(2) 代数中j与角动量量子数相关决定了表示的维度。在机器学习中我们可以把它纯粹当作一个可调的超参数但它确实有物理根源。2.3 特征空间的几何从内积到曲率核函数定义了特征空间的内积而内积决定了空间的几何。要理解克尔核的几何我们需要计算两个克尔相干态的内积也就是我们的核函数相位编码核 (λ0):K(α1, α2) [sech^2(√(λ/2)r1) sech^2(√(λ/2)r2)]^j / [1 - e^{i(ϕ1-ϕ2)} tanh(√(λ/2)r1) tanh(√(λ/2)r2)]^{2j}相位编码核 (λ0):K(α1, α2) [1 e^{i(ϕ1-ϕ2)} tan(√(|λ|/2)r1) tan(√(|λ|/2)r2)]^{2j} * [sec^2(√(|λ|/2)r1) sec^2(√(|λ|/2)r2)]^j振幅编码核 (λ0, 设相位ϕ0):K(x, x) cosh^{-2j}(√(λ/2) |x - x|)振幅编码核 (λ0, 设相位ϕ0):K(x, x) cos^{2j}(√(|λ|/2) |x - x|)这些公式看起来复杂但其几何意义非常深刻。我们可以通过计算这些相干态构成的流形的芬斯勒-施图迪度量来揭示空间的曲率。计算过程涉及一些微分几何但结论非常干净对于 λ 0得到的度量是ds^2 jλ dr^2 (j/2) sinh^2(√(2λ) r) dϕ^2。其 Ricci 标量曲率R -2λ/j是一个负常数。这描述了一个双曲空间伪球面。你可以想象一个马鞍形的曲面。对于 λ 0得到的度量是ds^2 j|λ| dr^2 (j/2) sin^2(√(2|λ|) r) dϕ^2。其 Ricci 标量曲率R 2|λ|/j是一个正常数。这描述了一个球面空间。这就是克尔核最核心的魔力所在我们通过调节物理参数 λ和 j可以直接编程化地控制特征空间的曲率λ 从负到正空间从球面连续地变化到双曲面。当 λ→0 时两种度量都趋近于ds^2 dr^2 r^2 dϕ^2这正是平直的欧几里得空间即传统相干态对应的空间。因此克尔相干态特征空间实现了一个从球面到平面再到双曲面的完整谱系。实操心得理解这个几何对应关系至关重要。当你面对一个具有明显层次结构或树状结构的数据集如词向量、知识图谱时直觉上应该尝试 λ0 的双曲核因为双曲空间天生适合嵌入树状结构。而对于具有周期性或闭合结构的数据λ0 的球面核可能更合适。这为我们选择超参数提供了强有力的先验指导而不是盲目网格搜索。3. 核函数构建、编码策略与超参数解析有了理论基石接下来就是如何用它来干活。这部分我会详细拆解两种数据编码方式、具体核函数的选择以及超参数λ和j到底在扮演什么角色。3.1 两种数据编码策略如何将经典数据x映射成克尔相干态的参数α我们主要探索了两种在量子机器学习中常用的编码方式。1. 相位编码这是最直观的一种方式。对于一个 N 维的数据点x_m我们将其分量映射为 N 个克尔相干态的相位ϕ_m而所有态的振幅|α|固定为一个常数c。即α_m c * exp(i * x_m)这里假设对数据做了适当缩放使x_m落在合适的相位区间比如[0, 2π]。此时核函数K(x_m, x_n)就是两个克尔相干态|c, x_m; λ, j⟩和|c, x_n; λ, j⟩的内积即前面给出的相位编码核公式。这里的超参数包括固定振幅c、克尔参数λ和角动量参数j。这种编码的优势它天然地处理周期性数据。因为相位是周期性的所以核函数也是数据差值的周期函数。从图2(a)(b)可以看到克尔相位核的形状与经典的指数正弦平方核非常相似后者正是处理周期性数据的利器。但克尔相位核通过λ和j提供了更多的控制“旋钮”可以调整周期的形状和锐度灵活性更大。2. 振幅编码另一种方式是将数据映射到相干态的振幅上而将相位固定例如设为0。即α_m x_m同样数据需要归一化到合适范围。此时核函数简化为前面给出的振幅编码核公式。对于 λ0是双曲余弦函数的负幂对于 λ0是余弦函数的幂。这里的超参数是λ和j。这种编码的优势它与许多经典的平移不变核联系更直接。当j1/2, λ2时正振幅核退化为cosh^{-1/2}(|x-y|)这与一些双曲核有关。负振幅核则推广了余弦平方核。振幅编码核更侧重于数据点之间的绝对距离而非周期性的相位差。注意事项选择编码方式没有绝对标准。我们的实验表明对于不同数据集两种编码各有胜负。一个实用的建议是如果数据本身具有明显的周期性如时间序列、角度数据优先尝试相位编码如果数据特征更像是欧氏空间中的点如图像像素值可以优先尝试振幅编码。最稳妥的方法是在交叉验证中同时尝试两种。3.2 超参数λ和j的角色深度剖析这是调参的核心也是理解模型行为的关键。很多人把超参数搜索当成黑箱优化但在这里每个参数都有清晰的物理和几何意义。克尔参数λ曲率与“带宽”的控制者几何意义如前所述λ的符号直接决定特征空间是球面λ0还是双曲面λ0。λ的绝对值大小则与曲率的绝对值成正比|R| ∝ |λ|/j。|λ|越大空间弯曲得越“厉害”。机器学习意义在核方法中λ扮演着类似径向基函数核中γ参数或周期核中长度尺度l的角色控制着核函数的“带宽”或“影响范围”。以正振幅核K cosh^{-2j}(√(λ/2) d)为例√(λ/2)这个因子与d数据距离相乘。λ越大对于相同的d核函数值衰减得越快意味着模型对局部细节更敏感决策边界更复杂容易过拟合λ越小核函数变化越平缓模型更平滑决策边界更简单可能欠拟合。与频率的比值在物理实现中λ是克尔非线性系数它与光频率ω的比值ω/λ是一个关键无量纲量。这个比值直接出现在度量和曲率公式中。在机器学习中我们可以把输入数据x的缩放与√(λ/2)这个因子结合起来看。实际上√(λ/2)起到了一个特征缩放因子的作用。如果你的数据范围是[a, b]那么有效的“弯曲尺度”就是√(λ/2) * (b-a)。调整λ本质上是在调整数据在弯曲流形上分布的“稀疏”或“稠密”程度。角动量参数j希尔伯特空间维度与核函数“锐度”数学意义在 λ0 时j直接决定了希尔伯特空间的维度是2j1因为求和中 n 从 0 到 2j。在 λ0 时希尔伯特空间是无限维但j出现在系数Γ(2jn)/Γ(2j)中影响了各福克态分量的权重分布。机器学习意义j控制着核函数的“锐度”或“峰度”。看振幅核公式cos^{2j}(·)或cosh^{-2j}(·)j在指数上。j越大函数在零点附近的峰值越尖锐远离时衰减或振荡得越快。这相当于增加了模型的容量。一个更大的j使得核函数能够刻画更复杂、变化更剧烈的函数。在图4的热力图中可以清晰看到对于相位核j的变化对交叉验证分数的影响非常显著是主导性超参数。离散与连续j在物理上取半整数但在纯机器学习应用中我们可以把它当作一个连续的正实数超参数来优化。不过我们的实验发现j取整数值1,2,3,...和半整数值0.5, 1.5, 2.5,...的性能差异有时很明显。这可能是因为离散的j值对应着不同的代数表示从而影响了特征空间的对称性。建议在调参时既尝试整数也尝试半整数。联合调参策略λ和j不是独立的。从曲率公式R ∝ λ/j看两者共同决定了空间的弯曲程度。我们的实验图4表明对于相位编码核j的影响通常比λ更显著。你需要先找到一个合适的j来设定模型的整体容量然后再微调λ来调整局部几何。对于振幅编码核λ往往是更主导的超参数因为它直接乘在数据距离上控制了核函数的衰减速率。一个实用的工作流是先进行粗网格搜索确定λ的大致范围正/负数量级和j的有效区间比如 0.5 到 5。然后在这个区域进行更精细的贝叶斯优化或随机搜索。3.3 与其他核函数的联系与超越理解克尔核与经典核的关系能帮助我们定位它的用武之地。与径向基函数核的关系当λ → 0且j取适当值时克尔振幅核会趋近于 RBF 核exp(-γ|x-y|^2)。RBF 核对应的是平直特征空间而克尔核通过λ引入了弯曲提供了更丰富的几何。与压缩态核的关系当λ2, j1/2时正克尔相干态就是压缩态。因此压缩态核是克尔核的一个特例。我们的工作表明通过释放λ和j这两个参数我们获得了比固定压缩态核更好的性能尤其是在噪声环境下。与周期核的关系克尔相位核特别是当λ0时其振荡行为与指数正弦平方核相似。我们甚至基于负克尔振幅核构造了一个“量子指数余弦核”K_qec exp(-2/l^2 * cos^{2j}(√(|λ|/2)|x-y|))它在处理周期性数据时表现优异见表IV。与双曲/球面核的关系正振幅核cosh^{-2j}(·)是广义的双曲核负振幅核cos^{2j}(·)是广义的球面核。这直接将我们的工作与新兴的双曲机器学习领域联系了起来。核心优势总结克尔核不是一个孤立的发明它建立了一个统一的框架将多个重要的经典与量子核函数作为其特例包含进来。并且它通过λ和j提供了连续可调的几何控制这是以往任何单一核函数都无法做到的。这种灵活性正是其在多种数据集上表现鲁棒的根本原因。4. 实验设计与结果分析鲁棒性验证与调参实战理论再漂亮也得靠实验说话。我们设计了一系列实验不仅为了验证性能更为了深入理解这些核函数在什么情况下、为什么有效。这部分我会详细还原实验设置、分析关键结果并分享我们踩过的坑和得到的经验。4.1 数据集与实验设置我们混合使用了合成数据集和真实世界数据集以全面评估性能。合成数据集旨在测试核函数对特定数据结构的捕捉能力。Moons Circles经典的二分类数据集用于测试对非线性决策边界的拟合能力。我们生成了不同噪声水平0.1, 0.25, 0.8的版本。Hypercube在高维超立方体中生成的数据并注入标签噪声用于测试模型在存在错误标签时的鲁棒性。Periodic Datasets包括 Disks, Triple, Quadruple 等数据点呈同心圆环或周期性分布专门用于测试核函数处理周期性模式的能力。真实数据集Breast MNIST。这是 MedMNIST 基准测试的一部分是乳腺癌细胞图像的简化版28x28 灰度图。选择它是因为医学图像分类是机器学习的重要应用场景且数据通常带有噪声和不确定性。对比基线经典核径向基函数核。量子核压缩态核相位和振幅编码。深度学习方法ResNet-18, ResNet-50, auto-sklearn 等作为在 MedMNIST 上的 SOTA 参考。评估指标与流程主要指标F1分数兼顾精确率和召回率和准确率。两种训练范式场景一直接训练/测试直接在训练集上优化超参数在测试集上报告分数。这容易导致过拟合但能看出模型的“原始”拟合能力。场景二交叉验证使用交叉验证集来选择超参数然后在测试集上评估。这是更严谨、更反映泛化能力的方法。噪声实验为了模拟真实量子硬件或数据中的噪声我们向克尔相干态的振幅或直接向 RBF 核的输入数据添加了均值为0、标准差为0.1和0.15的高斯噪声。4.2 核心结果解读1. 综合性能超越基线表II和表III的结果清晰地表明无论是相位编码还是振幅编码的克尔核在绝大多数合成数据集上其测试集 F1 分数都优于或持平于 RBF 核和压缩态核。特别是在复杂的 Hypercube 数据集带有标签噪声上克尔核的优势更为明显。例如在 Hypercube v1 上KCS 相位核达到了 93.07% 的测试 F1而 RBF 核为 91.43%压缩态核为 91.26%。在交叉验证场景下表III这种优势依然保持说明其泛化能力更好。2. 在周期性数据上的卓越表现表IV的结果是亮点。在 Disks, Triple, Quadruple 这些周期性数据集上压缩态核的表现相对较差Disks v1 上仅 42%。经典的指数正弦平方核表现极好90.2% 到 100%。我们提出的克尔相位核和量子指数余弦核达到了与经典 ESS 核相媲美的性能80.2% 到 100%。这证实了我们的理论克尔相位核通过其周期性的相位依赖天然适合处理周期性模式。而基于负克尔振幅核构造的 QEC 核甚至在某些情况下表现更优。3. 在真实医学图像数据上的竞争力表V的结果非常鼓舞人心。在 Breast MNIST 上最好的克尔核KCS 相位/振幅达到了86.67%的测试准确率。这超越了 RBF 核79.0%和压缩态核81.2%。更重要的是它超越了强大的深度学习模型如 ResNet-18 (28x28输入) 的 86.3%以及 auto-sklearn 的 80.3%与 ResNet-50 (224x224输入) 的 84.2% 相比也有优势。考虑到我们使用的是简单的 SVM 核方法计算成本远低于训练深度神经网络这个结果非常有竞争力。4. 强大的抗噪声鲁棒性这是克尔核可能走向实用的关键。表VI和表V的第二行展示了噪声实验的结果。在合成数据集上添加10%的振幅噪声后所有核函数的性能都有所下降但克尔核的下降幅度相对较小保持了领先。在 Breast MNIST 上添加15%的噪声后克尔振幅核仍然保持了83.63%的准确率而 RBF 核骤降至 71.0%压缩态核也降到了 81.2%。克尔相位核也维持在 81.5% 以上。这强烈表明基于克尔相干态构建的特征空间其几何结构本身对噪声具有一定的“缓冲”或“去噪”能力。我们推测这是因为弯曲的流形尤其是双曲空间提供了比平直空间更丰富的几何关系即使数据点因噪声发生微小扰动它们在流形上的相对位置关系由测地线距离而非欧氏距离衡量可能变化不大。4.3 超参数影响分析图4深度解读图4的热力图是我们理解超参数作用的钥匙。它展示了在不同数据集上交叉验证分数如何随j和√(λ/2α)或λ变化。对于相位核图4a, c颜色图显示性能对j的变化非常敏感呈现出清晰的带状或网格状最优区域。j的值直接决定了核函数振荡的频率和幅度。对于 Moons 和 Circles 这类相对简单的决策边界中等大小的j如1.5-2.5表现最好。对于更复杂的 Hypercube 或周期性 Disks 数据更大的j如3-4能提供更强的拟合能力。而λ的影响更像是一个精细调节器在j确定的“好区域”内λ有一个较宽的最优范围。对于振幅核图4b, d情况相反λ成为了主导因素。图像显示存在一个最优的λ值范围对应特定的曲率在此范围内性能达到峰值偏离这个范围则性能下降。j的影响则相对平缓主要是在λ设置好后进行微调。关键洞察没有一套“放之四海而皆准”的最优超参。对于相位编码应先通过网格搜索确定j再调λ。对于振幅编码则应先确定λ。这也反过来说明了为什么克尔核更鲁棒因为它有两个关键的超参数提供了更大的调节自由度去适应不同数据分布。相比之下RBF 核只有一个γ压缩态核甚至没有可调超参数在相位编码中灵活性不足。踩坑实录在早期实验中我们曾试图用标准的黑箱优化器同时优化λ和j。结果发现优化过程很不稳定容易陷入局部最优。后来我们根据上述洞察改为两阶段调参先对j相位核或λ振幅核进行粗粒度搜索锁定大致范围再在这个范围内对两个参数进行联合精细搜索。效率提升了数倍且找到的参数组合更优。5. 物理实现方案与未来展望理论优美实验有效那么怎么在真实的物理系统上实现它呢这是量子机器学习从理论走向应用的关键一步。我们探讨了几种有潜力的物理实现路径。5.1 基于离子阱或光学腔的制备方案克尔相干态属于“非线性相干态”其制备核心在于实现形如A f(n)a的变形算符。一个可行的方案是利用强度依赖的 Jaynes-Cummings 模型。方案简述考虑一个二能级原子与一个单模量子化腔场相互作用同时受到一个强外部经典场的驱动。系统的哈密顿量可以写成包含非线性相互作用项的形式。通过精心设计原子和光场的初始态如原子处于激发态光场处于相干态并控制相互作用时间在相互作用后对原子态进行测量投影可以使腔场坍缩到我们想要的克尔相干态。具体推导表明通过选择不同的测量结果和初始条件可以分别制备出 λ0 和 λ0 的克尔相干态。优势与挑战优势离子阱和光学腔系统具有较长的相干时间量子态制备和测量技术相对成熟。特别是离子阱系统其振动模式与环境的耦合极弱非常适合制备和稳定地维持非线性相干态。挑战需要精确控制原子-光场耦合强度、经典驱动场强度以及相互作用时间。对 λ 和 j 参数的精确编程需要通过调节这些物理参数来实现这对实验控制精度提出了很高要求。5.2 基于光子晶格的模拟方案这是一种更接近模拟量子计算或连续变量量子信息处理的思路。我们提出可以利用Glauber-Fock光子晶格来直接模拟克尔相干态的演化。方案原理Glauber-Fock晶格是一种特殊设计的光波导阵列其中第n个波导与第n1个波导之间的耦合系数遵循√n的规律。当光注入某个波导时它在晶格中的传播动力学恰好模拟了光场在相干态或压缩态下的演化。通过进一步设计耦合系数的分布可以模拟更复杂的变形算符f(n)a的作用。具体操作将数据x编码为注入光的初始模式例如选择注入哪个波导或注入光的相位/振幅分布。光在特制的光子晶格中传播一段距离后输出端的光场分布就对应了经过“克尔位移”操作后的态。通过测量输出端不同波导的光强对应福克态的概率幅就可以间接得到核函数所需的内积信息。优势与挑战优势这是全光学的、室温下运行的方案速度快集成潜力大。它提供了一种直观的“看到”量子态演化的方式。参数λ和j可以通过设计波导的几何结构和耦合系数来“刻”在芯片上一旦制备完成就固定了但可以通过设计不同芯片来实现不同参数。挑战制备精确符合f(n)函数的光子晶格在工艺上有难度。目前主要用来模拟线性或简单的非线性演化模拟复杂的克尔非线性需要更精巧的设计。5.3 通向实用化的思考与未来方向基于目前的成果和实现方案我认为这个方向有几个非常值得探索的未来硬件噪声下的算法协同设计我们的噪声实验是在经典模拟中进行的。在真实的 NISQ 设备上除了数据噪声还有退相干、门误差等硬件噪声。下一步需要研究这些硬件噪声如何影响克尔核的计算以及能否通过设计更鲁棒的编码方案或误差缓解技术来对抗它。也许弯曲的特征空间本身对某些类型的量子噪声不那么敏感这是一个有趣的猜想。与变分量子电路的结合目前我们使用的是“固定”的克尔核。一个自然的扩展是构建变分量子核即用量子电路参数θ来生成一个可学习的特征映射U(x; θ)而这个电路的设计灵感可以来自克尔相干态的制备电路。这样核函数K(x_i, x_j; θ)的参数θ可能包含λ,j的变分形式可以在训练中优化从而自动寻找最适合当前数据集的“弯曲形状”。超越二分类回归与更复杂的任务本文聚焦于二分类但核方法同样适用于回归、聚类和多分类。需要验证克尔核在这些任务上的表现。特别是其几何特性可能对流形学习和降维任务有奇效。探索更复杂的弯曲几何目前我们得到的是恒定曲率的球面或双曲面。现实世界的数据流形可能具有变化的曲率。能否通过更复杂的非线性光学相互作用如更高阶的非线性或者将多个不同λ的克尔核进行组合来构造变曲率的特征空间这将极大地增强模型的表达能力。双曲机器学习与量子优势双曲空间在表示层次化数据如树、图方面具有指数级的容量优势。我们的工作为在量子设备上实现双曲嵌入和双曲神经网络提供了天然的核函数基础。探索在这一特定问题上量子克尔核相比经典双曲方法能否展示出可证明的量子优势是一个极具吸引力的理论问题。最后一点个人体会做量子机器学习不能只盯着“量子加速”这个终极目标。在 NISQ 时代更重要的是找到那些量子系统天然擅长、而经典方法难以模拟的特性并将它们转化为机器学习模型的优势。弯曲的几何就是这样一个特性。克尔效应作为一个经典的物理现象为我们提供了一把在量子特征空间中“雕刻”几何形状的刻刀。这把刀怎么用能雕出多精美的作品值得我们持续探索。这项工作只是一个开始它打开了一扇门门后是一个将微分几何、非线性光学和量子机器学习深度融合的新领域。