1. 项目概述当忆阻器遇见神经信号在脑机接口和神经假体领域我们一直面临一个核心矛盾一方面我们需要从成百上千个神经元通道中实时采集海量的神经电信号动作电位也就是“锋电位”另一方面植入式设备的苛刻限制——极低的功耗预算、微小的芯片面积和有限的无线传输带宽——让传统的CMOS信号处理电路捉襟见肘。想象一下一个拥有上千个记录通道的神经探针每秒产生的数据量轻松达到Gb级别如果全部传输出来再进行离线处理功耗和带宽都是不可承受之重。因此“在节点上”进行实时、低功耗的信号预处理提取出关键的“锋电位”事件就成了整个系统成败的关键。传统的锋电位检测电路无论是基于模拟比较器还是数字信号处理器本质上都是“主动”的它们需要持续供电的放大器、时钟驱动的ADC和逻辑单元功耗很难降到微瓦以下每通道。这就像为了听清一个人的讲话不得不让整个体育馆的音响系统全功率运行效率极低。而我在实验室里折腾了多年的纳米金属氧化物忆阻器似乎提供了一条截然不同的“被动”路径。忆阻器这个听起来有点科幻的器件其核心特性是电阻值能被流经它的电荷历史所改变并且能在断电后“记住”这个状态。更妙的是在某些特定的操作区间它表现出一种“易失性”施加一个超过阈值的电压脉冲它的电阻会短暂下降随后又会像弹簧一样自己慢慢恢复原状。这不正像生物突触吗一个神经脉冲动作电位到来突触后膜的导电性短暂增强随后又逐渐衰减准备接收下一个信号。我们这篇工作的核心就是把这个灵光一现的类比变成了现实利用纳米尺度TiO₂忆阻器在易失区的这种自复位特性直接将其作为一个超低功耗的“类突触锋电位编码器”。我们不再用复杂的电路去“计算”锋电位而是让神经信号电压直接驱动忆阻器其电阻的瞬态变化本身就编码了锋电位的有无和强弱。实测下来单个纳米器件的平均运行功耗可以压到惊人的100纳瓦以下比当前最先进的锋电位检测电路低了近一个数量级。这不仅仅是功耗的降低更是一种处理范式的转变——从“计算”走向“物理映射”。2. 核心思路从非易失到易失的操作范式转变在深入细节之前有必要先厘清我们思路演进的关键一步这也是整个项目的转折点。我们最初的想法很直接利用忆阻器作为积分传感器。神经信号是连续的电压波形忆阻器的电阻变化是所加电压时间积分的函数。当一个锋电位一个超过阈值的高电压脉冲到来时它会在忆阻器上积累足够的“电荷”导致其电阻发生一个非易失性的、阶梯式的下降。噪声和亚阈值信号则因为积分量不足无法触发这种变化。这样忆阻器电阻的“台阶”就对应了锋电位的次数实现了检测和计数。这个想法在初期验证中是成功的但很快就暴露了致命缺陷饱和问题。忆阻器在经历多次SET操作电阻下降后会逐渐进入一个低阻饱和状态再也无法对新的锋电位产生显著响应。这就好比一个弹簧被压到了底失去了弹性。为了解决这个问题我们不得不定期给器件施加RESET脉冲反向电压手动将其拉回高阻态。这个过程不仅引入了额外的控制电路和时序复杂度更重要的是每次RESET操作本身就会消耗可观的能量。在我们之前的实验中对于一个包含约6.3万个数据点的神经记录为了维持检测需要手动复位11次仅复位操作就消耗了约2.7微焦的能量使得单通道功耗攀升到毫瓦级别优势荡然无存。正是这个瓶颈迫使我们把目光投向了忆阻器一个常被忽略的特性易失性。大多数忆阻器研究都追求稳定的非易失性存储而易失性通常被视为需要克服的缺点。但我们反过来想对于需要持续处理瞬态事件如神经脉冲的应用这种“忘记”的能力不正是一个天然的优势吗2.1 易失性操作的物理本质与优势忆阻器的易失性根源在于离子迁移的动态平衡被短暂打破后又自发恢复。以我们使用的TiO₂基器件为例在较高的初始电阻状态下例如300 kΩ到3 MΩ施加一个幅度适当、宽度极窄如1微秒的电压脉冲。这个脉冲会驱动氧空位等可移动离子向器件内部迁移形成一条临时的导电细丝导致电阻骤降。然而由于脉冲能量有限形成的细丝是“脆弱”或不完整的。一旦电压撤除由于离子自身的扩散作用、内置电场的驱动或者界面能垒的作用这些离子又会从细丝中逃逸导致导电通道瓦解电阻自动恢复到接近初始的高阻状态。这个过程是自发的不需要任何外部干预。这就带来了三个关键优势自复位器件在每次响应后自动“清零”永无饱和之忧实现了真正的连续、无间断检测。低功耗易失性操作通常发生在器件的高阻态区域。根据焦耳定律P V²/R在相同操作电压下高阻态意味着更小的电流和更低的动态功耗。类生物特性这种“刺激-响应-衰减”的动态过程与生物突触的短时可塑性如短时程增强在功能上高度相似为构建更仿生的神经形态系统提供了物理基础。我们的核心创新就在于主动地、精确地将忆阻器“偏置”在这个易失性操作区间并将其用于神经锋电位的实时编码。2.2 系统级工作流程设计基于易失性忆阻器的锋电位编码平台其整体工作流程可以概括为“预处理-映射-后处理”三步下图清晰地展示了这一过程整个流程始于原始的神经信号。这些信号首先经过一个可编程的增益和偏置级目的是进行信号调理。这一步至关重要我们需要将神经锋电位的幅度“放大”到恰好超过目标忆阻器易失性操作的阈值电压同时确保背景噪声被压制在阈值之下。这就好比调节显微镜的焦距和亮度让目标细胞清晰可见而杂质模糊不清。调理后的信号被送入我们的核心硬件平台以批次方式施加到忆阻器上。我们不是逐个采样点地读取而是采用了一种“稀疏采样”策略每1000个数据点一个批次中我们只在5个特定时刻读取忆阻器的电阻值。这相当于将连续的时间波形压缩成了5个“状态快照”。通过计算连续快照之间的电阻变化我们就能推断出在这段时间窗口内是否发生了足以改变器件状态的锋电位事件。最后在离线后处理阶段我们将这些电阻变化量与一个基于噪声统计建立的“显著性阈值”进行比较。超过阈值的负向电阻变化对应负向锋电位在实验中是主要极性就被判定为一个有效的锋电位事件。整个过程的数据压缩率高达200倍1000个原始电压点 - 5个电阻值极大地缓解了数据传输的压力。3. 忆阻器器件从制备到伏安特性任何好的想法都需要坚实的物理载体。我们这项工作的基石是一种基于二氧化钛的金属氧化物忆阻器。别看它原理听起来高深其核心结构却非常精巧。3.1 纳米器件的制备工艺我们主要使用两种尺度的器件进行验微米级60 μm × 60 μm和纳米级200 nm × 200 nm。纳米器件的制备更能体现现代半导体工艺的精度。其结构可以简单理解为一個“金属-绝缘体-金属”的三明治底电极首先在热氧化的硅片上通过电子束光刻和剥离工艺制作出钛/铂复合的纳米线底电极。活性层关键的一步通过反应溅射在底电极上沉积一层仅10纳米厚的近化学计量比的TiO₂₋ₓ薄膜。这个“x”代表了氧空位的浓度它正是忆阻效应的源泉——氧空位作为可移动的电荷载体它们的迁移和聚集形成了导电通道。顶电极最后再次通过光刻和剥离制作氮化钛顶电极完成整个器件的构筑。整个工艺与CMOS后端工艺兼容这意味着未来可以无缝地将成千上万个这样的忆阻器集成在神经探针芯片的顶部实现极高的通道密度。3.2 电学表征寻找易失性的“甜蜜点”器件做出来只是第一步如何让它工作在理想的易失区才是真正的技术活。我们开发了一套自动化的“易失性表征模块”来完成这个任务。首先所有忆阻器都需要一个“初始化”步骤称为电形成。施加一个较高的电压对纳米器件约4到6 V在原始的TiO₂薄膜中“烧”出第一条永久的导电细丝使器件从一个极高的初始电阻10 MΩ切换到一個较低阻态约10 kΩ。这之后器件才具备可重复的电阻切换能力。寻找易失区的过程有点像给器件做“压力测试”。算法会施加一系列幅度递增、宽度极窄的编程脉冲然后长时间监测器件电阻的弛豫过程。如下图所示我们关注两个关键输出对于一个给定的电压刺激算法会区分其引起的电阻变化中易失性部分和残留的非易失性部分。我们的目标是找到一个电压范围在这个范围内器件表现出显著的易失性变化绿色圆圈而非易失性变化红色圆圈微乎其微。图中灰色区域就是这个安全的易失性操作电压窗口。窗口的下边界由器件的本征阈值电压决定对于我们的TiO₂器件这个值大约在-0.6 V到-2.5 V之间。施加的电压必须超过这个阈值才能引起可观测的电阻变化但又不能太大否则会驱动器件进入彻底的非易失性切换。通过这个表征我们不仅能确定每个器件的最佳操作电压还能估算出其电阻弛豫到平衡状态所需的时间为后续的神经信号处理批次大小设计提供了依据。实操心得器件的易失性窗口并非一成不变它受制备工艺、材料批次甚至单个器件微观结构的影响。因此对每个器件或每一批器件进行独立的易失性表征是必须的不能想当然地套用参数。我们实验室的常规做法是在新的一批晶圆到货后先随机抽取多个器件进行完整的易失性扫描统计出阈值电压和操作窗口的分布再以此为基础设计神经信号的增益参数。4. 锋电位编码实战从信号到比特理论很美好但实际把神经信号灌进去效果到底怎么样这是我们最关心的部分。接下来我将拆解一次完整的编码实验。4.1 实验设置与信号预处理我们的神经信号来自兔视网膜神经节细胞的体外切片记录使用的是一个128x128通道的CMOS多晶体管阵列。原始信号是微弱的胞外场电位经过芯片上的跨阻放大器后电压范围在10-500 mV之间。第一步增益与偏置调校。这是决定成败的关键一步。我们有一组神经记录数据其中包含密集的锋电位发放。目标忆阻器的易失性阈值电压V_th经测定约为-1.5 V。我们需要设置软件增益G和偏置V_off使得锋电位信号的峰值能够超过-1.5 V因为我们使用负极性脉冲作为主要刺激。背景噪声和亚阈值波动被压制在-1.5 V以内。经过调试我们最终确定G 3.2,V_off 0 V。这意味着原始信号被放大了3.2倍但没有直流偏移。下图展示了预处理后的神经信号a以及忆阻器电阻的实时响应b可以清晰地看到每当一个锋电位事件信号电压超过粉色阈值带发生时忆阻器的电阻就会产生一个向下的瞬态跌落。而在没有锋电位的静息期电阻会自发地、缓慢地恢复到基线水平。这种“刺激-下降-恢复”的循环完美地模拟了突触后电位的动态过程。4.2 数据压缩与事件提取我们按照之前描述的批次处理策略进行操作。每1000个数据点约82毫秒时长被分为一个处理单元。在这个单元内我们在5个时间点读取电阻值起点、300、600、900和终点。这样我们得到了5个电阻“快照”R_start,R_300,R_600,R_900,R_end。锋电位事件就编码在相邻快照的电阻变化中。我们计算归一化的电阻变化ΔR/R0其中R0是每个时间窗口起始时的电阻值。同时我们记录每个时间窗口内的信号最高电压幅度。为了从噪声中区分出真正的锋电位事件我们需要建立一个“噪声带”。这里有一个重要的技巧我们只使用负极性下的噪声测量值。为什么因为我们的主要刺激极性是负的由锋电位引起的电阻变化也是负向的。器件自身的复位过程电阻恢复是正向变化如果把这些正向的噪声也计入统计会严重干扰噪声方差的估计导致阈值设置过高漏掉真实事件。因此我们丢弃所有正向的噪声测量值仅对负向噪声的绝对值计算标准差σ然后以4σ作为噪声带的边界假设噪声服从高斯分布。4.3 性能评估与结果分析将计算出的所有ΔR/R0与其对应时间窗口的最高电压幅度作图并叠加上4σ噪声带结果如下图所示落在噪声带红色虚线以下的电阻变化被视为噪声不予理会。而显著超出噪声带的负向电阻变化图中绿色区域则被判定为锋电位事件。通过这种方法我们的系统从这段神经记录中检测出了67个锋电位。为了评估性能我们以成熟的模板匹配系统作为“金标准”进行比对。TMS在同一段记录中检测出了78个锋电位。通过对比两个系统在每个时间窗口的判断我们可以定义真阳性两个系统都认为该窗口有锋电位。假阳性我们的系统认为有但TMS认为没有。假阴性TMS认为有但我们的系统认为没有。真阴性两个系统都认为没有。计算得到我们系统的真阳性率为74.35%假阳性率为5.14%。这个结果相比之前非易失性操作时需要频繁手动复位的方案TPR 60% FPR 30%有了显著提升。更重要的是整个过程完全自发无需干预。4.4 向纳米尺度进军与性能优化微米器件的成功证明了概念的可行性但真正的价值在于 scalability——可扩展性。我们将器件尺寸缩小到了200 nm × 200 nm。纳米器件工作在更高的电阻区间1-1.5 MΩ这本身就有利于进一步降低功耗。实验发现纳米器件的初始检测性能有所下降TPR和FPR的平衡点不如微米器件理想。这并不意外器件尺寸缩小工艺波动的影响相对更大电学特性的均一性会面临挑战。但我们通过优化信号预处理参数成功提升了性能。我们固定偏置V_off -0.6 V然后系统性地调整增益G2.2 2.4 2.6。对于每一组增益参数重复实验5次以观察稳定性。结果明确显示随着增益从2.2提高到2.6平均真阳性率从23.1%提升到了46.7%。这说明通过精细地调节输入信号与器件特性的匹配度可以有效地补偿纳米器件固有的性能波动。避坑指南处理纳米器件时切忌直接套用微米器件的操作参数。由于更高的电阻和可能不同的界面效应纳米器件的阈值电压和易失性窗口会发生偏移。必须重新进行完整的易失性表征。此外高阻态下测量噪声的影响会更显著因此需要更谨慎地设置噪声带边界有时可能需要采用更保守的5σ或6σ准则虽然会牺牲一些灵敏度但能更好地抑制假阳性。5. 功耗分析与系统级展望低功耗是我们这个方案最吸引人的标签。我们来算一笔实实在在的账。对于纳米器件200 nm x 200 nm操作电阻~1 MΩ 易失区高阻态编程脉冲电压3 V 典型值脉冲宽度1 μs读操作电压0.2 V 标准读电压避免干扰状态能量计算写能量每个数据点施加一个脉冲。能量E_write (V² / R) * t_pulse (3² / 1e6) * 1e-6 9 pJ。读能量每个批次读5次。每次读操作能量E_read (0.2² / 1e6) * 1e-6 0.04 pJ。每批次总读能量5 * 0.04 pJ 0.2 pJ。每批次总能量处理1000个点总写能量1000 * 9 pJ 9 nJ加上读能量0.2 pJ可忽略不计。因此每批次约9 nJ。平均功率神经信号采样率为12.2 kHz即每秒有12.2个批次。因此平均功率P_avg 9 nJ/batch * 12.2 batch/s 109.8 nW。这就是我们宣称的100 nW级别的由来。这还只是保守估计。如果我们利用电压-时间权衡关系将脉冲宽度从1 μs缩短到100 ns这在高速电路中是可行的那么写能量和总功耗还能再降低一个数量级达到~10 nW的水平。作为对比当前文献报道的最先进的专用锋电位检测电路其功耗也在700 nW左右。我们的方案展示了一个数量级的潜在优势。当然一个完整的系统还包括读出电路、偏置电路、多路复用器等外围开销。但这些电路是位于芯片外围的可以被大量通道共享其功耗分摊到每个通道上将会非常小。忆阻器阵列本身作为传感和计算的核心其超低功耗的特性奠定了整个系统低功耗的基石。6. 挑战、局限与未来方向没有任何技术是完美的基于易失性忆阻器的锋电位编码器也不例外。在实际部署前我们必须清醒地认识到它的局限性和需要攻克的挑战。6.1 器件一致性与系统校准忆阻器尤其是纳米尺度的器件存在众所周知的器件间差异问题。不同器件的阈值电压、开关速度、弛豫时间都可能不同。我们的方案通过两个策略来缓解这个问题归一化处理我们关注的是每个时间窗口内电阻的相对变化ΔR/R0而不是绝对的电阻值。这在一定程度上降低了对器件绝对参数一致性的依赖。自动化表征我们开发的易失性表征模块可以快速、自动地测量每个器件的关键参数如V_th和易失性窗口从而为每个通道“个性化”地设置前端的增益和偏置参数。在未来集成系统中这可以作为一个出厂或上电校准步骤。6.2 时间分辨率与信息丰富度我们的方案采用批次处理在每个批次内只进行数次采样。这带来了高达200倍的数据压缩率但代价是损失了精细的时间分辨率。我们无法确定锋电位在1000个点的窗口内具体哪个时刻发生。这对于只需要统计锋电位发放率firing rate的应用如某些脑机接口控制是足够的。但如果需要精确的锋电位时间戳或波形信息这种方案就不适用了。一个有趣的未来方向是探索多级易失性。忆阻器电阻的弛豫动力学可能包含更多信息。例如一个高幅度的锋电位可能导致电阻下降更深恢复更慢而连续的高频锋电位可能导致电阻的累积下降。通过建模电阻弛豫曲线我们或许不仅能检测到锋电位的有无还能对其幅度和频率进行一定程度的编码向更复杂的“锋电位排序”迈进一步。6.3 环境干扰与鲁棒性植入式设备工作环境恶劣存在工频干扰、运动伪迹、电刺激伪影等。我们的方案对持续的、小幅度的干扰如50/60 Hz工频噪声有一定免疫力因为其频率和积分特性可能无法达到器件的阈值。但对于大幅度的瞬态伪影如电刺激产生的巨大脉冲它和真实的锋电位一样会触发器件。因此在实际应用中可能仍然需要结合简单的模拟前端滤波器来抑制特定频带的干扰。6.4 集成与封装将纳米忆阻器阵列与CMOS读出电路进行三维集成是走向实际应用的必经之路。这涉及到CMOS后端工艺兼容性、层间互连、生物相容性封装等一系列工程挑战。好消息是金属氧化物忆阻器的制备温度相对较低与CMOS后端工艺兼容性较好。如何设计高密度、低串扰的阵列架构以及开发相应的并行读取电路是下一步研究的重点。我个人在实际操作中的体会是这项技术的魅力在于它用一种极其“物理”的方式解决了“信息提取”这个核心问题。它不像传统算法那样与噪声“硬碰硬”地计算而是利用器件自身的物理特性阈值、积分、弛豫来自然地过滤和编码信号。这种“模拟自然”的思路往往能带来意想不到的高效。当然从实验室的原型演示到稳定可靠的植入式芯片还有很长的路要走需要材料学家、器件工程师、电路设计师和神经科学家更紧密地协作。但这条通往亚100纳瓦神经信号处理的道路已经由这个小小的纳米器件清晰地指了出来。
基于易失性忆阻器的超低功耗神经锋电位编码技术
1. 项目概述当忆阻器遇见神经信号在脑机接口和神经假体领域我们一直面临一个核心矛盾一方面我们需要从成百上千个神经元通道中实时采集海量的神经电信号动作电位也就是“锋电位”另一方面植入式设备的苛刻限制——极低的功耗预算、微小的芯片面积和有限的无线传输带宽——让传统的CMOS信号处理电路捉襟见肘。想象一下一个拥有上千个记录通道的神经探针每秒产生的数据量轻松达到Gb级别如果全部传输出来再进行离线处理功耗和带宽都是不可承受之重。因此“在节点上”进行实时、低功耗的信号预处理提取出关键的“锋电位”事件就成了整个系统成败的关键。传统的锋电位检测电路无论是基于模拟比较器还是数字信号处理器本质上都是“主动”的它们需要持续供电的放大器、时钟驱动的ADC和逻辑单元功耗很难降到微瓦以下每通道。这就像为了听清一个人的讲话不得不让整个体育馆的音响系统全功率运行效率极低。而我在实验室里折腾了多年的纳米金属氧化物忆阻器似乎提供了一条截然不同的“被动”路径。忆阻器这个听起来有点科幻的器件其核心特性是电阻值能被流经它的电荷历史所改变并且能在断电后“记住”这个状态。更妙的是在某些特定的操作区间它表现出一种“易失性”施加一个超过阈值的电压脉冲它的电阻会短暂下降随后又会像弹簧一样自己慢慢恢复原状。这不正像生物突触吗一个神经脉冲动作电位到来突触后膜的导电性短暂增强随后又逐渐衰减准备接收下一个信号。我们这篇工作的核心就是把这个灵光一现的类比变成了现实利用纳米尺度TiO₂忆阻器在易失区的这种自复位特性直接将其作为一个超低功耗的“类突触锋电位编码器”。我们不再用复杂的电路去“计算”锋电位而是让神经信号电压直接驱动忆阻器其电阻的瞬态变化本身就编码了锋电位的有无和强弱。实测下来单个纳米器件的平均运行功耗可以压到惊人的100纳瓦以下比当前最先进的锋电位检测电路低了近一个数量级。这不仅仅是功耗的降低更是一种处理范式的转变——从“计算”走向“物理映射”。2. 核心思路从非易失到易失的操作范式转变在深入细节之前有必要先厘清我们思路演进的关键一步这也是整个项目的转折点。我们最初的想法很直接利用忆阻器作为积分传感器。神经信号是连续的电压波形忆阻器的电阻变化是所加电压时间积分的函数。当一个锋电位一个超过阈值的高电压脉冲到来时它会在忆阻器上积累足够的“电荷”导致其电阻发生一个非易失性的、阶梯式的下降。噪声和亚阈值信号则因为积分量不足无法触发这种变化。这样忆阻器电阻的“台阶”就对应了锋电位的次数实现了检测和计数。这个想法在初期验证中是成功的但很快就暴露了致命缺陷饱和问题。忆阻器在经历多次SET操作电阻下降后会逐渐进入一个低阻饱和状态再也无法对新的锋电位产生显著响应。这就好比一个弹簧被压到了底失去了弹性。为了解决这个问题我们不得不定期给器件施加RESET脉冲反向电压手动将其拉回高阻态。这个过程不仅引入了额外的控制电路和时序复杂度更重要的是每次RESET操作本身就会消耗可观的能量。在我们之前的实验中对于一个包含约6.3万个数据点的神经记录为了维持检测需要手动复位11次仅复位操作就消耗了约2.7微焦的能量使得单通道功耗攀升到毫瓦级别优势荡然无存。正是这个瓶颈迫使我们把目光投向了忆阻器一个常被忽略的特性易失性。大多数忆阻器研究都追求稳定的非易失性存储而易失性通常被视为需要克服的缺点。但我们反过来想对于需要持续处理瞬态事件如神经脉冲的应用这种“忘记”的能力不正是一个天然的优势吗2.1 易失性操作的物理本质与优势忆阻器的易失性根源在于离子迁移的动态平衡被短暂打破后又自发恢复。以我们使用的TiO₂基器件为例在较高的初始电阻状态下例如300 kΩ到3 MΩ施加一个幅度适当、宽度极窄如1微秒的电压脉冲。这个脉冲会驱动氧空位等可移动离子向器件内部迁移形成一条临时的导电细丝导致电阻骤降。然而由于脉冲能量有限形成的细丝是“脆弱”或不完整的。一旦电压撤除由于离子自身的扩散作用、内置电场的驱动或者界面能垒的作用这些离子又会从细丝中逃逸导致导电通道瓦解电阻自动恢复到接近初始的高阻状态。这个过程是自发的不需要任何外部干预。这就带来了三个关键优势自复位器件在每次响应后自动“清零”永无饱和之忧实现了真正的连续、无间断检测。低功耗易失性操作通常发生在器件的高阻态区域。根据焦耳定律P V²/R在相同操作电压下高阻态意味着更小的电流和更低的动态功耗。类生物特性这种“刺激-响应-衰减”的动态过程与生物突触的短时可塑性如短时程增强在功能上高度相似为构建更仿生的神经形态系统提供了物理基础。我们的核心创新就在于主动地、精确地将忆阻器“偏置”在这个易失性操作区间并将其用于神经锋电位的实时编码。2.2 系统级工作流程设计基于易失性忆阻器的锋电位编码平台其整体工作流程可以概括为“预处理-映射-后处理”三步下图清晰地展示了这一过程整个流程始于原始的神经信号。这些信号首先经过一个可编程的增益和偏置级目的是进行信号调理。这一步至关重要我们需要将神经锋电位的幅度“放大”到恰好超过目标忆阻器易失性操作的阈值电压同时确保背景噪声被压制在阈值之下。这就好比调节显微镜的焦距和亮度让目标细胞清晰可见而杂质模糊不清。调理后的信号被送入我们的核心硬件平台以批次方式施加到忆阻器上。我们不是逐个采样点地读取而是采用了一种“稀疏采样”策略每1000个数据点一个批次中我们只在5个特定时刻读取忆阻器的电阻值。这相当于将连续的时间波形压缩成了5个“状态快照”。通过计算连续快照之间的电阻变化我们就能推断出在这段时间窗口内是否发生了足以改变器件状态的锋电位事件。最后在离线后处理阶段我们将这些电阻变化量与一个基于噪声统计建立的“显著性阈值”进行比较。超过阈值的负向电阻变化对应负向锋电位在实验中是主要极性就被判定为一个有效的锋电位事件。整个过程的数据压缩率高达200倍1000个原始电压点 - 5个电阻值极大地缓解了数据传输的压力。3. 忆阻器器件从制备到伏安特性任何好的想法都需要坚实的物理载体。我们这项工作的基石是一种基于二氧化钛的金属氧化物忆阻器。别看它原理听起来高深其核心结构却非常精巧。3.1 纳米器件的制备工艺我们主要使用两种尺度的器件进行验微米级60 μm × 60 μm和纳米级200 nm × 200 nm。纳米器件的制备更能体现现代半导体工艺的精度。其结构可以简单理解为一個“金属-绝缘体-金属”的三明治底电极首先在热氧化的硅片上通过电子束光刻和剥离工艺制作出钛/铂复合的纳米线底电极。活性层关键的一步通过反应溅射在底电极上沉积一层仅10纳米厚的近化学计量比的TiO₂₋ₓ薄膜。这个“x”代表了氧空位的浓度它正是忆阻效应的源泉——氧空位作为可移动的电荷载体它们的迁移和聚集形成了导电通道。顶电极最后再次通过光刻和剥离制作氮化钛顶电极完成整个器件的构筑。整个工艺与CMOS后端工艺兼容这意味着未来可以无缝地将成千上万个这样的忆阻器集成在神经探针芯片的顶部实现极高的通道密度。3.2 电学表征寻找易失性的“甜蜜点”器件做出来只是第一步如何让它工作在理想的易失区才是真正的技术活。我们开发了一套自动化的“易失性表征模块”来完成这个任务。首先所有忆阻器都需要一个“初始化”步骤称为电形成。施加一个较高的电压对纳米器件约4到6 V在原始的TiO₂薄膜中“烧”出第一条永久的导电细丝使器件从一个极高的初始电阻10 MΩ切换到一個较低阻态约10 kΩ。这之后器件才具备可重复的电阻切换能力。寻找易失区的过程有点像给器件做“压力测试”。算法会施加一系列幅度递增、宽度极窄的编程脉冲然后长时间监测器件电阻的弛豫过程。如下图所示我们关注两个关键输出对于一个给定的电压刺激算法会区分其引起的电阻变化中易失性部分和残留的非易失性部分。我们的目标是找到一个电压范围在这个范围内器件表现出显著的易失性变化绿色圆圈而非易失性变化红色圆圈微乎其微。图中灰色区域就是这个安全的易失性操作电压窗口。窗口的下边界由器件的本征阈值电压决定对于我们的TiO₂器件这个值大约在-0.6 V到-2.5 V之间。施加的电压必须超过这个阈值才能引起可观测的电阻变化但又不能太大否则会驱动器件进入彻底的非易失性切换。通过这个表征我们不仅能确定每个器件的最佳操作电压还能估算出其电阻弛豫到平衡状态所需的时间为后续的神经信号处理批次大小设计提供了依据。实操心得器件的易失性窗口并非一成不变它受制备工艺、材料批次甚至单个器件微观结构的影响。因此对每个器件或每一批器件进行独立的易失性表征是必须的不能想当然地套用参数。我们实验室的常规做法是在新的一批晶圆到货后先随机抽取多个器件进行完整的易失性扫描统计出阈值电压和操作窗口的分布再以此为基础设计神经信号的增益参数。4. 锋电位编码实战从信号到比特理论很美好但实际把神经信号灌进去效果到底怎么样这是我们最关心的部分。接下来我将拆解一次完整的编码实验。4.1 实验设置与信号预处理我们的神经信号来自兔视网膜神经节细胞的体外切片记录使用的是一个128x128通道的CMOS多晶体管阵列。原始信号是微弱的胞外场电位经过芯片上的跨阻放大器后电压范围在10-500 mV之间。第一步增益与偏置调校。这是决定成败的关键一步。我们有一组神经记录数据其中包含密集的锋电位发放。目标忆阻器的易失性阈值电压V_th经测定约为-1.5 V。我们需要设置软件增益G和偏置V_off使得锋电位信号的峰值能够超过-1.5 V因为我们使用负极性脉冲作为主要刺激。背景噪声和亚阈值波动被压制在-1.5 V以内。经过调试我们最终确定G 3.2,V_off 0 V。这意味着原始信号被放大了3.2倍但没有直流偏移。下图展示了预处理后的神经信号a以及忆阻器电阻的实时响应b可以清晰地看到每当一个锋电位事件信号电压超过粉色阈值带发生时忆阻器的电阻就会产生一个向下的瞬态跌落。而在没有锋电位的静息期电阻会自发地、缓慢地恢复到基线水平。这种“刺激-下降-恢复”的循环完美地模拟了突触后电位的动态过程。4.2 数据压缩与事件提取我们按照之前描述的批次处理策略进行操作。每1000个数据点约82毫秒时长被分为一个处理单元。在这个单元内我们在5个时间点读取电阻值起点、300、600、900和终点。这样我们得到了5个电阻“快照”R_start,R_300,R_600,R_900,R_end。锋电位事件就编码在相邻快照的电阻变化中。我们计算归一化的电阻变化ΔR/R0其中R0是每个时间窗口起始时的电阻值。同时我们记录每个时间窗口内的信号最高电压幅度。为了从噪声中区分出真正的锋电位事件我们需要建立一个“噪声带”。这里有一个重要的技巧我们只使用负极性下的噪声测量值。为什么因为我们的主要刺激极性是负的由锋电位引起的电阻变化也是负向的。器件自身的复位过程电阻恢复是正向变化如果把这些正向的噪声也计入统计会严重干扰噪声方差的估计导致阈值设置过高漏掉真实事件。因此我们丢弃所有正向的噪声测量值仅对负向噪声的绝对值计算标准差σ然后以4σ作为噪声带的边界假设噪声服从高斯分布。4.3 性能评估与结果分析将计算出的所有ΔR/R0与其对应时间窗口的最高电压幅度作图并叠加上4σ噪声带结果如下图所示落在噪声带红色虚线以下的电阻变化被视为噪声不予理会。而显著超出噪声带的负向电阻变化图中绿色区域则被判定为锋电位事件。通过这种方法我们的系统从这段神经记录中检测出了67个锋电位。为了评估性能我们以成熟的模板匹配系统作为“金标准”进行比对。TMS在同一段记录中检测出了78个锋电位。通过对比两个系统在每个时间窗口的判断我们可以定义真阳性两个系统都认为该窗口有锋电位。假阳性我们的系统认为有但TMS认为没有。假阴性TMS认为有但我们的系统认为没有。真阴性两个系统都认为没有。计算得到我们系统的真阳性率为74.35%假阳性率为5.14%。这个结果相比之前非易失性操作时需要频繁手动复位的方案TPR 60% FPR 30%有了显著提升。更重要的是整个过程完全自发无需干预。4.4 向纳米尺度进军与性能优化微米器件的成功证明了概念的可行性但真正的价值在于 scalability——可扩展性。我们将器件尺寸缩小到了200 nm × 200 nm。纳米器件工作在更高的电阻区间1-1.5 MΩ这本身就有利于进一步降低功耗。实验发现纳米器件的初始检测性能有所下降TPR和FPR的平衡点不如微米器件理想。这并不意外器件尺寸缩小工艺波动的影响相对更大电学特性的均一性会面临挑战。但我们通过优化信号预处理参数成功提升了性能。我们固定偏置V_off -0.6 V然后系统性地调整增益G2.2 2.4 2.6。对于每一组增益参数重复实验5次以观察稳定性。结果明确显示随着增益从2.2提高到2.6平均真阳性率从23.1%提升到了46.7%。这说明通过精细地调节输入信号与器件特性的匹配度可以有效地补偿纳米器件固有的性能波动。避坑指南处理纳米器件时切忌直接套用微米器件的操作参数。由于更高的电阻和可能不同的界面效应纳米器件的阈值电压和易失性窗口会发生偏移。必须重新进行完整的易失性表征。此外高阻态下测量噪声的影响会更显著因此需要更谨慎地设置噪声带边界有时可能需要采用更保守的5σ或6σ准则虽然会牺牲一些灵敏度但能更好地抑制假阳性。5. 功耗分析与系统级展望低功耗是我们这个方案最吸引人的标签。我们来算一笔实实在在的账。对于纳米器件200 nm x 200 nm操作电阻~1 MΩ 易失区高阻态编程脉冲电压3 V 典型值脉冲宽度1 μs读操作电压0.2 V 标准读电压避免干扰状态能量计算写能量每个数据点施加一个脉冲。能量E_write (V² / R) * t_pulse (3² / 1e6) * 1e-6 9 pJ。读能量每个批次读5次。每次读操作能量E_read (0.2² / 1e6) * 1e-6 0.04 pJ。每批次总读能量5 * 0.04 pJ 0.2 pJ。每批次总能量处理1000个点总写能量1000 * 9 pJ 9 nJ加上读能量0.2 pJ可忽略不计。因此每批次约9 nJ。平均功率神经信号采样率为12.2 kHz即每秒有12.2个批次。因此平均功率P_avg 9 nJ/batch * 12.2 batch/s 109.8 nW。这就是我们宣称的100 nW级别的由来。这还只是保守估计。如果我们利用电压-时间权衡关系将脉冲宽度从1 μs缩短到100 ns这在高速电路中是可行的那么写能量和总功耗还能再降低一个数量级达到~10 nW的水平。作为对比当前文献报道的最先进的专用锋电位检测电路其功耗也在700 nW左右。我们的方案展示了一个数量级的潜在优势。当然一个完整的系统还包括读出电路、偏置电路、多路复用器等外围开销。但这些电路是位于芯片外围的可以被大量通道共享其功耗分摊到每个通道上将会非常小。忆阻器阵列本身作为传感和计算的核心其超低功耗的特性奠定了整个系统低功耗的基石。6. 挑战、局限与未来方向没有任何技术是完美的基于易失性忆阻器的锋电位编码器也不例外。在实际部署前我们必须清醒地认识到它的局限性和需要攻克的挑战。6.1 器件一致性与系统校准忆阻器尤其是纳米尺度的器件存在众所周知的器件间差异问题。不同器件的阈值电压、开关速度、弛豫时间都可能不同。我们的方案通过两个策略来缓解这个问题归一化处理我们关注的是每个时间窗口内电阻的相对变化ΔR/R0而不是绝对的电阻值。这在一定程度上降低了对器件绝对参数一致性的依赖。自动化表征我们开发的易失性表征模块可以快速、自动地测量每个器件的关键参数如V_th和易失性窗口从而为每个通道“个性化”地设置前端的增益和偏置参数。在未来集成系统中这可以作为一个出厂或上电校准步骤。6.2 时间分辨率与信息丰富度我们的方案采用批次处理在每个批次内只进行数次采样。这带来了高达200倍的数据压缩率但代价是损失了精细的时间分辨率。我们无法确定锋电位在1000个点的窗口内具体哪个时刻发生。这对于只需要统计锋电位发放率firing rate的应用如某些脑机接口控制是足够的。但如果需要精确的锋电位时间戳或波形信息这种方案就不适用了。一个有趣的未来方向是探索多级易失性。忆阻器电阻的弛豫动力学可能包含更多信息。例如一个高幅度的锋电位可能导致电阻下降更深恢复更慢而连续的高频锋电位可能导致电阻的累积下降。通过建模电阻弛豫曲线我们或许不仅能检测到锋电位的有无还能对其幅度和频率进行一定程度的编码向更复杂的“锋电位排序”迈进一步。6.3 环境干扰与鲁棒性植入式设备工作环境恶劣存在工频干扰、运动伪迹、电刺激伪影等。我们的方案对持续的、小幅度的干扰如50/60 Hz工频噪声有一定免疫力因为其频率和积分特性可能无法达到器件的阈值。但对于大幅度的瞬态伪影如电刺激产生的巨大脉冲它和真实的锋电位一样会触发器件。因此在实际应用中可能仍然需要结合简单的模拟前端滤波器来抑制特定频带的干扰。6.4 集成与封装将纳米忆阻器阵列与CMOS读出电路进行三维集成是走向实际应用的必经之路。这涉及到CMOS后端工艺兼容性、层间互连、生物相容性封装等一系列工程挑战。好消息是金属氧化物忆阻器的制备温度相对较低与CMOS后端工艺兼容性较好。如何设计高密度、低串扰的阵列架构以及开发相应的并行读取电路是下一步研究的重点。我个人在实际操作中的体会是这项技术的魅力在于它用一种极其“物理”的方式解决了“信息提取”这个核心问题。它不像传统算法那样与噪声“硬碰硬”地计算而是利用器件自身的物理特性阈值、积分、弛豫来自然地过滤和编码信号。这种“模拟自然”的思路往往能带来意想不到的高效。当然从实验室的原型演示到稳定可靠的植入式芯片还有很长的路要走需要材料学家、器件工程师、电路设计师和神经科学家更紧密地协作。但这条通往亚100纳瓦神经信号处理的道路已经由这个小小的纳米器件清晰地指了出来。