1. 项目概述当毫米波MIMO遇见时间调制阵列在5G及未来6G的演进道路上毫米波通信因其巨大的可用带宽被视为实现超高速率数据传输的关键。然而毫米波信号在传播中面临严重的路径损耗和有限的散射环境这使得传统的全数字大规模MIMO架构变得不切实际——为成百上千根天线中的每一根都配备一条独立的射频链路和高速数据转换器其功耗和成本将是天文数字。于是混合预编码技术应运而生它像一位精明的“资源调配师”在数字域的灵活性与模拟域的硬件限制之间寻找最优解。混合预编码的核心思想是“分层处理”在基带使用低维的数字预编码器进行精确但复杂度可控的信号处理如用户间干扰消除、功率分配而在射频前端则使用高维的模拟预编码器通常由移相器网络构成进行宽带的波束成形将能量聚焦到特定方向。这大幅减少了所需的昂贵射频链路数量。然而传统的模拟预编码器依赖于高精度移相器在毫米波频段这些移相器不仅插入损耗大、成本高昂而且功耗可观。正是在这个背景下时间调制阵列进入了我们的视野。TMA是一种通过高速开关周期性控制天线单元通断从而在时域上调制信号的技术。它本质上是一个“时空调制器”其神奇之处在于通过精心设计每个天线单元的开关时序可以在空间域产生可控的波束并且能在谐波频率上生成额外的波束模式。将TMA应用于混合预编码的模拟部分用低成本、低功耗的开关替代复杂的移相器是一个极具吸引力的想法。这不仅仅是硬件的简单替换更带来了一系列新的设计挑战和机遇如何用只有“开”和“关”两种状态的开关去逼近甚至实现传统移相器所能提供的连续相位调整如何在追求高数据速率的同时管理因开关谐波辐射带来的频谱再生和功率损耗这正是本文要深入探讨的“基于时间调制阵列的混合预编码技术”。2. 核心原理TMA混合预编码的数学与物理基础要理解TMA如何工作我们需要从两个层面入手一是其作为天线阵列的物理波束形成机制二是其作为预编码器在通信系统模型中的数学表达。2.1 时间调制阵列的工作原理想象一个由多个天线单元组成的阵列。在传统相控阵中我们通过给每个天线单元施加不同的静态相位偏移由移相器实现来控制波束方向。而在TMA中我们给每个天线单元连接一个高速射频开关。这个开关以一个公共的射频载波频率为基准按照一个特定的、周期性的时序函数通常是矩形脉冲进行“打开”和“关闭”。关键在于这个时序函数。对于第n个天线单元其开关函数 $g_n(t)$ 是一个周期为 $T_p$ 的周期函数。在一个周期内它只在 $\tau_n$ 到 $\tau_n \delta_n$ 的时间窗内为“1”导通其余时间为“0”关断。这里$\tau_n$ 是脉冲的起始时间$\delta_n$ 是脉冲宽度。根据傅里叶分析任何周期函数都可以分解为一系列谐波的叠加。因此第n个天线单元辐射的信号可以表示为 $$ s_n(t) g_n(t) e^{j2\pi f_c t} \sum_{q-\infty}^{\infty} a_{n,q} e^{j2\pi (f_c q f_p) t} $$ 其中$f_c$ 是载波频率$f_p 1/T_p$ 是开关频率$a_{n,q}$ 是第q次谐波的复权重系数它由开关函数 $g_n(t)$ 的傅里叶系数决定$a_{n,q} \frac{\delta_n}{T_p} \text{sinc}(q\pi \frac{\delta_n}{T_p}) e^{-j2\pi q \frac{\tau_n}{T_p}}$。这个公式揭示了TMA的核心魔法基波q0波束其权重 $a_{n,0} \delta_n / T_p$。通过控制不同天线单元的脉冲宽度 $\delta_n$我们可以实现振幅加权通过控制脉冲起始时间 $\tau_n$我们可以实现等效的相位偏移。因为 $e^{-j2\pi q \tau_n / T_p}$ 项在 q0 时恒为1所以基波波束的相位是均匀的但振幅可变。这意味着TMA在基波上只能实现实数权重的波束形成。谐波q≠0波束在频率 $f_c ± q f_p$ 处会产生额外的波束。这些谐波波束的权重同时受 $\delta_n$ 和 $\tau_n$ 调制因此可以同时控制振幅和相位。但谐波能量通常是需要抑制的“频谱再生”是功率损耗的主要来源之一。因此在混合预编码架构中我们主要利用TMA的基波模式q0来构建模拟预编码矩阵 $\mathbf{P}{RF}$。这个矩阵的每个元素 $[\mathbf{P}{RF}]_{n,m}$ 对应第m条射频链驱动第n个天线单元的等效权重。由于它源于脉冲宽度调制其值被约束在实数范围 $[-1, 1]$ 内这比传统移相器的复数单位圆约束更简单但也带来了新的限制。2.2 系统模型与问题 formulation考虑一个点对点的毫米波MIMO系统发射端有 $N_T$ 根天线和 $L_{BS}$ 条射频链路接收端有 $N_R$ 根天线。系统发送 $N_s$ 个数据流$N_s \leq L_{BS} \ll N_T$。发射信号可以建模为$\mathbf{x} \mathbf{P}{RF} \mathbf{P}{BB} \mathbf{s}$。其中$\mathbf{s}$ 是 $N_s \times 1$ 的符号向量$\mathbf{P}{BB}$ 是 $L{BS} \times N_s$ 的数字基带预编码矩阵可进行复数域任意操作$\mathbf{P}{RF}$ 是 $N_T \times L{BS}$ 的TMA模拟预编码矩阵元素为实数且受限于 $[-1, 1]$。接收信号为$\mathbf{y} \mathbf{H} \mathbf{P}{RF} \mathbf{P}{BB} \mathbf{s} \mathbf{n}$。其中$\mathbf{H}$ 是 $N_R \times N_T$ 的毫米波信道矩阵通常采用基于几何的稀疏信道模型由有限个散射路径构成$\mathbf{n}$ 是复高斯白噪声。我们的设计目标是最大化系统的可达速率互信息 $$ \max_{\mathbf{P}{RF}, \mathbf{P}{BB}} \log_2 \det \left( \mathbf{I} \frac{1}{N_s N_0} \mathbf{H} \mathbf{P}{RF} \mathbf{P}{BB} \mathbf{P}{BB}^H \mathbf{P}{RF}^T \mathbf{H}^H \right) $$ 同时满足总发射功率约束 $|\mathbf{P}{RF} \mathbf{P}{BB}|F^2 \leq P{TX}$以及TMA硬件约束 $[\mathbf{P}{RF}]{n,m} \in [-1, 1]$。这里出现了一个根本性挑战如何用实数且受限的 $\mathbf{P}_{RF}$ 去逼近一个最优的全数字预编码器 $\mathbf{P}_D$一个复数矩阵论文中给出了一个关键的分解洞察对于一个任意的复数矩阵 $\mathbf{P}D$我们可以通过两条射频链路来合成一个复数数据流。具体分解如原文公式(26)所示将 $\mathbf{P}D$ 的实部和虚部分别用两个实数向量来承载再通过基带的一个固定变换 $(\text{diag}(\beta_1, ..., \beta{N_s}) \otimes [1, j]^T)$ 重新组合为复数信号。这在理论上证明最多需要 $L{BS} 2N_s$ 条射频链路即可完美拟合任何全数字预编码器。但在实际系统中为了降低成本我们通常设置 $L_{BS} N_s$这就需要设计更聪明的算法在性能上做出权衡。注意这里有一个非常重要的实操细节。在硬件实现时TMA的每个权重 $[\mathbf{P}{RF}]{n,m}$ 对应一个具体的脉冲宽度 $\delta_{n,m}$ 和时延 $\tau_{n,m}$。映射关系为 $[\mathbf{P}{RF}]{n,m} \xi_{n,m} \delta_{n,m} / T_p$对于基波。因此算法输出的 $\mathbf{P}_{RF}$ 矩阵必须经过一个“量化”步骤将 $[-1, 1]$ 内的连续实数映射到 $[0, 1]$ 内的脉冲占空比。负值通常通过一个额外的180度固定移相器或差分驱动来实现。3. 算法设计从交替优化到联合设计面对上述非凸的联合优化问题研究者们提出了多算法。这些算法的核心思想都是在性能、复杂度和硬件约束之间寻找可行的路径。下面我们深入剖析几种主流的TMA混合预编码设计方法。3.1 交替优化法这是一种非常直观且常用的思路。既然联合优化 $\mathbf{P}{RF}$ 和 $\mathbf{P}{BB}$ 很困难那就采用“分而治之”的策略固定一个优化另一个如此交替迭代直至收敛。步骤拆解初始化首先需要一个初始点。可以随机初始化 $\mathbf{P}_{RF}$或者使用信道主成分等启发式方法初始化。固定模拟优化数字假设 $\mathbf{P}{RF}$ 已知优化问题简化为寻找一个 $\mathbf{P}{BB}$使得混合预编码 $\mathbf{P}{RF}\mathbf{P}{BB}$ 尽可能接近最优全数字预编码 $\mathbf{P}D$同时满足功率约束。这本质上是一个最小二乘问题其解析解可以通过正交Procrustes问题求得。具体而言最优的 $\mathbf{P}{BB}$ 为 $\mathbf{V}\mathbf{U}^H$其中 $\mathbf{P}D^T \mathbf{P}{RF} \mathbf{U}\mathbf{\Sigma}\mathbf{V}^H$ 是奇异值分解。这个解保证了 $\mathbf{P}_{BB}$ 是一个酉矩阵或具有正交列这有助于简化功率分配。固定数字优化模拟在 $\mathbf{P}{BB}$ 已知的情况下优化 $\mathbf{P}{RF}$ 的问题变为一个在实数域、且有范数约束的线性规划问题。论文中给出了闭式解公式31其形式是 $\mathbf{P}D \mathbf{P}{BB}^H$ 及其共轭转置的线性组合的归一化。这个解能保证功率约束以等式满足即用尽所有发射功率。迭代与收敛重复步骤2和3。由于每一步更新都在给定条件下是最优的目标函数混合预编码与全数字预编码的Frobenius范数距离在每次迭代后都不会增加因此算法保证收敛到一个局部最优解。实操心得与陷阱收敛速度AO算法通常收敛平稳但速度取决于初始值。在低信噪比或信道稀疏性高时收敛较快。局部最优这是交替优化的通病。算法可能陷入一个离全局最优很远的局部解。实践中可以采用多次随机初始化选择性能最好的结果。标量因子注意在步骤3得到的 $\mathbf{P}{RF}$ 解是满足总功率约束的。但在步骤2中我们求解 $\mathbf{P}{BB}$ 时并未考虑TMA的 $[-1, 1]$ 约束。因此在算法最后或每次迭代后需要对 $\mathbf{P}{RF}$ 进行缩放确保其所有元素落在 $[-1, 1]$ 区间内。这个缩放操作会影响最终功率可能需要重新调整 $\mathbf{P}{BB}$ 以保证总功率不变这是一个细微但关键的实现环节。3.2 梯度投影法梯度法直接瞄准原始优化问题公式32试图通过梯度下降来最小化 $|\mathbf{P}D - \mathbf{P}{RF}\mathbf{P}{BB}|F^2$。其巧妙之处在于它将 $\mathbf{P}{BB}$ 表示为 $\mathbf{P}{RF}$ 的函数通过最小二乘解从而将联合优化问题降维为一个仅关于 $\mathbf{P}_{RF}$ 的优化问题。核心步骤变量消元对于给定的 $\mathbf{P}{RF}$满足功率约束的最优 $\mathbf{P}{BB}$ 有闭式解公式33。将其代入目标函数距离度量 $d$ 可以简化为只关于 $\mathbf{P}_{RF}$ 的表达式公式34。梯度计算与下降计算距离度量 $d$ 关于实矩阵 $\mathbf{P}{RF}$ 的梯度 $\partial d / \partial \mathbf{P}{RF}$公式35。这个梯度表达式虽然复杂但可以解析求得。然后进行梯度下降更新$\mathbf{P}{RF}^{(k1)} \mathbf{P}{RF}^{(k)} - \mu \cdot \partial d / \partial \mathbf{P}_{RF}$其中 $\mu$ 是步长。与传统VPS方案的对比优势对于传统的可变移相器方案梯度更新后还需要将 $\mathbf{P}{RF}$ 投影到单位模值约束的可行集上这是一个非线性操作增加了计算量。而TMA的约束是简单的实数区间 $[-1, 1]$不需要复杂的投影操作。更新后的 $\mathbf{P}{RF}$ 如果越界只需进行简单的截断clipping即可$[\mathbf{P}{RF}]{n,m} \max(-1, \min(1, [\mathbf{P}{RF}]{n,m}))$。这大大简化了计算是TMA在算法实现上的一个显著优势。注意事项步长选择梯度法的性能严重依赖于步长 $\mu$。步长太大会震荡甚至发散步长太小则收敛缓慢。可以采用自适应步长策略如Armijo线搜索。收敛性能如图4所示梯度法在低信噪比时迭代次数少性能好。但在高信噪比时由于需要逼近更复杂的全数字预编码迭代次数会急剧增加。这是因为高信噪比下信道矩阵的有效秩增加需要更精细的波束形成优化问题变得更复杂。3.3 解耦设计与两步SVD法前两种方法都试图直接逼近全数字预编码器。而解耦设计则采用了不同的哲学先设计模拟预编码器 $\mathbf{P}{RF}$ 来捕获信道的主要空间特征即获取大的阵列增益再设计数字预编码器 $\mathbf{P}{BB}$ 来处理剩余的干扰如流间干扰并进行注水功率分配。算法流程模拟预编码器设计第一步假设数字预编码器满足 $\mathbf{P}{BB}\mathbf{P}{BB}^H \gamma \mathbf{I}$即各数据流在数字预编码后是功率均衡且正交的。这个假设简化了问题将互信息表达式中的 $\mathbf{P}_{BB}$ 分离出去。优化问题简化为最大化 $\log_2 \det(\mathbf{I} \frac{\gamma}{N_0 N_s} \mathbf{H} \mathbf{P}{RF} \mathbf{P}{RF}^T \mathbf{H}^H)$。这仍然复杂但论文提出了一种基于信道实部 Gram 矩阵 $\mathbf{G}_{\Re} \Re{\mathbf{H}^H\mathbf{H}}$ 的启发式方法。核心操作取 $\mathbf{G}{\Re}$ 的前 $L{BS}$ 个最大特征值对应的特征向量构成 $\mathbf{P}{RF}$。即 $\mathbf{P}{RF} [\mathbf{U}{\Re}]{:,1:L_{BS}}$。为什么是实部因为 $\mathbf{P}_{RF}$ 是实矩阵它只能影响信道矩阵的实部投影。这个选择旨在最大化信号在实部子空间上的能量。数字预编码器设计第二步基于第一步得到的 $\mathbf{P}{RF}$构造一个等效的降维信道 $\mathbf{H}{eff} \mathbf{H} \mathbf{P}{RF} (\mathbf{P}{RF}^T \mathbf{P}_{RF})^{-1/2}$。这个操作相当于将高维天线空间映射到低维的射频链路上。此时数字预编码器的设计问题转化为一个标准的 MIMO 预编码问题在等效信道 $\mathbf{H}{eff}$ 上设计 $\mathbf{\bar{P}}{BB}$ 以最大化互信息。这可以通过对 $\mathbf{H}_{eff}$ 进行 SVD 分解并采用注水功率分配算法来求解。最终的数字预编码器为 $\mathbf{P}{BB} (\mathbf{P}{RF}^T \mathbf{P}{RF})^{-1/2} \mathbf{\bar{P}}{BB}$。为什么叫“两步SVD”第一步是对信道实部矩阵做特征分解SVD的特例第二步是对等效信道做SVD。这种方法计算复杂度低因为两个SVD操作都是在维度大幅降低的矩阵上进行的$N_T \times N_T$ 的实对称矩阵和 $N_R \times L_{BS}$ 的复矩阵。性能特点低信噪比友好在低信噪比下系统是噪声受限的主要目标是获取大的波束成形增益。两步SVD法设计的 $\mathbf{P}_{RF}$ 能很好地捕获信道主成分性能接近全数字预编码。高信噪比瓶颈在高信噪比下系统是干扰受限的。由于 $\mathbf{P}{RF}$ 仅基于实部设计它无法完全对角化整个复信道矩阵残留的流间干扰会限制性能提升。此时数字预编码器 $\mathbf{P}{BB}$ 的干扰消除能力变得至关重要。3.4 迭代干扰抑制算法为了克服两步SVD法在高信噪比下的缺陷论文进一步提出了一种迭代算法。其核心思想是在模拟预编码器设计阶段就主动考虑并抑制流间干扰。算法思路逐列更新不像两步SVD法一次性计算整个 $\mathbf{P}{RF}$迭代算法每次只优化 $\mathbf{P}{RF}$ 中的一列对应一条数据流的模拟波束成形向量同时固定其他列。干扰感知当优化第m列 $\mathbf{p}_{RF,m}$ 时算法会从目标函数中“减去”其他数据流第 $\bar{m}$ 列已产生的干扰。这体现在公式(40)中定义的矩阵 $\mathbf{G}_m$ 上它包含了除去第m流后其他流造成的有效信道和干扰。特征向量求解在给定干扰背景下最大化第m流信干噪比的问题公式41其最优解是矩阵 $\Re{\mathbf{G}_m}$即 $\mathbf{G}_m$ 的实部的主特征向量。这是一个实向量完美符合TMA的约束。循环迭代依次更新 $\mathbf{P}{RF}$ 的每一列循环多次直至收敛。然后再基于最终的 $\mathbf{P}{RF}$像两步SVD法一样设计数字预编码器 $\mathbf{P}_{BB}$。优势与代价优势通过迭代干扰抑制该方法在中高信噪比下能获得比两步SVD更好的性能更接近全数字预编码。代价计算复杂度显著高于两步SVD。每次迭代都需要计算多个矩阵的逆和特征值分解尽管维度不高$L_{BS} \times L_{BS}$但迭代次数可能较多。重要提示在实际仿真或实现中这些算法输出的 $\mathbf{P}{RF}$ 需要经过后处理。除了之前提到的缩放至 $[-1, 1]$ 区间论文第V-C节还提出了一种提升开关效率的缩放策略。通过引入一个对角缩放矩阵 $\mathbf{\Psi}$在保持可达速率不变的前提下可以调整 $\mathbf{P}{RF}$ 各列的幅度从而最小化谐波辐射功率即开关损耗。这是一个针对TMA特有的、非常实用的优化步骤。4. 性能深度剖析效率、复杂度与权衡论文通过大量的数值仿真对比了上述各种算法。理解这些结果背后的物理意义和权衡对于工程选型至关重要。4.1 可达速率与NMSE对比可达速率如图2所示在低到中信噪比区间-20dB 到 0dB梯度法和两步SVD法的性能与全数字预编码几乎重叠说明TMA混合预编码在此区间能几乎无损失地逼近理想性能。交替优化法和迭代算法性能稍逊但差距很小。而纯模拟方案仅用 $\mathbf{P}_{RF}$性能最差因为它无法处理多流干扰。归一化均方误差图3展示了算法逼近全数字预编码 $\mathbf{P}_D$ 的精度。梯度法在低信噪比下NMSE最低逼近得最好这是因为低信噪比下 $\mathbf{P}_D$ 本身秩较低主要能量集中在主特征模上结构简单易于逼近。随着信噪比升高$\mathbf{P}_D$ 变得“满秩”和复杂梯度法的逼近误差增大而交替优化法的表现则相对更稳健。给工程师的启示如果你的目标应用场景是覆盖边缘或中低信噪比环境如毫米波非视距传输两步SVD或梯度法是性价比极高的选择它们能以较低的复杂度获得近乎最优的性能。4.2 开关效率与硬件损耗这是TMA方案相较于传统移相器方案必须仔细评估的关键点。TMA的损耗主要来自两方面谐波辐射损耗开关动作产生的谐波能量不携带有用信息是纯粹的功率浪费。效率 $\eta_{TMA}$ 定义为基波功率与总辐射功率基波所有谐波之比。开关“关断”态插入损耗即使开关处于“关”态其对信号也有一定的衰减非理想隔离。效率 $\eta_{OFF}$ 反映了这部分损耗。图5和图6分别展示了这两种效率。算法影响梯度法产生的 $\mathbf{P}{RF}$ 矩阵元素分布往往更均匀绝对值较小这导致开关的占空比$\xi{n,m}$较低从而产生更强的谐波和更低的 $\eta_{TMA}$约3-4 dB损耗。而交替优化和两步SVD法产生的 $\mathbf{P}_{RF}$ 往往有更多接近±1的元素开关效率更高损耗3 dB。“去相关”策略的威力图5中“Iterative NLD”曲线展示了论文第V-C节提出的一个妙招如果发现 $\mathbf{P}{RF}$ 中某两列高度相关内积很大说明它们试图在空间上形成非常相似的波束。此时可以简单地丢弃其中一列在基带通过 $\mathbf{P}{BB}$ 置零该流并将对应的模拟波束形成向量设为全1向量即所有天线单元常开。这显著提升了低信噪比下的开关效率因为此时系统本就只依赖少数强主径合并相似波束不会损失性能却大幅减少了开关动作和损耗。4.3 波束方向图与空间分辨率图7直观地展示了一个重要现象纯TMA模拟波束的对称性限制。由于 $\mathbf{P}_{RF}$ 是实矩阵其产生的阵列因子是偶函数导致波束方向图关于阵列法线对称。这意味着它无法区分来自θ和-θ方向的信号。这在多用户或需要抑制干扰的场景中是致命的。混合预编码如何破解数字预编码器 $\mathbf{P}{BB}$ 是复矩阵它可以对各个射频链路上的信号进行复数加权。通过 $\mathbf{P}{BB}$ 的联合处理系统可以合成非对称的复合波束方向图。如图7所示迭代算法和梯度法生成的混合波束能够很好地逼近全数字预编码的非对称波束从而获得空间分辨能力。4.4 复杂度与收敛速度图4清晰地比较了各算法的迭代次数。两步SVD计算速度最快因为它本质上就是两次矩阵分解没有迭代过程。迭代算法收敛速度也很快通常在10-20次迭代内收敛。交替优化与梯度法收敛所需迭代次数较多尤其在高信噪比时。梯度法每一步的计算量虽然可能比AO低无需解SVD但迭代步数增长更快。选型建议追求极致性能可接受较高复杂度选择迭代干扰抑制算法。平衡性能与复杂度交替优化法是一个稳健的选择。低信噪比场景或对复杂度极度敏感两步SVD法是首选。硬件实现简易性优先梯度法结合简单的截断投影在FPGA或ASIC上实现控制逻辑可能更简单。5. 与移相器方案的实战对比论文在VI-B小节进行了一个非常宝贵的对比分析将TMA方案与基于可变移相器的传统方案在几个实际维度上进行了较量。我们将其转化为工程师更关心的对比表格对比维度基于VPS的传统方案基于TMA的本方案TMA方案优势分析核心器件多比特移相器 (如4-bit, 5-bit)单比特移相器 射频开关开关和1-bit PS成本远低于多-bit PS。1-bit PS本质上是0/180度选择器结构简单。插入损耗较高。移相器本身有数dB的插入损耗且与位数、频率正相关。可能更低。开关在导通态损耗很低1 dB1-bit PS损耗也低于多-bit PS。整体链路损耗可能占优。功耗较高。移相器尤其是有源或MEMS需要偏置电压/电流。通常更低。开关如PIN二极管在静态时功耗极低动态切换功耗也小。芯片面积较小。现代CMOS或GaAs移相器集成度高。可能稍大。需要集成开关和1-bit PS但开关面积很小。在毫米波频段总体面积差异可控。设计灵活性固定。一旦PS位数确定相位分辨率固定。性能受限于量化误差。灵活调。通过调整开关时序可以在效率和性能之间动态权衡如“去相关”策略。这是TMA的独特优势。算法复杂度高。优化时需要将解投影到单位圆约束操作复杂。较低。优化约束为简单实数区间投影操作简化为截断收敛更快。适用场景高性能、对成本不敏感的场景。成本敏感、能效要求高、中低SNR为主的场景如毫米波固定无线接入、微基站。结论TMA混合预编码并非要在所有指标上打败传统方案而是提供了一个有吸引力的“性价比”和“能效比”选项。在毫米波系统中功耗和成本是巨大挑战TMA方案在这两方面展现出显著潜力同时其性能在典型操作区间中低SNR足以满足需求。它特别适合那些信道变化相对缓慢或者对设备成本和功耗有严格限制的大规模天线部署场景。6. 实现考量与未来展望6.1 实际系统集成要点开关速度与同步TMA要求所有天线单元的开关精确同步开关频率 $f_p$ 需远高于信号带宽以避免混叠但又不能太高以致开关器件无法响应。这需要精密的时钟分布网络。谐波滤波TMA产生的谐波可能会干扰其他频段。必须在天线前端或功放后加入带通滤波器抑制谐波辐射这增加了额外的硬件和插入损耗。校准和任何有源天线阵列一样TMA需要校准来补偿各通道间幅度和相位的不一致性。由于TMA的“相位”由时延产生对时序误差极其敏感因此需要高精度的时延校准电路。宽带适应性本文主要讨论窄带系统。在宽带OFDM系统中TMA的时延特性会导致频率相关的波束倾斜beam squinting。需要研究更复杂的时序控制律或结合真时延线来补偿。6.2 未来研究方向论文在结论中也指出了几个富有潜力的方向非矩形脉冲波形探索更复杂的周期性开关函数如正弦加权、切比雪夫脉冲可能带来更好的谐波抑制或更灵活的波束控制。谐波模式的利用目前视谐波为损耗。但能否“变废为宝”利用特定谐波频率上的波束进行辅助通信或感知扩展至多用户和宽带场景这是走向实际应用的必经之路。研究如何设计TMA混合预编码以同时服务多个用户以及如何在频率选择性信道中工作。与新兴硬件结合如可重构智能表面其单元本质也是一个二态反射器件TMA的控制思想或许可以与之结合。个人体会从事毫米波系统设计就像在走钢丝永远在性能、功耗、成本和复杂度之间寻找平衡。TMA混合预编码这条技术路径其魅力在于它用“时间”换“空间”用“数字智能”补偿“模拟简化”。它可能不是那个理论上最优的“银弹”但它提供了一个极其务实且富有工程美学的解决方案。在实验室里我们追求极致的频谱效率但在产品化路上每节省一毫瓦功耗、一美分成本都意义重大。TMA方案正是这种工程思维的体现它提醒我们有时候回归基本原理用更巧妙的系统级设计去化解硬件级的限制往往能开辟出一条新的康庄大道。
毫米波MIMO混合预编码:时间调制阵列技术原理与算法实现
1. 项目概述当毫米波MIMO遇见时间调制阵列在5G及未来6G的演进道路上毫米波通信因其巨大的可用带宽被视为实现超高速率数据传输的关键。然而毫米波信号在传播中面临严重的路径损耗和有限的散射环境这使得传统的全数字大规模MIMO架构变得不切实际——为成百上千根天线中的每一根都配备一条独立的射频链路和高速数据转换器其功耗和成本将是天文数字。于是混合预编码技术应运而生它像一位精明的“资源调配师”在数字域的灵活性与模拟域的硬件限制之间寻找最优解。混合预编码的核心思想是“分层处理”在基带使用低维的数字预编码器进行精确但复杂度可控的信号处理如用户间干扰消除、功率分配而在射频前端则使用高维的模拟预编码器通常由移相器网络构成进行宽带的波束成形将能量聚焦到特定方向。这大幅减少了所需的昂贵射频链路数量。然而传统的模拟预编码器依赖于高精度移相器在毫米波频段这些移相器不仅插入损耗大、成本高昂而且功耗可观。正是在这个背景下时间调制阵列进入了我们的视野。TMA是一种通过高速开关周期性控制天线单元通断从而在时域上调制信号的技术。它本质上是一个“时空调制器”其神奇之处在于通过精心设计每个天线单元的开关时序可以在空间域产生可控的波束并且能在谐波频率上生成额外的波束模式。将TMA应用于混合预编码的模拟部分用低成本、低功耗的开关替代复杂的移相器是一个极具吸引力的想法。这不仅仅是硬件的简单替换更带来了一系列新的设计挑战和机遇如何用只有“开”和“关”两种状态的开关去逼近甚至实现传统移相器所能提供的连续相位调整如何在追求高数据速率的同时管理因开关谐波辐射带来的频谱再生和功率损耗这正是本文要深入探讨的“基于时间调制阵列的混合预编码技术”。2. 核心原理TMA混合预编码的数学与物理基础要理解TMA如何工作我们需要从两个层面入手一是其作为天线阵列的物理波束形成机制二是其作为预编码器在通信系统模型中的数学表达。2.1 时间调制阵列的工作原理想象一个由多个天线单元组成的阵列。在传统相控阵中我们通过给每个天线单元施加不同的静态相位偏移由移相器实现来控制波束方向。而在TMA中我们给每个天线单元连接一个高速射频开关。这个开关以一个公共的射频载波频率为基准按照一个特定的、周期性的时序函数通常是矩形脉冲进行“打开”和“关闭”。关键在于这个时序函数。对于第n个天线单元其开关函数 $g_n(t)$ 是一个周期为 $T_p$ 的周期函数。在一个周期内它只在 $\tau_n$ 到 $\tau_n \delta_n$ 的时间窗内为“1”导通其余时间为“0”关断。这里$\tau_n$ 是脉冲的起始时间$\delta_n$ 是脉冲宽度。根据傅里叶分析任何周期函数都可以分解为一系列谐波的叠加。因此第n个天线单元辐射的信号可以表示为 $$ s_n(t) g_n(t) e^{j2\pi f_c t} \sum_{q-\infty}^{\infty} a_{n,q} e^{j2\pi (f_c q f_p) t} $$ 其中$f_c$ 是载波频率$f_p 1/T_p$ 是开关频率$a_{n,q}$ 是第q次谐波的复权重系数它由开关函数 $g_n(t)$ 的傅里叶系数决定$a_{n,q} \frac{\delta_n}{T_p} \text{sinc}(q\pi \frac{\delta_n}{T_p}) e^{-j2\pi q \frac{\tau_n}{T_p}}$。这个公式揭示了TMA的核心魔法基波q0波束其权重 $a_{n,0} \delta_n / T_p$。通过控制不同天线单元的脉冲宽度 $\delta_n$我们可以实现振幅加权通过控制脉冲起始时间 $\tau_n$我们可以实现等效的相位偏移。因为 $e^{-j2\pi q \tau_n / T_p}$ 项在 q0 时恒为1所以基波波束的相位是均匀的但振幅可变。这意味着TMA在基波上只能实现实数权重的波束形成。谐波q≠0波束在频率 $f_c ± q f_p$ 处会产生额外的波束。这些谐波波束的权重同时受 $\delta_n$ 和 $\tau_n$ 调制因此可以同时控制振幅和相位。但谐波能量通常是需要抑制的“频谱再生”是功率损耗的主要来源之一。因此在混合预编码架构中我们主要利用TMA的基波模式q0来构建模拟预编码矩阵 $\mathbf{P}{RF}$。这个矩阵的每个元素 $[\mathbf{P}{RF}]_{n,m}$ 对应第m条射频链驱动第n个天线单元的等效权重。由于它源于脉冲宽度调制其值被约束在实数范围 $[-1, 1]$ 内这比传统移相器的复数单位圆约束更简单但也带来了新的限制。2.2 系统模型与问题 formulation考虑一个点对点的毫米波MIMO系统发射端有 $N_T$ 根天线和 $L_{BS}$ 条射频链路接收端有 $N_R$ 根天线。系统发送 $N_s$ 个数据流$N_s \leq L_{BS} \ll N_T$。发射信号可以建模为$\mathbf{x} \mathbf{P}{RF} \mathbf{P}{BB} \mathbf{s}$。其中$\mathbf{s}$ 是 $N_s \times 1$ 的符号向量$\mathbf{P}{BB}$ 是 $L{BS} \times N_s$ 的数字基带预编码矩阵可进行复数域任意操作$\mathbf{P}{RF}$ 是 $N_T \times L{BS}$ 的TMA模拟预编码矩阵元素为实数且受限于 $[-1, 1]$。接收信号为$\mathbf{y} \mathbf{H} \mathbf{P}{RF} \mathbf{P}{BB} \mathbf{s} \mathbf{n}$。其中$\mathbf{H}$ 是 $N_R \times N_T$ 的毫米波信道矩阵通常采用基于几何的稀疏信道模型由有限个散射路径构成$\mathbf{n}$ 是复高斯白噪声。我们的设计目标是最大化系统的可达速率互信息 $$ \max_{\mathbf{P}{RF}, \mathbf{P}{BB}} \log_2 \det \left( \mathbf{I} \frac{1}{N_s N_0} \mathbf{H} \mathbf{P}{RF} \mathbf{P}{BB} \mathbf{P}{BB}^H \mathbf{P}{RF}^T \mathbf{H}^H \right) $$ 同时满足总发射功率约束 $|\mathbf{P}{RF} \mathbf{P}{BB}|F^2 \leq P{TX}$以及TMA硬件约束 $[\mathbf{P}{RF}]{n,m} \in [-1, 1]$。这里出现了一个根本性挑战如何用实数且受限的 $\mathbf{P}_{RF}$ 去逼近一个最优的全数字预编码器 $\mathbf{P}_D$一个复数矩阵论文中给出了一个关键的分解洞察对于一个任意的复数矩阵 $\mathbf{P}D$我们可以通过两条射频链路来合成一个复数数据流。具体分解如原文公式(26)所示将 $\mathbf{P}D$ 的实部和虚部分别用两个实数向量来承载再通过基带的一个固定变换 $(\text{diag}(\beta_1, ..., \beta{N_s}) \otimes [1, j]^T)$ 重新组合为复数信号。这在理论上证明最多需要 $L{BS} 2N_s$ 条射频链路即可完美拟合任何全数字预编码器。但在实际系统中为了降低成本我们通常设置 $L_{BS} N_s$这就需要设计更聪明的算法在性能上做出权衡。注意这里有一个非常重要的实操细节。在硬件实现时TMA的每个权重 $[\mathbf{P}{RF}]{n,m}$ 对应一个具体的脉冲宽度 $\delta_{n,m}$ 和时延 $\tau_{n,m}$。映射关系为 $[\mathbf{P}{RF}]{n,m} \xi_{n,m} \delta_{n,m} / T_p$对于基波。因此算法输出的 $\mathbf{P}_{RF}$ 矩阵必须经过一个“量化”步骤将 $[-1, 1]$ 内的连续实数映射到 $[0, 1]$ 内的脉冲占空比。负值通常通过一个额外的180度固定移相器或差分驱动来实现。3. 算法设计从交替优化到联合设计面对上述非凸的联合优化问题研究者们提出了多算法。这些算法的核心思想都是在性能、复杂度和硬件约束之间寻找可行的路径。下面我们深入剖析几种主流的TMA混合预编码设计方法。3.1 交替优化法这是一种非常直观且常用的思路。既然联合优化 $\mathbf{P}{RF}$ 和 $\mathbf{P}{BB}$ 很困难那就采用“分而治之”的策略固定一个优化另一个如此交替迭代直至收敛。步骤拆解初始化首先需要一个初始点。可以随机初始化 $\mathbf{P}_{RF}$或者使用信道主成分等启发式方法初始化。固定模拟优化数字假设 $\mathbf{P}{RF}$ 已知优化问题简化为寻找一个 $\mathbf{P}{BB}$使得混合预编码 $\mathbf{P}{RF}\mathbf{P}{BB}$ 尽可能接近最优全数字预编码 $\mathbf{P}D$同时满足功率约束。这本质上是一个最小二乘问题其解析解可以通过正交Procrustes问题求得。具体而言最优的 $\mathbf{P}{BB}$ 为 $\mathbf{V}\mathbf{U}^H$其中 $\mathbf{P}D^T \mathbf{P}{RF} \mathbf{U}\mathbf{\Sigma}\mathbf{V}^H$ 是奇异值分解。这个解保证了 $\mathbf{P}_{BB}$ 是一个酉矩阵或具有正交列这有助于简化功率分配。固定数字优化模拟在 $\mathbf{P}{BB}$ 已知的情况下优化 $\mathbf{P}{RF}$ 的问题变为一个在实数域、且有范数约束的线性规划问题。论文中给出了闭式解公式31其形式是 $\mathbf{P}D \mathbf{P}{BB}^H$ 及其共轭转置的线性组合的归一化。这个解能保证功率约束以等式满足即用尽所有发射功率。迭代与收敛重复步骤2和3。由于每一步更新都在给定条件下是最优的目标函数混合预编码与全数字预编码的Frobenius范数距离在每次迭代后都不会增加因此算法保证收敛到一个局部最优解。实操心得与陷阱收敛速度AO算法通常收敛平稳但速度取决于初始值。在低信噪比或信道稀疏性高时收敛较快。局部最优这是交替优化的通病。算法可能陷入一个离全局最优很远的局部解。实践中可以采用多次随机初始化选择性能最好的结果。标量因子注意在步骤3得到的 $\mathbf{P}{RF}$ 解是满足总功率约束的。但在步骤2中我们求解 $\mathbf{P}{BB}$ 时并未考虑TMA的 $[-1, 1]$ 约束。因此在算法最后或每次迭代后需要对 $\mathbf{P}{RF}$ 进行缩放确保其所有元素落在 $[-1, 1]$ 区间内。这个缩放操作会影响最终功率可能需要重新调整 $\mathbf{P}{BB}$ 以保证总功率不变这是一个细微但关键的实现环节。3.2 梯度投影法梯度法直接瞄准原始优化问题公式32试图通过梯度下降来最小化 $|\mathbf{P}D - \mathbf{P}{RF}\mathbf{P}{BB}|F^2$。其巧妙之处在于它将 $\mathbf{P}{BB}$ 表示为 $\mathbf{P}{RF}$ 的函数通过最小二乘解从而将联合优化问题降维为一个仅关于 $\mathbf{P}_{RF}$ 的优化问题。核心步骤变量消元对于给定的 $\mathbf{P}{RF}$满足功率约束的最优 $\mathbf{P}{BB}$ 有闭式解公式33。将其代入目标函数距离度量 $d$ 可以简化为只关于 $\mathbf{P}_{RF}$ 的表达式公式34。梯度计算与下降计算距离度量 $d$ 关于实矩阵 $\mathbf{P}{RF}$ 的梯度 $\partial d / \partial \mathbf{P}{RF}$公式35。这个梯度表达式虽然复杂但可以解析求得。然后进行梯度下降更新$\mathbf{P}{RF}^{(k1)} \mathbf{P}{RF}^{(k)} - \mu \cdot \partial d / \partial \mathbf{P}_{RF}$其中 $\mu$ 是步长。与传统VPS方案的对比优势对于传统的可变移相器方案梯度更新后还需要将 $\mathbf{P}{RF}$ 投影到单位模值约束的可行集上这是一个非线性操作增加了计算量。而TMA的约束是简单的实数区间 $[-1, 1]$不需要复杂的投影操作。更新后的 $\mathbf{P}{RF}$ 如果越界只需进行简单的截断clipping即可$[\mathbf{P}{RF}]{n,m} \max(-1, \min(1, [\mathbf{P}{RF}]{n,m}))$。这大大简化了计算是TMA在算法实现上的一个显著优势。注意事项步长选择梯度法的性能严重依赖于步长 $\mu$。步长太大会震荡甚至发散步长太小则收敛缓慢。可以采用自适应步长策略如Armijo线搜索。收敛性能如图4所示梯度法在低信噪比时迭代次数少性能好。但在高信噪比时由于需要逼近更复杂的全数字预编码迭代次数会急剧增加。这是因为高信噪比下信道矩阵的有效秩增加需要更精细的波束形成优化问题变得更复杂。3.3 解耦设计与两步SVD法前两种方法都试图直接逼近全数字预编码器。而解耦设计则采用了不同的哲学先设计模拟预编码器 $\mathbf{P}{RF}$ 来捕获信道的主要空间特征即获取大的阵列增益再设计数字预编码器 $\mathbf{P}{BB}$ 来处理剩余的干扰如流间干扰并进行注水功率分配。算法流程模拟预编码器设计第一步假设数字预编码器满足 $\mathbf{P}{BB}\mathbf{P}{BB}^H \gamma \mathbf{I}$即各数据流在数字预编码后是功率均衡且正交的。这个假设简化了问题将互信息表达式中的 $\mathbf{P}_{BB}$ 分离出去。优化问题简化为最大化 $\log_2 \det(\mathbf{I} \frac{\gamma}{N_0 N_s} \mathbf{H} \mathbf{P}{RF} \mathbf{P}{RF}^T \mathbf{H}^H)$。这仍然复杂但论文提出了一种基于信道实部 Gram 矩阵 $\mathbf{G}_{\Re} \Re{\mathbf{H}^H\mathbf{H}}$ 的启发式方法。核心操作取 $\mathbf{G}{\Re}$ 的前 $L{BS}$ 个最大特征值对应的特征向量构成 $\mathbf{P}{RF}$。即 $\mathbf{P}{RF} [\mathbf{U}{\Re}]{:,1:L_{BS}}$。为什么是实部因为 $\mathbf{P}_{RF}$ 是实矩阵它只能影响信道矩阵的实部投影。这个选择旨在最大化信号在实部子空间上的能量。数字预编码器设计第二步基于第一步得到的 $\mathbf{P}{RF}$构造一个等效的降维信道 $\mathbf{H}{eff} \mathbf{H} \mathbf{P}{RF} (\mathbf{P}{RF}^T \mathbf{P}_{RF})^{-1/2}$。这个操作相当于将高维天线空间映射到低维的射频链路上。此时数字预编码器的设计问题转化为一个标准的 MIMO 预编码问题在等效信道 $\mathbf{H}{eff}$ 上设计 $\mathbf{\bar{P}}{BB}$ 以最大化互信息。这可以通过对 $\mathbf{H}_{eff}$ 进行 SVD 分解并采用注水功率分配算法来求解。最终的数字预编码器为 $\mathbf{P}{BB} (\mathbf{P}{RF}^T \mathbf{P}{RF})^{-1/2} \mathbf{\bar{P}}{BB}$。为什么叫“两步SVD”第一步是对信道实部矩阵做特征分解SVD的特例第二步是对等效信道做SVD。这种方法计算复杂度低因为两个SVD操作都是在维度大幅降低的矩阵上进行的$N_T \times N_T$ 的实对称矩阵和 $N_R \times L_{BS}$ 的复矩阵。性能特点低信噪比友好在低信噪比下系统是噪声受限的主要目标是获取大的波束成形增益。两步SVD法设计的 $\mathbf{P}_{RF}$ 能很好地捕获信道主成分性能接近全数字预编码。高信噪比瓶颈在高信噪比下系统是干扰受限的。由于 $\mathbf{P}{RF}$ 仅基于实部设计它无法完全对角化整个复信道矩阵残留的流间干扰会限制性能提升。此时数字预编码器 $\mathbf{P}{BB}$ 的干扰消除能力变得至关重要。3.4 迭代干扰抑制算法为了克服两步SVD法在高信噪比下的缺陷论文进一步提出了一种迭代算法。其核心思想是在模拟预编码器设计阶段就主动考虑并抑制流间干扰。算法思路逐列更新不像两步SVD法一次性计算整个 $\mathbf{P}{RF}$迭代算法每次只优化 $\mathbf{P}{RF}$ 中的一列对应一条数据流的模拟波束成形向量同时固定其他列。干扰感知当优化第m列 $\mathbf{p}_{RF,m}$ 时算法会从目标函数中“减去”其他数据流第 $\bar{m}$ 列已产生的干扰。这体现在公式(40)中定义的矩阵 $\mathbf{G}_m$ 上它包含了除去第m流后其他流造成的有效信道和干扰。特征向量求解在给定干扰背景下最大化第m流信干噪比的问题公式41其最优解是矩阵 $\Re{\mathbf{G}_m}$即 $\mathbf{G}_m$ 的实部的主特征向量。这是一个实向量完美符合TMA的约束。循环迭代依次更新 $\mathbf{P}{RF}$ 的每一列循环多次直至收敛。然后再基于最终的 $\mathbf{P}{RF}$像两步SVD法一样设计数字预编码器 $\mathbf{P}_{BB}$。优势与代价优势通过迭代干扰抑制该方法在中高信噪比下能获得比两步SVD更好的性能更接近全数字预编码。代价计算复杂度显著高于两步SVD。每次迭代都需要计算多个矩阵的逆和特征值分解尽管维度不高$L_{BS} \times L_{BS}$但迭代次数可能较多。重要提示在实际仿真或实现中这些算法输出的 $\mathbf{P}{RF}$ 需要经过后处理。除了之前提到的缩放至 $[-1, 1]$ 区间论文第V-C节还提出了一种提升开关效率的缩放策略。通过引入一个对角缩放矩阵 $\mathbf{\Psi}$在保持可达速率不变的前提下可以调整 $\mathbf{P}{RF}$ 各列的幅度从而最小化谐波辐射功率即开关损耗。这是一个针对TMA特有的、非常实用的优化步骤。4. 性能深度剖析效率、复杂度与权衡论文通过大量的数值仿真对比了上述各种算法。理解这些结果背后的物理意义和权衡对于工程选型至关重要。4.1 可达速率与NMSE对比可达速率如图2所示在低到中信噪比区间-20dB 到 0dB梯度法和两步SVD法的性能与全数字预编码几乎重叠说明TMA混合预编码在此区间能几乎无损失地逼近理想性能。交替优化法和迭代算法性能稍逊但差距很小。而纯模拟方案仅用 $\mathbf{P}_{RF}$性能最差因为它无法处理多流干扰。归一化均方误差图3展示了算法逼近全数字预编码 $\mathbf{P}_D$ 的精度。梯度法在低信噪比下NMSE最低逼近得最好这是因为低信噪比下 $\mathbf{P}_D$ 本身秩较低主要能量集中在主特征模上结构简单易于逼近。随着信噪比升高$\mathbf{P}_D$ 变得“满秩”和复杂梯度法的逼近误差增大而交替优化法的表现则相对更稳健。给工程师的启示如果你的目标应用场景是覆盖边缘或中低信噪比环境如毫米波非视距传输两步SVD或梯度法是性价比极高的选择它们能以较低的复杂度获得近乎最优的性能。4.2 开关效率与硬件损耗这是TMA方案相较于传统移相器方案必须仔细评估的关键点。TMA的损耗主要来自两方面谐波辐射损耗开关动作产生的谐波能量不携带有用信息是纯粹的功率浪费。效率 $\eta_{TMA}$ 定义为基波功率与总辐射功率基波所有谐波之比。开关“关断”态插入损耗即使开关处于“关”态其对信号也有一定的衰减非理想隔离。效率 $\eta_{OFF}$ 反映了这部分损耗。图5和图6分别展示了这两种效率。算法影响梯度法产生的 $\mathbf{P}{RF}$ 矩阵元素分布往往更均匀绝对值较小这导致开关的占空比$\xi{n,m}$较低从而产生更强的谐波和更低的 $\eta_{TMA}$约3-4 dB损耗。而交替优化和两步SVD法产生的 $\mathbf{P}_{RF}$ 往往有更多接近±1的元素开关效率更高损耗3 dB。“去相关”策略的威力图5中“Iterative NLD”曲线展示了论文第V-C节提出的一个妙招如果发现 $\mathbf{P}{RF}$ 中某两列高度相关内积很大说明它们试图在空间上形成非常相似的波束。此时可以简单地丢弃其中一列在基带通过 $\mathbf{P}{BB}$ 置零该流并将对应的模拟波束形成向量设为全1向量即所有天线单元常开。这显著提升了低信噪比下的开关效率因为此时系统本就只依赖少数强主径合并相似波束不会损失性能却大幅减少了开关动作和损耗。4.3 波束方向图与空间分辨率图7直观地展示了一个重要现象纯TMA模拟波束的对称性限制。由于 $\mathbf{P}_{RF}$ 是实矩阵其产生的阵列因子是偶函数导致波束方向图关于阵列法线对称。这意味着它无法区分来自θ和-θ方向的信号。这在多用户或需要抑制干扰的场景中是致命的。混合预编码如何破解数字预编码器 $\mathbf{P}{BB}$ 是复矩阵它可以对各个射频链路上的信号进行复数加权。通过 $\mathbf{P}{BB}$ 的联合处理系统可以合成非对称的复合波束方向图。如图7所示迭代算法和梯度法生成的混合波束能够很好地逼近全数字预编码的非对称波束从而获得空间分辨能力。4.4 复杂度与收敛速度图4清晰地比较了各算法的迭代次数。两步SVD计算速度最快因为它本质上就是两次矩阵分解没有迭代过程。迭代算法收敛速度也很快通常在10-20次迭代内收敛。交替优化与梯度法收敛所需迭代次数较多尤其在高信噪比时。梯度法每一步的计算量虽然可能比AO低无需解SVD但迭代步数增长更快。选型建议追求极致性能可接受较高复杂度选择迭代干扰抑制算法。平衡性能与复杂度交替优化法是一个稳健的选择。低信噪比场景或对复杂度极度敏感两步SVD法是首选。硬件实现简易性优先梯度法结合简单的截断投影在FPGA或ASIC上实现控制逻辑可能更简单。5. 与移相器方案的实战对比论文在VI-B小节进行了一个非常宝贵的对比分析将TMA方案与基于可变移相器的传统方案在几个实际维度上进行了较量。我们将其转化为工程师更关心的对比表格对比维度基于VPS的传统方案基于TMA的本方案TMA方案优势分析核心器件多比特移相器 (如4-bit, 5-bit)单比特移相器 射频开关开关和1-bit PS成本远低于多-bit PS。1-bit PS本质上是0/180度选择器结构简单。插入损耗较高。移相器本身有数dB的插入损耗且与位数、频率正相关。可能更低。开关在导通态损耗很低1 dB1-bit PS损耗也低于多-bit PS。整体链路损耗可能占优。功耗较高。移相器尤其是有源或MEMS需要偏置电压/电流。通常更低。开关如PIN二极管在静态时功耗极低动态切换功耗也小。芯片面积较小。现代CMOS或GaAs移相器集成度高。可能稍大。需要集成开关和1-bit PS但开关面积很小。在毫米波频段总体面积差异可控。设计灵活性固定。一旦PS位数确定相位分辨率固定。性能受限于量化误差。灵活调。通过调整开关时序可以在效率和性能之间动态权衡如“去相关”策略。这是TMA的独特优势。算法复杂度高。优化时需要将解投影到单位圆约束操作复杂。较低。优化约束为简单实数区间投影操作简化为截断收敛更快。适用场景高性能、对成本不敏感的场景。成本敏感、能效要求高、中低SNR为主的场景如毫米波固定无线接入、微基站。结论TMA混合预编码并非要在所有指标上打败传统方案而是提供了一个有吸引力的“性价比”和“能效比”选项。在毫米波系统中功耗和成本是巨大挑战TMA方案在这两方面展现出显著潜力同时其性能在典型操作区间中低SNR足以满足需求。它特别适合那些信道变化相对缓慢或者对设备成本和功耗有严格限制的大规模天线部署场景。6. 实现考量与未来展望6.1 实际系统集成要点开关速度与同步TMA要求所有天线单元的开关精确同步开关频率 $f_p$ 需远高于信号带宽以避免混叠但又不能太高以致开关器件无法响应。这需要精密的时钟分布网络。谐波滤波TMA产生的谐波可能会干扰其他频段。必须在天线前端或功放后加入带通滤波器抑制谐波辐射这增加了额外的硬件和插入损耗。校准和任何有源天线阵列一样TMA需要校准来补偿各通道间幅度和相位的不一致性。由于TMA的“相位”由时延产生对时序误差极其敏感因此需要高精度的时延校准电路。宽带适应性本文主要讨论窄带系统。在宽带OFDM系统中TMA的时延特性会导致频率相关的波束倾斜beam squinting。需要研究更复杂的时序控制律或结合真时延线来补偿。6.2 未来研究方向论文在结论中也指出了几个富有潜力的方向非矩形脉冲波形探索更复杂的周期性开关函数如正弦加权、切比雪夫脉冲可能带来更好的谐波抑制或更灵活的波束控制。谐波模式的利用目前视谐波为损耗。但能否“变废为宝”利用特定谐波频率上的波束进行辅助通信或感知扩展至多用户和宽带场景这是走向实际应用的必经之路。研究如何设计TMA混合预编码以同时服务多个用户以及如何在频率选择性信道中工作。与新兴硬件结合如可重构智能表面其单元本质也是一个二态反射器件TMA的控制思想或许可以与之结合。个人体会从事毫米波系统设计就像在走钢丝永远在性能、功耗、成本和复杂度之间寻找平衡。TMA混合预编码这条技术路径其魅力在于它用“时间”换“空间”用“数字智能”补偿“模拟简化”。它可能不是那个理论上最优的“银弹”但它提供了一个极其务实且富有工程美学的解决方案。在实验室里我们追求极致的频谱效率但在产品化路上每节省一毫瓦功耗、一美分成本都意义重大。TMA方案正是这种工程思维的体现它提醒我们有时候回归基本原理用更巧妙的系统级设计去化解硬件级的限制往往能开辟出一条新的康庄大道。