摘要有效的抗肿瘤T细胞应答依赖新抗原的质量非自我性与数量丰度但现有新抗原筛选方法普遍忽略肽丰度且丰度难以直接定量解析。为解决该问题本研究开发epiVIP深度学习框架仅需通用单细胞RNA-seq数据即可精准预测单个HLA-I肽的丰度。模型基于170万条免疫肽-基因表达谱配对数据训练在未见样本中展现强泛化性。通过分析临床数据集的33,711个新抗原本研究首次揭示丰度与非自我性在决定抗原性时存在补偿效应为TCR亲和力理论提供定量证据。重要的是在多个新抗原疫苗队列与免疫检查点阻断ICB队列中丰度可独立预测肿瘤反应性与患者生存。对epiVIP的机制解析进一步鉴定出PSME4对MAGEA3表位呈递的定向调控作用并通过T细胞功能实验完成验证。上述结果证实人工智能驱动的虚拟免疫肽组学是优化肿瘤免疫治疗的关键策略。lib3chop.edu#人工智能 #虚拟免疫肽组学 #新抗原 #HLA #肽MHC丰度 #免疫原性 #肿瘤免疫治疗 #PSME4结果大规模标准化pMHC丰度定量图1大规模免疫肽组学实现pMHC丰度定量建模a 13种甲型流感表位的无标记定量LFQ强度与靶向质谱绝对定量的对比。b 队列整合与数据划分策略示意图标注训练集、验证集、测试集的样本量与鉴定pMHC数量。c 365个样本中pMHC丰度与来源基因表达量TPM、NetMHCpan预测结合力的样本内斯皮尔曼相关性。d–e 表达HLA-A02:01d、HLA-B07:02e的HLA-I低表达C1R细胞中氨基酸位点对转换后pMHC丰度的影响。f 同一体系中氨基酸位点对pMHC热稳定性Tm的影响。g 同一体系中氨基酸位点对NetMHCpan预测结合力的影响。h 纳入epiVIP转录组输入的抗原加工与呈递调控基因集。i 39个肺癌样本中校正来源基因表达后重复肽丰度与蛋白酶体基因表达的偏皮尔逊相关系数标注肽C端氨基酸类型。基于人工智能的样本内pMHC丰度排序图2epiVIP精准实现样本内pMHC丰度排序a epiVIP模型架构整合肽序列、HLA序列、来源基因表达、调控基因表达输出丰度排序分数。b 模型训练策略采用样本内配对排序损失函数优化。c 3种测试场景下未见样本中肽对丰度排序的配对AUC按z标准化丰度差异分层对比方法包括弹性网络基线、NetMHCpan、来源基因表达。d 独立MDA-MB-231乳腺癌细胞系DDA多重检测中所有未见pMHC的预测丰度与实测丰度对比对比方法包括弹性网络基线、NetMHCpan、来源基因表达。丰度与自我区分度对新抗原免疫原性的补偿效应图3丰度与自我区分度对新抗原免疫原性的补偿效应a 丰度与10种表位特征的交互作用检验自我区分度与丰度呈持续负向交互。b 低自我区分度LD、高自我区分度HD新抗原中丰度与免疫原性的关联差异。c NCI、TESLA、Alban临床队列中免疫原性新抗原在丰度-自我区分度2维空间的富集分布。d 肾癌新抗原疫苗队列中不同方法筛选Top-k表位的免疫原性富集效率。e 预测丰度、NetMHCpan结合力、mRNA表达与肿瘤反应性的相关性对比。克隆新抗原丰度预测ICB治疗响应图4克隆新抗原丰度预测ICB治疗响应与患者生存a Liu、SU2C、Riaz三个ICB队列中治疗应答者与无应答者的LD/HD克隆新抗原丰度分布。b T10CA、LD-T10CA、HD-T10CA与患者总生存的关联强度。c 不同ICB队列中LD-T10CA高低分组的Kaplan-Meier生存曲线。epiVIP解析PSME4对抗原呈递的调控效应图5epiVIP解析PSME4对抗原呈递的调控效应a A549细胞中PSME4敲低后不同C端氨基酸肽的丰度预测变化与实测变化对比。b HCT116细胞中PSME4敲低对MAGEA3表位EVDPIGHLY丰度的预测结果。c PSME4敲低后MAGEA3特异性T细胞的IL-2分泌水平ELISA验证。d 携带K/R末端偏好性HLA与非偏好性HLA患者的TCR库tSNE降维分布。e PSME4高/低表达患者中K/R末端肽特异性TCR的富集差异。数据和代码处理后的训练与测试数据集存储于ZenodoDOI10.5281/zenodo.18611575epiVIP推理与训练的代码GitHub链接https://github.com/YuhaoTan2/epiVI详细总结思维导图epiVIP模型性能参考bioRxiv [Preprint]. 2026 May 8:2026.05.05.722287. doi: 10.64898/2026.05.05.722287AI-enabled virtual immunopeptidomics links quantitative neoantigen presentation to immunogenicity260508epiVIP.pdf注AI辅助创作如有错误欢迎指出。内容仅供参考不构成任何建议。
宾夕法尼亚大学:AI虚拟免疫肽组学
摘要有效的抗肿瘤T细胞应答依赖新抗原的质量非自我性与数量丰度但现有新抗原筛选方法普遍忽略肽丰度且丰度难以直接定量解析。为解决该问题本研究开发epiVIP深度学习框架仅需通用单细胞RNA-seq数据即可精准预测单个HLA-I肽的丰度。模型基于170万条免疫肽-基因表达谱配对数据训练在未见样本中展现强泛化性。通过分析临床数据集的33,711个新抗原本研究首次揭示丰度与非自我性在决定抗原性时存在补偿效应为TCR亲和力理论提供定量证据。重要的是在多个新抗原疫苗队列与免疫检查点阻断ICB队列中丰度可独立预测肿瘤反应性与患者生存。对epiVIP的机制解析进一步鉴定出PSME4对MAGEA3表位呈递的定向调控作用并通过T细胞功能实验完成验证。上述结果证实人工智能驱动的虚拟免疫肽组学是优化肿瘤免疫治疗的关键策略。lib3chop.edu#人工智能 #虚拟免疫肽组学 #新抗原 #HLA #肽MHC丰度 #免疫原性 #肿瘤免疫治疗 #PSME4结果大规模标准化pMHC丰度定量图1大规模免疫肽组学实现pMHC丰度定量建模a 13种甲型流感表位的无标记定量LFQ强度与靶向质谱绝对定量的对比。b 队列整合与数据划分策略示意图标注训练集、验证集、测试集的样本量与鉴定pMHC数量。c 365个样本中pMHC丰度与来源基因表达量TPM、NetMHCpan预测结合力的样本内斯皮尔曼相关性。d–e 表达HLA-A02:01d、HLA-B07:02e的HLA-I低表达C1R细胞中氨基酸位点对转换后pMHC丰度的影响。f 同一体系中氨基酸位点对pMHC热稳定性Tm的影响。g 同一体系中氨基酸位点对NetMHCpan预测结合力的影响。h 纳入epiVIP转录组输入的抗原加工与呈递调控基因集。i 39个肺癌样本中校正来源基因表达后重复肽丰度与蛋白酶体基因表达的偏皮尔逊相关系数标注肽C端氨基酸类型。基于人工智能的样本内pMHC丰度排序图2epiVIP精准实现样本内pMHC丰度排序a epiVIP模型架构整合肽序列、HLA序列、来源基因表达、调控基因表达输出丰度排序分数。b 模型训练策略采用样本内配对排序损失函数优化。c 3种测试场景下未见样本中肽对丰度排序的配对AUC按z标准化丰度差异分层对比方法包括弹性网络基线、NetMHCpan、来源基因表达。d 独立MDA-MB-231乳腺癌细胞系DDA多重检测中所有未见pMHC的预测丰度与实测丰度对比对比方法包括弹性网络基线、NetMHCpan、来源基因表达。丰度与自我区分度对新抗原免疫原性的补偿效应图3丰度与自我区分度对新抗原免疫原性的补偿效应a 丰度与10种表位特征的交互作用检验自我区分度与丰度呈持续负向交互。b 低自我区分度LD、高自我区分度HD新抗原中丰度与免疫原性的关联差异。c NCI、TESLA、Alban临床队列中免疫原性新抗原在丰度-自我区分度2维空间的富集分布。d 肾癌新抗原疫苗队列中不同方法筛选Top-k表位的免疫原性富集效率。e 预测丰度、NetMHCpan结合力、mRNA表达与肿瘤反应性的相关性对比。克隆新抗原丰度预测ICB治疗响应图4克隆新抗原丰度预测ICB治疗响应与患者生存a Liu、SU2C、Riaz三个ICB队列中治疗应答者与无应答者的LD/HD克隆新抗原丰度分布。b T10CA、LD-T10CA、HD-T10CA与患者总生存的关联强度。c 不同ICB队列中LD-T10CA高低分组的Kaplan-Meier生存曲线。epiVIP解析PSME4对抗原呈递的调控效应图5epiVIP解析PSME4对抗原呈递的调控效应a A549细胞中PSME4敲低后不同C端氨基酸肽的丰度预测变化与实测变化对比。b HCT116细胞中PSME4敲低对MAGEA3表位EVDPIGHLY丰度的预测结果。c PSME4敲低后MAGEA3特异性T细胞的IL-2分泌水平ELISA验证。d 携带K/R末端偏好性HLA与非偏好性HLA患者的TCR库tSNE降维分布。e PSME4高/低表达患者中K/R末端肽特异性TCR的富集差异。数据和代码处理后的训练与测试数据集存储于ZenodoDOI10.5281/zenodo.18611575epiVIP推理与训练的代码GitHub链接https://github.com/YuhaoTan2/epiVI详细总结思维导图epiVIP模型性能参考bioRxiv [Preprint]. 2026 May 8:2026.05.05.722287. doi: 10.64898/2026.05.05.722287AI-enabled virtual immunopeptidomics links quantitative neoantigen presentation to immunogenicity260508epiVIP.pdf注AI辅助创作如有错误欢迎指出。内容仅供参考不构成任何建议。