设计一种能精准识别特定pMHC-I复合物的“分子巡警”极其困难,其挑战堪比在一座巨大的图书馆里,从成千上万本封面和标题都极其相似的书中,找到唯一那本正确的书。
首先,目标肽段(比如来自癌细胞的某个突变蛋白)与细胞内成千上万种正常肽段(来自自身蛋白质)可能只有一个或两个氨基酸的差异。我们的“分子巡警”必须具备火眼金睛,能准确识别这微小的差别,否则就可能“误伤友军”,攻击正常细胞,引发严重的、甚至致命的毒副作用。这被称为“脱靶效应”(off-target effect)。
其次,MHC分子本身也极具多样性。在人类群体中,编码MHC分子的基因(称为人类白细胞抗原,Human Leukocyte Antigen, HLA)有成千上万种不同的等位基因(alleles)。这意味着不同人的“展示窗”框架本身就不一样。一个为某位患者设计的“分子巡警”,可能完全无法识别另一位患者细胞上的“展示窗”。
传统的两种方法都步履维艰。一种是从健康的捐赠者体内筛选天然的TCR,但这就像买彩票,能恰好找到针对特定肿瘤肽段且亲和力足够高的TCR的概率极低。另一种方法是改造抗体,让它们去识别pMHC-I,但抗体天然的结构似乎并不擅长这项任务,它们往往会过多地接触MHC分子的“框架”部分,而忽略了关键的“展示内容”——肽段,导致特异性不佳。
高昂的成本、漫长的周期和极低的成功率,让pMHC-I这个充满希望的靶点,在很长一段时间里都像是一座可望而不可及的堡垒。我们需要一种全新的、更高效、更理性的设计方法。
面对这一困境,研究团队决定另辟蹊径。他们没有在现有的蛋白质(如TCR或抗体)上修修补补,而是选择了一条更大胆的道路:让AI从一张白纸开始,凭空“画”出一个全新的、理想的“分子巡警”。
他们使用的画笔,是一款名为`RFdiffusion`的生成式AI模型。这款模型在蛋白质设计领域声名鹊起,它能够在给定目标结构的情况下,从完全随机的原子坐标云开始,通过一个“去噪”过程,逐步生成一个能够与目标紧密结合的全新蛋白质骨架。这个过程,宛如一位雕塑家,从一块无定形的石料中,逐渐凿出精美的雕像。
研究人员首先将目标pMHC-I复合物的结构作为“创作主题”输入给AI。他们的要求非常明确:新设计的蛋白质(我们称之为“binder”)必须像一个拱门,优雅地跨越在MHC分子的肽结合槽之上,其接触面要主要集中在核心的肽段上,同时尽量避免与高度保守的MHC分子“框架”发生过多接触。
AI在数千次的独立“创作”中,生成了大量形态各异的蛋白质骨架。随后,研究团队动用了另外两个强大的计算工具进行筛选。首先,他们使用`ProteinMPNN`来为这些骨架“填充”上最佳的氨基酸序列,使其既能稳定折叠,又能与目标肽段产生最强的结合力。接着,他们用鼎鼎大名的`AlphaFold2`来预测这些设计出的binder是否真的能如预期那样折叠并与目标pMHC-I结合。
经过这套计算流水线的严格筛选,研究人员为11个不同的pMHC-I靶点,挑选出了最有潜力的候选binder。这11个靶点堪称一个“豪华阵容”,它们结构多样,涵盖了不同的HLA等位基因(如`A*01:01`、`A*02:01`、`A*03:01`和`C*07:02`),所呈递的肽段则来自多种病毒(如导致非典型肺炎的SARS病毒、黄热病毒YFV、艾滋病病毒HIV)和多种肿瘤(如肿瘤相关抗原WT1、PAP、以及广为人知的黑色素瘤抗原MAGE-A3)。这无疑是一场对AI设计能力的“大考”。
计算机里的完美设计,必须在现实世界中证明自己。研究人员将编码这些AI设计binder的DNA序列合成了出来,总量高达数千到上万个不等。他们使用了一种巧妙的酵母表面展示(yeast display)技术。简单来说,就是让每个酵母细胞表面都“穿上”一种binder。
然后,他们将这些酵母“大军”与两种pMHC-I复合物混合。一种是它们应该识别的“靶心”(on-target),被标记上了一种颜色的荧光;另一种是与靶心非常相似的“干扰项”(off-target),被标记上另一种颜色的荧光。通过流式细胞分选术(FACS),研究人员像在一个繁忙的十字路口指挥交通一样,只放行那些紧紧抓住“靶心”荧光,同时又对“干扰项”荧光不屑一顾的酵母细胞。
结果显示,对于绝大多数靶点,他们都成功筛选出了高度特异性的binder。以一个靶向黄热病毒(YFV)肽段的binder `yfv-2`为例,酵母展示实验的数据显示,与靶向pMHC-I复合物结合的细胞群体比例高达88.8%,而与一种高度相似的脱靶pMHC-I复合物结合的细胞比例仅为6.96%。这种清晰的信号分离,证明了AI设计的binder具有极高的特异性。
为了进一步验证设计的准确性,研究人员还成功解析了一个名为`mart1-3`的binder与其靶向的黑色素瘤抗原MART-1 pMHC-I复合物的共晶结构,分辨率达到了2.2埃。当他们将真实的晶体结构与AI最初的设计模型进行比对时,两者几乎完美重合,其骨架的均方根偏差(Cα RMSD)仅有0.4埃——这是一个小到可以忽略不计的数值。这有力地证明了,AI不仅“画”出了一个能用的binder,而且它对这个binder如何工作的每一个细节都“看”得清清楚楚。
一个合格的“分子巡警”不仅要能“认出”敌人,更关键的是要能“拉响警报”,激活免疫细胞。为了检验这些binder是否具备这项核心功能,研究人员将它们的编码序列整合进了CAR的结构中,并把这些定制版的CAR表达在一种名为Jurkat的T细胞系表面。
他们以一个靶向MAGE-A3肿瘤抗原的binder `mage-513`作为范例,进行了一系列巧妙的细胞实验。MAGE-A3是一种在多种肿瘤中表达,但在正常组织中几乎不存在的蛋白质,是理想的肿瘤治疗靶点。然而,人体内的一种名为Titin的蛋白质,其降解后产生的肽段与MAGE-A3的靶向肽段(EVDPIGHLY)只有一个氨基酸的差异,是极具挑战性的“干扰项”。
实验结果显示,当表达`mage-513` CAR的Jurkat细胞与装载了MAGE-A3肽段的靶细胞共培养时,T细胞被强烈激活,其表面的激活标志物CD69的阳性率飙升至47.6%。相比之下,当靶细胞装载的是“干扰项”Titin肽段时,CD69阳性率仅为1.08%,与未加任何肽段的对照组(1.12%)几乎没有差别。
这一结果清晰地表明,`mage-513` CAR具备了极其精准的识别能力,能够有效地区分“敌我”,只在遇到真正的肿瘤“信号”时才会拉响警报。这正是免疫治疗追求的“圣杯”——高效且安全。
`mage-513`为何如此“聪明”?AI在设计它的时候,到底赋予了它怎样的“智慧”?借助计算机模型和进一步的实验,研究人员得以一探究竟。
设计模型显示,`mage-513`与MAGE-A3肽段之间形成了一个复杂而精密的相互作用网络。Binder的L37和L86残基形成了一个疏水性口袋,紧紧包裹住肽段的L8残基;同时,binder还与肽段的H7和L8残基的主链和侧链形成了多个氢键。这些相互作用力,如同一把精密的锁与钥匙,确保了连接的紧密与特异。
为了验证这些“对话”的重要性,研究人员进行了一系列“定点打击”——丙氨酸扫描(alanine scanning)。他们将肽段上或binder上参与相互作用的关键氨基酸,逐一突变成没有特殊功能的丙氨酸,然后观察T细胞的激活情况。
结果与设计模型高度吻合。当肽段上与binder接触最紧密的I5、H7或L8被突变后,T细胞的激活水平急剧下降。同样,当binder上的关键残基L37、D40或L86被突变后,激活能力也显著减弱。
更有趣的是,研究人员发现binder上有一个名为D29的残基。在设计模型中,它虽然离肽段很近,但并未直接接触。研究人员推测,它可能扮演着“守门员”(gatekeeper)的角色。它的存在,可能会与那些在相应位置(P4)拥有大体积氨基酸的“干扰肽段”发生空间位阻(clashing),从而将它们拒之门外。果不其然,当他们将D29突变后,虽然对MAGE-A3肽段的识别没有影响,但CAR-T细胞的“背景激活”水平却升高了,说明它开始对靶细胞上存在的其他自身肽段产生了不必要的反应。这位“守门员”的存在,巧妙地提升了binder的洁净度。
类似的分子“对话”也在其他binder中被发现。例如,在一个靶向WT1肿瘤抗原的binder `wt1-5`中,其E40残基与肽段的R1残基形成了一对强有力的“盐桥”氢键。而在一个靶向HIV病毒肽段的binder `hiv-9`中,则是与肽段P4和L5的疏水作用和氢键网络起到了决定性作用。AI似乎掌握了针对不同“锁孔”设计不同“齿形”的通用法则。
这项研究的魅力不止于此,研究人员还向我们展示了两种更令人兴奋的可能性。
第一种是“旧瓶装新酒”——利用“部分扩散”(partial diffusion)技术进行快速改造。从零开始设计一个全新的binder毕竟耗时耗力。研究人员想到,既然pMHC-I的整体结构都比较相似,那么一个成功的binder骨架,是否可以被“改造”去识别新的目标呢?
他们以一个已成功设计的binder为“毛坯”,通过`RFdiffusion`对其进行轻微的“再创造”,只在与肽段接触的关键区域进行重新设计。结果,他们成功地从一个旧的binder出发,快速设计出了能够特异性识别gp100、MART-1和PRAME这三种全新肿瘤抗原的binder。这就像是掌握了一个万能钥匙的模板,只需要对关键的齿形稍作修改,就能打开一把把新的锁,极大地提升了设计效率。
第二种,也是更具革命性的一点,是“无中生有”——针对AI预测的结构进行设计。在现实世界中,绝大多数pMHC-I复合物的实验结构都是未知的。获取它们的晶体结构本身就是一个巨大的瓶颈。那么,我们能否直接跳过实验,针对AI预测出的pMHC-I结构进行设计呢?
研究人员勇敢地挑战了这一点。他们选择了一个重要的肿瘤靶点PRAME,其相应的pMHC-I复合物当时并没有高分辨率的实验结构。他们直接使用`AlphaFold`预测出的结构作为“设计蓝图”,并启动了`RFdiffusion`。令人难以置信的是,他们再次取得了成功。设计出的binder `prame-9`和`prame-2`,在后续的细胞实验中,表现出了对PRAME肽段的高度特异性识别和激活能力。
这一步的意义极为深远。它意味着,未来研究人员不再受限于已知的实验结构,理论上可以为任何一个感兴趣的、由蛋白质组学鉴定出的肿瘤肽段,设计出特异性的binder。这片曾经充满迷雾的广阔疆域,如今被AI的火炬照亮了。
最后,为了证明这些AI设计的“分子巡警”在真实治疗场景下的潜力,研究人员将靶向PRAME和WT1的binder装配到CAR中,并导入了从健康人血液中分离出的原代T细胞。在体外杀伤实验中,这些CAR-T细胞展现出了强大的、精准的“战斗力”。它们能够高效地杀死装载了相应肿瘤肽段的靶细胞,而对装载了不相关肽段或未装载肽段的细胞则秋毫无犯。经过48小时的孵育,在合适的效应T细胞与靶细胞比例下,对靶细胞的杀伤率(% Lysis)可以达到80%以上,而对照组的杀伤率则在20%以下。这为这些AI设计的binder最终走向临床应用,注入了强心剂。
这项发表在《科学》杂志上的研究,远不止是创造了几个新的抗癌“分子”。它真正开创的,是一个全新的、可规模化的、高效理性的药物设计范式。它告诉我们,借助生成式AI的力量,我们可以在短短数周内,完成过去需要数年时间、耗费巨资且成功率极低的靶向pMHC-I药物的开发。
这个平台化的方法,有望从根本上改变免疫治疗领域的游戏规则。 想象一下未来:当一位癌症患者被确诊,医生可以对其肿瘤进行测序,找到其独特的突变新抗原(neoantigen),同时确定其HLA分型。然后,将这些信息输入AI设计平台,在几天之内,AI就能为这位患者“量身定做”出最适合他的CAR-T疗法所需要的特异性binder。这不再是科幻小说的情节,而是这项技术所指向的、触手可及的未来。
通过将人类对免疫学的深刻理解与AI强大的模式识别和创造能力相结合,我们正在进入一个可以主动设计、而非被动筛选生物大分子的新时代。这些由AI精心绘制的“钥匙”,将有望打开无数扇过去紧闭的疾病治疗之门,为全球数百万患者带来新的希望。
参考文献