在疫情高峰期,研究人员竞相开发一些针对新冠肺炎的首批有效治疗方法:从该疾病康复者的血液中分离出来的抗体分子。
类似于ChatGPT背后的语言模型已被用于改进针对新冠肺炎、埃博拉和其他病毒的抗体疗法。
文章发布于Nature,论文地址:https://www.nature.com/articles/d41586-023-01516-w
现在,科学家已经表明,生成人工智能(AI)可以通过一些费力的过程提供一条捷径,这表明序列可以提高抗SARS-CoV-2和埃博拉病毒等病毒抗体的效力。上周发表在《自然生物技术1》上的一项研究是将类似于ChatGPT AI平台背后的“神经网络”应用于抗体设计的日益努力的一部分。
治疗乳腺癌和类风湿性关节炎等疾病的抗体药物每年在全球的销售额超过1000亿美元。研究人员希望生成人工智能——可以在学习模式的基础上创建文本、图像和其他内容的神经网络——将加快开发,并帮助为抵制传统设计方法的目标解锁抗体药物。
加州斯坦福大学生物化学家Peter Kim说:“人们对发现和工程抗体以及如何使抗体更好有着浓厚的兴趣。”他共同领导了《自然生物技术》论文。
免疫武器
抗体是免疫系统抵御感染的关键武器之一。这些蛋白质已经成为生物技术行业的宠儿,部分原因是它们可以被设计成附着在几乎任何可以想象的蛋白质上,以操纵其活动。但斯坦福大学计算生物学家Brian Hie说,产生具有有用特性的抗体并改进这些抗体涉及“大量的蛮力筛查”,他也是该研究的联合领导。
为了看看生成人工智能工具是否可以消除一些繁文的工作,Hie、Kim和他们的同事使用了称为蛋白质语言模型的神经网络。这些类似于构成ChatGPT等工具基础的“大型语言模型”。但蛋白质语言模型不是被输入大量文本,而是在数千万个蛋白质序列上训练的。
其他研究人员使用这些模型来设计全新的蛋白质,并帮助高精度预测蛋白质的结构。Hie的团队使用蛋白质语言模型——由总部位于纽约市的科技巨头Meta的一部分Meta AI的研究人员开发——来提出少量抗体突变。
该模型在从中学习的近1亿个蛋白质序列中,只接受了数千个抗体序列的训练。尽管如此,模型的建议中出人意料地高比例提高了抗SARS-CoV-2、埃博拉病毒和流感的抗体与其目标结合的能力。
批准用于治疗埃博拉的疗法和新冠肺炎治疗的改变提高了这些分子识别和阻断这些病毒用于感染细胞的蛋白质的能力。(Hie说,COVID-19抗体对Omicron及其亚变量无效,AI引导的变化不太可能恢复有效性。)
Kim说,许多建议的抗体变化发生在与其目标相互作用的蛋白质区域之外,这通常是工程工作的重点。他补充说:“该模型正在接触到信息,这些信息甚至对抗体工程专家来说都是完全或在很大程度上不明显的。”“对我来说,这就是’圣牛,这里发生了什么?’瞬间。”
全新的蛋白质
英国牛津大学免疫信息学研究员Charlotte Deane说:“这是人们用来改善抗体的工具。”“我觉得这真的很酷。”但她补充说,许多研究人员希望,生成性人工智能能够创造与选择的目标结合的全新抗体,而不是简单地改进现有的抗体。
马萨诸塞州波士顿的Nabla Bio公司联合创始人Surge Biswas说,这种能力可以帮助研究人员开发抵抗其他抗体设计方法的分子靶点的药物。
例如,人工智能可以帮助解决G蛋白偶联受体,G蛋白偶联受体是插入细胞膜的蛋白质家族,这些蛋白质涉及神经系统疾病、心脏病和各种其他疾病。Biswas说,生成性人工智能还有助于设计能够锁定多个靶点的抗体药物,如肿瘤蛋白和可以杀死该肿瘤的免疫细胞。
斯坦福大学的生物工程师Possu Huang表示,蛋白质语言模型功能强大,非常擅长优化现有蛋白质,包括抗体。但只接受蛋白质序列训练的模型可能很难想出识别特定蛋白质的真正新抗体。
研究人员表示,他们正在取得进展。3月,华盛顿州温哥华的生物技术公司Absci的科学家在bioRxiv服务器2上发布的预印本中报告了他们所说的用人工智能制造新抗体的第一步。使用包含蛋白质序列和实验数据的模型,他们为用于治疗乳腺癌的抗体药物的几个重要区域生成了新的设计。
设计全新抗体的一个关键挑战是,它们识别特定目标的能力取决于抗体结构中的软环。研究人员表示,事实证明,这些相互作用很难用人工智能建模。
去年,黄的团队开发了一种生成人工智能工具3,该工具可以使用此类循环创建能够与特定目标(一种情况下是蛇毒)强烈结合的蛋白质。Huang说,同样的方法可能有助于制造新的抗体,但它可能需要比目前更多的关于抗体如何与目标相互作用的数据。
“我认为没有人真正明白这一点,”Biswas补充道。