抗体研究中的AI深度学习模型

使用噬菌体展示文库中基于 LSTM 的深度生成模型进行抗体设计,以实现亲和力成熟。

尽管人工智能 (AI) 在抗体研究中的应用仍处于早期阶段,但研究人工智能、生物信息学和蛋白质工程的研究科学家已经使用人工智能模型来证明其改变生物技术和制药行业研发空间的潜力。

高通量实验数据的可及性也使抗体研究从以实验为中心转变为以数据为中心。CNN 和 LSTM 等 AI 模型已被用于研究抗体的序列、结构和功能,以及 AlphaFold2 等 AI 驱动的蛋白质结构建模平台。1

美国有线电视新闻网(CNN)

卷积神经网络 (CNN) 是一种深度学习模型,可用于分析视觉图像。它利用输入域中的卷积层(滑动滤波器),将输入转换为每个滤波器的滤波器匹配程度。蛋白质结构可以呈现为卷积滤波器的兼容格式,例如图形、流形或 3D 体素网格。2

LSTM公司

长短期记忆 (LSTM) 网络是另一种深度学习模型,旨在根据数据序列进行处理和预测。它使用存储单元和门来捕获重要信息并预测序列中的下一步,即使存在长期依赖关系或模式。3

梅森等人。 (2021) 使用 CNN 和 LSTM 进行抗体先导化合物优化,成功预测了来自不同抗体序列空间的抗原特异性。通过对现有治疗性抗体曲妥珠单抗进行深度测序文库,他们通过定点诱变产生了104个变体×约1个,以筛选对人表皮生长因子受体2(HER2)的特异性。这些序列被用作CNN和LSTMS的输入,CNN和LSTMS经过训练以预测序列的结合标记。他们使用这些神经网络将一组计算生成的候选序列过滤到HER2特异性预测结合剂中。通过测试粘度、清除率、溶解度和免疫原性,研究人员生成了数千个高度优化的先导候选化合物。实验测试显示,在随机选择的 30 个预测变体中,有 30 个保留了对靶抗原 HER2 的特异性。4

因此,基于序列的方法可能比传统的基于结构的方法更有优势,因为传统的结构方法由于全长抗体的低通量筛选而更加耗时且耗费资源。同时,基于序列的方法从已开发的实验方法(如二代测序)中获得了更多数据。

在Biointron,我们致力于加速您的抗体发现、优化和生产需求。我们的专家团队可以提供定制的解决方案,以满足您的特定研究需求。联系我们,详细了解我们的服务以及我们如何帮助您加速研究和药物开发项目。

引用:

  1. 抗体治疗学。(2022 年 2 月 23 日)。征稿:人工智能在抗体发现、开发及其他领域的应用。https://academic.oup.com/abt/pages/call-for-papers-artificial-intelligence-in-antibody-discovery-development-and-beyond
  2. Graves, J., Byerly, J., Priego, E., Makkapati, N., Parish, SV, Medellin, B., & Berrondo, M. (2020)。抗体的深度学习方法综述。抗体,9(2)。https://doi.org/10.3390/antib9020012
  3. Sepp Hochreiter,Jürgen Schmidhuber;长短期记忆。神经计算 1997; 9(8):1735–1780。doi:https://doi.org/10.1162/neco.1997.9.8.1735
  4. 梅森,DM,弗里登森,S.,韦伯,CR,乔迪,C.,瓦格纳,B.,孟,SM,埃林,RA,博纳蒂,L.,达欣登,J.,盖恩扎,P.,科雷亚,BE和雷迪,ST(2021)。通过深度学习从抗体序列预测抗原特异性来优化治疗性抗体。自然生物医学工程, 5(6), 600-612.https://doi.org/10.1038/s41551-021-00699-9
滚动至顶部