【资料图】
当2020年初COVID-19的流行关闭了当地的图书馆后,另一种特殊的“图书馆”(文库)就蓬勃发展了起来,而且还被证明在对抗新冠病毒的斗争中发挥着至关重要的角色,这就是”抗体文库“(antibody library)。作为发现和开发新型疗法的宝贵工具,这些文库就是基因工程抗体的集合,其主要会被用于进行研究和工业领域来发现并开发抵御病毒、癌症和其它人类疾病的疗法。以SARS-CoV2为例,抗体文库就能为研究人员提供一张蓝图来合成用于开发COVID-19疫苗的特殊分子。
尽管抗体文库在帮助开发新型疗法上拥有极大的潜能,但其用途也受到了一些因素的限制,比如创建文库所需要的大量时间和费用,以及文库中所包含的很多序列具有较差的化学特性,在其被用于疗法用途之前需要重新工程化改造或修饰。近日,一篇发表在预印本平台bioRxiv上题为“Generative language modeling for antibody design”的研究报告中,来自加利福尼亚大学等机构的科学家们通过研究设计出了一种产生抗体文库的新方法,其不仅能加快抗体的创建过程,还会最大限度地减少适当免疫反应的风险,并能使整个过程的成本和耗时减少。
用于抗体序列生成的IgLM模型的概述。
图片来源:bioRxiv (2022). DOI:10.1101/2021.12.13.472419
研究者Jeffrey Gray教授说道,这些文库通常是由工程师随机对序列进行突变所产生的,其所得到的结果就是,每一个产生的抗体都会在体内发挥作用或表现良好。而研究者的方法则是不同的,他们利用了深度学习的人工智能模型来产生满足需求的高质量文库。研究人员开发出的这种名为IgLM(Immunoglobulin Language Model,免疫球蛋白语言模型)的创新性工具能在一组5亿个真实的人类抗体序列中被训练,从而促使研究人员有效且准确地预测并填补空白;其由能力采用当前的抗体序列并使得特定区域多样化,从而就有可能制造出与机体免疫系统所产生的抗体相类似的抗体,这就颠覆了当前的质量控制问题。
而且由于这种模型能在人类以外的物种中进行训练,因此其还能用于生成小鼠、灵长类动物和其它物种的抗体,比如SARS-CoV2在人类和猿类中的表现不同,而其抗体库则能在两者之间快速转换。研究者Jeffrey Ruffolo认为,未来我们希望能与合作伙伴一起来证实这种方法,以便能快速开发出治疗性的抗体,而我们的最终目标则是减少对大型文库的需求并能按照要求在实验室中合成出能正常发挥用途的特殊抗体。
尽管该研究团队迄今为止的努力都仅限于在计算机上创建抗体库,但他们正在寻求合作伙伴来将其研究转化到实验室检测中。研究者表示,他们认为IgLM拥有真正的前景和希望,但他们还需要通过联合研究来实验性地筛选文库从而寻找到能抵御特定疾病的抗体;从原则上来讲研究人员可以做到这一点,但还需要进一步的实验去进行证实。综上,本文研究结果表明,IgLM能产生来自多种物种的全长重链和轻链抗体序列,以及具有改进型可开发特性的填充CDR环库;而且IgLM还能作为一种设计抗体的强大工具且能用于多种场景。(生物谷Bioon.com)
原始出处:
Richard W. Shuai,Jeffrey A. Ruffolo,Jeffrey J. Gray. Generative language modeling for antibody design, bioRxiv(2022). DOI:10.1101/2021.12.13.472419