基于AI的AAV衣壳库生成新方法,预测成功率近90%-天天热头条

来源:生辉 | 2023-05-15 16:47:06 |

近日,MIT-哈佛大学博德研究所(Broad Institute of MIT and Harvard)官网发布新闻稿,介绍了其载体工程化实验室如何通过结合机器学习方法解决基因治疗的关键问题——递送载体。

这一研究成果已经上传至预印本平台bioRXiv。科研团队详细描述了其开发的工程化多性状 AAV 衣壳通用机器学习新方法——Fit4Function,即通过均匀采集的序列空间衣壳库,生成可重复的筛选数据,从而训练出从序列到功能的精确模型。并根据六个预定标准,验证了生成的不同类型文库,预测成功率达到了 89%。

论文中还提到,基于小鼠体内试验和体外试验数据训练的模型精准预测了 AAV 衣壳变体在猕猴体内的生物分布。


(资料图)

新闻稿指出,Fit4Function 策略最终使预测 AAV 衣壳在多种物种中具有通用性成为可能,也是绘制能够预测 AAV 衣壳在几十类物种中效果的机器学习图谱的关键一步。这项技术有潜力加速开发针对更多疾病且副作用更少的创新型基因疗法。

这项研究的通讯作者是Benjamin Deverman博士,第一兼共同通讯作者是Fatma-Elzahraa Eid博士。

Fatma-Elzahraa Eid 指出,这种方法就像打开了一座金矿,结果非常令人兴奋。

“机器学习可能是解决蛋白质工程难题的最优解”

基因治疗是当前治疗甚至治愈遗传疾病等难治性疾病极具潜力的一种策略,通过功能性基因替代或者纠正修改致病的基因突变实现治疗。不过,当前领域内面临的一个重要的挑战,即如何安全高效递送治疗性基因片段和基因编辑工具到体内特定细胞和器官。

AAV 是基因治疗领域最常使用的一种病毒载体,应用潜力也已经得到了大量验证。然而,现阶段 AAV 还无法有效特异性靶向组织和器官,还可能会引起免疫反应等问题。

业内一直在探索多种优化 AAV 递送载体的方式,Benjamin Deverman实验室便是其中之一。他是博德研究所载体工程化实验室高级主任,在神经科学和 AAV 工程化设计方面经验丰富。长久以来,Ben Deverman 实验室一直专注于为“下一代”基因疗法设计更好的病毒载体,包括利用蛋白质工程、体内高通量筛选以及机器学习等多种方法开发一种可以快速筛选 AAV 载体的技术,开发更安全高效的新型 AAV 载体。

2013 年,他与合作者开发了一种称之为基于 Cre 重组酶的靶向进化(CREATE)的AAV筛选方法,可以在短短几周内一次筛选数百万个 AAV。

通过这种方法,Benjamin Deverman 发现了能够有效在小鼠中枢神经系统中递送基因片段的 AAV-PHP.B 衣壳家族,该衣壳可以通过血管上的一种新型受体穿过血脑屏障。据悉,当时,这种方法首次使成人全脑基因递送成为可能,也为设计可用于人中枢神经系统基因治疗的 “下一代” AAV 衣壳提供了新思路。

不过,这种方法仍然存在一定局限性,其只确定了对小鼠有效的 AAV,且通常一次只能针对一种理想功能优化 AAV,对设计具有多种特性的 AAV 递送载体效率比较低。Benjamin Deverman 认识到需要寻找一种筛选 AAV 的新方法。

2018 年,机缘巧合之下,Benjamin Deverman 与其实验室博士后研究员 Fatma-Elzahraa Eid 相识,Fatma-Elzahraa Eid 是博德研究所载体工程化实验室的机器学习科学家,在博士期间曾通过构建机器学习算法研究蛋白质和病毒。Fatma-Elzahraa Eid 认为机器学习很可能会是解决蛋白质工程难题的“最优解”,两人一拍即合,决定将机器学习用于蛋白质工程中。

预测成功率近90%,更具通用性

根据新闻稿的介绍,Fatma-Elzahraa Eid 一直在思考为何在生物学中使用机器学习模型很难达到预期。她和 Benjamin Deverman 在讨论中提到,“很多研究人员都接受过生物医学数据的培训,但是为便于阅读和理解,这些数据几乎都是人为收集的。这会在数据中引入偏差,从而使机器学习模型出错,导致这些模型聚焦在错误的信号上,从而误导研究人员。”

加入 Benjamin Deverman 实验室以后,Fatma-Elzahraa Eid 等团队成员决定从头开始设计关键实验,以无偏差的方式生成数据,以此使机器学习算法可以更精确地分析这些生物数据。这也意味着 Benjamin Deverman 需要构建全新更利于机器学习算法的 AAV 衣壳序列文库。

Ben Deverman 教授(来源:博德研究所)

同时,该实验室也考虑了 AAV 的应用范围,上文提到此前筛选出的 AAV 只在小鼠中有效果。现在,Benjamin Deverman 指出,我们在开发新筛选方法的时候会考虑使用机器学习寻找具有多种增强功能的病毒,能够在多个物种包括人体中有效果。同时,我们也要考虑到制造等问题。

经过 4 年多的努力,该实验室取得了一些重要的进展,相关研究成果已经发布在了预印本平台 bioRXiv 上。

在扩大 AAV 生产规模的前提下,该实验室构建了 Fit4Function 衣壳文库从而生成足够的数据,即用已知能正确形成衣壳的序列填充文库,然后筛选衣壳序列以获得各种预期功能,在此过程中生成训练和构建机器学习模型所需的可重复数据。这是一种用于系统工程化多性状 AAV 衣壳(systematically engineering multi-trait AAV capsids)的通用型机器学习算法,其整合了 6 个模型,靶器官是肝脏,衣壳可实现制造。

具体来说,该实验室训练了每个机器学习模型,从而预测具有某种特定功能的 AAV 衣壳序列,然后将 6 个模型组合成一个模型,这样可以同时预测与肝脏基因治疗相关、具有多种功能的 AAV。

系统化多性状蛋白优化范例(来源:bioRXiv)

在试验中,研究团队发现,算法模型预测具有多种预期功能 AAV 变体的成功率近 90%。他们还发现,表现最佳的候选衣壳的产量也更高、表现出了高效的小鼠肝脏转导、高出人类肝细胞转导 1000 倍,且在猕猴肝脏转导筛选过程中,与 AAV9 相比,增加了富集效应。

Benjamin Deverman 还指出,Fit4Function 文库模型能够帮助我们找到比天然、未修饰 AAV 更有效将基因片段或者基因编辑工具递送到小鼠肝脏和人类肝细胞的 AAV。不限于小鼠,这一工作也已经成功转化在其他物种上,更具有通用性。

“这项工作仅仅是个开始,我们实验室还构建了多种 Fit4Function AAV 衣壳文库,用于探索新的应用场景。”Benjamin Deverman 在新闻稿中说道。

已落地公司转化,即将公布大动物试验数据

现阶段,Benjamin Deverman 团队正在继续利用开发出的新技术测试实验室发现的 AAV,希望可以将这些候选 AAV 进一步开发成可用于治疗各种遗传疾病的递送载体。除了 Fit4Function 项目之外,该团队还在开发可以靶向脑部的 AAV,包括通过对病毒进行工程改造让其与血脑屏障中的特定蛋白质受体结合。

继续基础研究的同时,Benjamin Deverman 研究团队也在积极推进转化工作。2022 年春季,博德研究所与美国投资管理公司 Deerfield Management Company 推出了一家基因治疗公司Apertura Gene Therapy。公开资料显示,这家公司计划利用专有的平台技术开发 “下一代” 基因疗法,以解决基因治疗递送和表达的关键难题。去年 4 月,该公司宣布完成 6700 万美元 A 轮融资,系 Deerfield Management Company 独家投资。

该公司开发 “下一代” 基因疗法的一大底层科学主要建立在 Benjamin Deverman 实验室的研究成果之上,包括 Fit4Function 方法。Benjamin Deverman 也是公司的创始合伙人,并与公司展开学术合作。

根据官网的资料,Apertura Gene Therapy 正在对衣壳内外进行创新,同时利用机器学习和高通量分析设计新衣壳、基因调控元件(比如启动子和增强子)以及有效载荷,以解决基因传递和表达的关键限制。

来源:Apertura Gene Therapy

具体来说,该公司计划重新构建 AAV 衣壳工程,利用机器学习和对 AAV 生物学的快速理解同步增强 AAV 衣壳的多种功能,以获得更大的转化潜力。另一方面,通过自然进化的基因调控机制设计调控元件,将转基因片段靶向到特定细胞类型并调节表达水平。

在元件调控方面,该公司与哈佛大学签订赞助研究和许可协议,独家获得识别细胞类型特异性遗传调控元件(GRE)的方法,包括使用由哈佛大学 Michael Greenberg 实验室开发的 Paralleled Enhancer Single-Cell 分析(PESCA)平台;在有效载荷方面,计划通过将转基因表达靶向特定细胞类型,微调这些细胞中的表达水平,同时避免转基因在非靶细胞类型中的表达。

截至目前,Apertura Gene Therapy 还未披露具体的适应症,只是提及这些平台的优势在于不局限于某种细胞类型和器官,几乎可以用于任何疾病。

近日,这家公司宣布其科学创始人 BenjaminDeverman 将在华盛顿召开的第 25 届美国基因和细胞疗法学会(ASGCT)年会上展示关于 Fit4Function AAV 衣壳工程平台以及在非人灵长类动物上的临床前概念验证数据。

关键词: