【资料图】
近日,赛诺菲-Cell Research 2021年度杰出论文奖发布,共有3篇发表于 Cell Research 的论文获奖,论文通讯作者分别是清华大学张强锋;复旦大学鲁伯埙、丁澦;南京大学张辰宇、张骑鹏、汪芳裕。其中,清华大学生命学院张强锋副教授于2021年2月发表的PrismNet研究论文“使用人工智能方法基于细胞内RNA结构预测蛋白质-RNA 动态相互作用”(Predicting dynamic cellular protein–RNA interactions by deep learning using in vivo RNA structures(Sun et al., 2021b))荣获此奖。赛诺菲-Cell Research杰出论文奖设立于2009年, 2021年度奖项的评选范围为2021年度刊登于Cell Research印刷版上的原创论文及综述论文,该奖项每年评选一次,2021年度共评选了三个赛诺菲-Cell Research杰出论文奖。
图1 张强锋副教授
RNA结合蛋白(RBP)在RNA转录、RNA代谢以及RNA翻译过程中起重要的调控作用。解析RBP在不同的细胞环境下的结合图谱对于理解RBP的功能及其调控机制具有重要意义。然而,受限于现在的通用实验手段(CLIP),通常只能解析在某些特定细胞环境下特定RNA的结合位点,我们对于多种细胞环境下大量RBP的结合图谱并不十分清楚。而现有的预测RBP结合位点的计算方法原则上都是基于RNA序列,无法解决RBP在不同细胞环境下具有结合动态性的问题。为了解决这一难题,在本工作中,张强锋研究组通过整合细胞内RNA结构信息以及对应细胞系的RBP结合信息,利用多层残差神经网络,构建了预测RBP结合位点的PrismNet模型。该模型在168个人类RBP数据上进行训练学习,预测准确率显著高于之前仅仅利用RNA序列以及基于序列预测RNA结构方法的模型。
图2 PrismNet模型构建以及应用
PrismNet通过注意力机制发现RBP识别RNA的关键识别位点。分析表明这些关键识别位点比其它转录本区域更加保守,同时也更加富集包括自闭症、精神分裂症等精神类疾病的突变位点。这暗示可以通过PrismNet模型寻找介导突变以及疾病的潜在RBP。同时,相对于RNA结构没有改变的突变位点,造成RNA结构改变的突变位点(riboSNitch)与疾病具有更强的关联。这暗示了这些致病突变可能通过影响RNA结构来改变RBP结合,从而影响RBP调控来最终导致疾病。综言之,本工作揭示了RNA转录后调控水平的重要调控机制,为进一步理解疾病机制以及治疗疾病提供了新的思路。
值得说明的是,张强锋课题组还解析了新冠RNA结构,并利用PrismNet预测了SARS-CoV-2非编码RNA上的结合蛋白,并找到了针对RBP的重定位药物(Sun et al., 2021a)。此项研究证明了PrismNet的广阔应用前景。
除了上述方法以外,自从在清华大学建立实验室以来,张强锋课题组一直致力于利用人工智能方法解决生命科学领域的问题。作为通讯作者,先后开发了A2Net(Kui Xu, 2019), SCALE(Xiong et al., 2019),CryoNet,StructureImpute(Gong et al., 2021),SCALEX(Xiong et al., 2022),DiffScan(Yu et al., 2022)等众多解决不同生物学问题的计算方法,为人工智能在生物学领域的应用与推广做出了突出贡献。
清华大学生命学院张强锋课题组博士后孙磊、徐魁、黄文泽以及耶鲁大学博士后杨禹丞为论文共同第一作者,张强锋副教授为论文通讯作者。研究工作获得国家自然科学基金委、科技部重点研发计划、北京结构生物学前沿创新中心及高精尖创新中心、清华-北大生命联合中心的资助。