Advanced Science:韩敬东团队开发转录组数据空间重构新算法

来源:生物世界 | 2023-06-21 15:29:54 |

单细胞转录组技术(scRNA-seq)对单个细胞进行转录组测序,可以更好地捕捉生物学样本中细胞间的异质性。但是,在制备单细胞测序样本时,需要进行细胞解离,因此无法获得单个细胞的空间位置信息。目前,研究人员主要使用空间转录组技术(Spatial transcriptomics)获得转录组样本的空间信息。但是,该技术在样本和基因的检测通量上仍然远低于scRNA-seq,并且应用场景也受到较大限制。利用计算方法从scRNA-seq数据出发获得具有空间分辨率的转录组数据可以大大弥补这种局限性,更经济地得到具有空间分辨率的转录组数据,在生物学研究中同样具有重要意义。

近日,北京大学定量生物学中心、北大-清华生命科学联合中心韩敬东教授团队与清华大学脑与智能实验室Carlo Vittorio Cannistraci教授合作,在Advanced Science期刊上发表了题为:Spatial Reconstruction of Oligo and Single Cells by De Novo Coalescent Embedding of Transcriptomic Networks的研究论文。

该研究建立了一种单细胞/寡细胞转录组数据从头空间重构算法——De Novo Coalescent Embedding(D-CE)。该研究利用细胞-细胞转录相关网络的非线性嵌入方法,从头重构了单细胞转录组数据在空间中的位置信息。基于这一空间重构结果,他们成功实现了对应于组织空间特异性基因和空间域的识别。


(资料图)

在该论文中,研究者利用细胞-细胞转录相关网络的非线性嵌入方法,成功重构了单细胞转录组数据在空间中的位置信息。重要的是,这一重构过程不需要使用空间结构模板或空间特征基因表达模式等先验信息,便实现了对转录组数据空间结构的可靠重构。

为了使得重构出的空间结构更符合目标组织的真实形状,研究者通过最优传输理论设计了空间模板拟合步骤。该步骤可以根据目标组织的空间形状模板和模板上的空间特征基因表达信息,对D-CE重构的结构进行优化,从而获得更贴合于目标组织结构的空间重构结果。

图1 D-CE 空间重构算法概述

为了验证空间重构方法的有效性,研究者使用来自人类、小鼠、果蝇和斑马鱼等多个不同物种的组织转录组数据,重构了对应组织的空间基因表达模式。同时,他们以已知样本空间域标签或对应组织空间特征基因表达特征为金标准,并设计了指标来衡量空间重构的性能。结果表明,D-CE算法在空间重构上具有良好的效果,并且其性能优于目前已知的从头空间重构算法(novoSpaRc和CSOmap)和转录组分析中常用的降维可视化方法。

图2:空间重构的评价参数和不同空间重构方法比较

另外,D-CE算法准确地重建了寡聚细胞和单细胞的空间结构,并识别了许多在空间形态建成过程中先前未被重视或未被充分关注的调节因子,例如氧、细胞外基质和紧密连接梯度。这些梯度引导了许多生物过程的模式形成,包括但不限于胚胎和组织发育、再生以及癌症形成。为了验证D-CE算法能否准确识别空间特征基因,研究者使用全胚胎原位杂交实验对于该算法在小鼠胚胎数据中识别的空间特征基因进行了验证。结果表明,D-CE算法成功识别了具有较强空间特异性表达的空间特征基因。

图3:D-CE识别的空间特征基因的表达模式实验验证

总体来说,在论文中,研究团队构建了一种单细胞/寡细胞转录组数据从头空间重构算法D-CE。该算法具有物种普适性和先验信息非依赖性等优点,扩展了转录组空间重构算法的应用范围,并且在应用表现上优于已知的空间重构算法。基于这一空间重构方法,研究者识别出了多种组织空间结构中以往未被发现的空间特征基因和空间调节因子,并通过实验证明了这些空间特征的有效性。

D-CE算法揭示了空间组织的中尺度设计原则,即局部网络邻域与空间域相关联。这些相互连接的中尺度域及其相互作用对于寡细胞或单细胞空间模式的形成至关重要。该算法的通用性和准确性使其成为基于寡细胞/单细胞转录组数据进行空间分析的有效工具。需要注意的是,D-CE算法是基于空间临近的样本存在转录组学相关性的假设而设计的。然而,在某些情况下,例如当转录组不响应局部环境、存在空间域形成、或者存在逃逸的癌症细胞或高度流动/穿梭的细胞等,这种假设可能不成立,导致其位置难以重建。因此,在这些情况下,空间结构的捕捉将成为未来研究的一个重点问题。

北京大学前沿交叉学科研究院、北大-清华生命科学联合中心韩敬东教授和清华大学脑与智能实验室Carlo Vittorio Cannistraci教授为论文共同通讯作者,北京大学定量生物学中心2017级博士研究生赵宇轩和中国科学院上海营养与健康研究所2017级博士研究生张世强为论文共同第一作者。该研究得到了中国科学技术部、中国国家自然科学基金(NSFC)和上海市科技重大专项资助。

关键词: