(相关资料图)
高等真核生物基因组存在复杂的三维空间结构,在不同尺度下形成如染色质环(Chromatin loops)、拓扑关联结构域(TADs)、活性/非活性染色质区室(A/B compartments)和染色体域(Chromosome territories)。这些结构对于基因组稳定性的维持、基因表达的精准调控具有重要作用,从而影响细胞命运决定和表型建立。经典的基因组三维结构主要通过染色体构象捕获(3C)及其衍生方法如4Cs、5C、Hi-C、ChIA-PET为代表的多种形式的高通量技术揭示。这些技术可以捕获细胞核内空间相邻的成对DNA序列,但无法捕获细胞群体中基因组内协同的多位点相互作用(multi-way contact)和单分子拓扑结构(single-allele topology)。此外,基因组3D结构在细胞周期、发育和分化过程中动态变化,且与多个基因及调控区间的染色质相互作用相关。获得细胞群体中的染色体单分子拓扑结构对于探究基因组的动态折叠机制和与基因调控功能的关联性颇为重要。
近年来,多个实验室建立了如ChIA-drop、split-pool recognition of interactions by tag extension(SPRITE)、Tri-C、multi-contact 4C和Pore-C等方法,用于探讨染色质多位点协同相互作用和群体细胞的染色体单分子拓扑结构的捕获。这些方法中,Pore-C具有技术简单,且可以同步捕获全基因组高阶多位点互作信息和DNA甲基化修饰的优点。
中国科学院昆明动物研究所研究员侯春晖团队与中山大学中山眼科中心副研究员肖传乐团队合作,在《自然-通讯》(Nature Communications)上,发表了题为High-throughput Pore-C reveals the single-allele topology and cell type-specificity of 3D genome folding的研究论文。该工作优化建立了高通量的Pore-C方法,显著增加了高阶染色质互作的检测通量,并揭示了三维基因组的单分子拓扑结构多样性和细胞特异性。
研究发现,Pore-C技术测序通量相对较低的原因可能是与DNA交联的蛋白质没有被完全去除而导致测序纳米孔芯堵塞。为了解决这一问题,研究优化了酶解条件,测试了多次蛋白酶解和使用混合蛋白酶的策略,提高了测序产量约80%,近乎成倍降低了该技术的使用成本。此外,研究通过整合NGMLR和Minimap2比对算法开发了MapPore-C比对流程,显著改善了比对准确性和数据利用率低的问题,同时,研究通过与Hi-C数据比较,验证了HiPore-C能够高度重现基于Hi-C捕获的染色质环、拓扑相关结构域和染色质区室等基因组3D结构。进一步,研究探索了染色体间高阶互作发现,多数互作并非发生在端粒和中心粒之间,而是发生在基因组区域,且形成两个转录活性不同的互作枢纽,其中一个枢纽基因密度、增强子密度和活跃状态染色质相关的表观遗传修饰水平均更高。研究还发现,多个染色体的tRNA基因富集区域之间发生跨染色体的高频相互作用,HiPore-C高阶互作不仅发生在TAD和compartment内部,而且能够跨越多个区室、拓扑相关域和染色质环,基于直接和间接的DNA片段间相互作用构建的染色质互作图谱与常规Hi-C图谱总体相似,但间接DNA片段互作更加倾向跨越多个结构单元。上述研究揭示了跨染色质结构域互作存在的广泛性,并突出了HiPore-C技术在单分子水平解析基因组三维高阶互作的优势和重要性。
研究通过分层聚类的方法,讨论了不同类型细胞的拓扑结构中呈现的单分子拓扑结构集群。这些结构集群是类亚TAD(subTAD-like)结构域形成的基础,具有明显的细胞特异性,表明单分子拓扑结构多样性是细胞群体TAD结构域划分的基础,对探讨基因组空间结构组织和细胞特异的基因表达间的关系具有重要意义。此外,研究使用HiPore-C数据比较了红系K562和淋巴系GM12878细胞中在β-globin locus的高阶互作。结果发现,人ε-和γ-珠蛋白基因启动子和多个增强子之间形成了多位点同时互作、细胞特异的增强子-启动子中心,这种相互作用可能是动态的。研究分析了HiPore-C同时捕获染色质高阶互作和DNA甲基化状态的能力,发现了DNA甲基化信号与染色质环锚点间相互作用强度呈正相关,此外,可根据DNA甲基化水平准确地区分染色质区室的类型(A vs B)。
该研究建立了HiPore-C技术,可全面描述单分子拓扑结构的多样性,揭示的单分子拓扑结构的动态折叠比以前想象的更为复杂,进一步提升了关于三维基因组折叠规律的认知。
图1.用于生成高阶染色质相互作用的原位HiPore-C协议示意图