人类遗传学的一个主要挑战是了解基因组的哪些部分驱动特定的性状或促成疾病风险。对于在98%不编码蛋白的基因组部分中发现的遗传变异,这一挑战甚至更大。
在一项新的研究中,来自美国纽约大学和纽约基因组中心的研究人员开发出一种新方法,将遗传关联研究、基因编辑和单细胞测序结合起来,以应对这些挑战并发现血细胞性状的因果变异(causal variants)和遗传机制。他们的方法被称为STING-seq,解决了将遗传变异与人类性状和健康直接联系起来的挑战,并能帮助科学家们确定有遗传基础的疾病的药物靶标。相关研究结果于2023年5月4日在线发表在Science期刊上,论文标题为“Discovery of target genes and pathways at GWAS loci by pooled single-cell CRISPR screens”。
(资料图片仅供参考)
在过去二十年里,全基因组关联研究(GWAS)已经成为研究人类基因组的一个重要工具。利用GWAS,科学家们已经确定了数千个与许多疾病(从精神分裂症到糖尿病)以及性状(比如身高)相关的基因突变或变异。这些研究是通过比较大型人群的基因组来寻找在患有特定疾病或性状的人群中更经常出现的变异。
GWAS可以揭示基因组的哪些区域和潜在变异与疾病或性状有关。然而,这些关联几乎总是在98%的不编码蛋白质的基因组中发现,对它们的了解要比得到充分研究的2%的编码蛋白的基因组部分要少得多。另一个复杂的问题是,许多变异在基因组中相互接近,并在几代人中一起传播,这一概念被称为连锁(linkage)。这可能使我们很难将哪个真正发挥因果作用的变异与其他只是位于附近的变异区分开来。即使科学家们能够确定哪个变异导致了某种疾病或性状,他们也并不总是知道该变异影响了什么基因。
论文共同通讯作者、纽约大学生物学副教授Neville Sanjana说,“人类疾病研究的一个主要目标是确定因果基因和因果变异,这可以澄清生物机制,并为许多疾病的药物靶标提供信息。”
论文共同通讯作者、纽约基因组中心高级副教员Tuuli Lappalainen说,“GWAS的巨大成功凸显了从这些大规模数据集中获得关于疾病生物学的新见解所面临的挑战。尽管我们在过去10年中做出了所有的努力,但杯子充其量也只是半满的。我们需要一种新的方法。”
镰状细胞性贫血(sickle cell anemia)的治疗方法
近期在治疗镰状细胞性贫血---一种以发作性剧痛为特征的遗传性疾病---方面的一项科学突破说明了将GWAS与基因编辑等前沿分子工具相结合如何能够识别因果变异并导致创新疗法。利用GWAS,科学家们确定了基因组中对产生胎儿血红蛋白(fetal hemoglobin)---一种有望逆转镰状细胞性贫血的靶标---很重要的区域,但他们不知道哪个确切的变异驱动它的产生。
这些作者求助于CRISPR--一种使用“分子剪刀切割DNA”的基因编辑工具,根据Sanjana的说法,它可以编辑GWAS所确定的区域。当CRISPR在非编码基因组中一个名为BCL11A的基因附近的特定位置进行编辑时,它导致了高水平的胎儿血红蛋白产生。
CRISPR如今已被用于临床试验,在几十名镰状细胞性贫血患者的骨髓细胞中编辑这一区域。这些经过编辑的骨髓细胞被灌注回患者体内后,他们开始产生胎儿血红蛋白,从而取代了发生突变的成体血红蛋白形式,有效地治愈了他们所患的镰状细胞性贫血。
Sanjana说,“这个治疗镰状细胞性贫血的成功故事是将GWAS与基因编辑相结合获得的新见解的结果。但这只花了多年时间对一种疾病进行研究。我们如何扩大这个规模,以便更好地从GWAS中确定因果变异和靶基因?”
GWAS遇到CRISPR和单细胞测序
这些作者构建了一个名为STING-seq(Systematic Targeting and Inhibition of Noncoding GWAS loci with single-cell sequencing, 利用单细胞测序对非编码GWAS位点进行系统靶向和抑制)的工作流程。STING-seq的工作方式是采用生物库规模的GWAS,并利用生化指标和调节性序列元件的组合寻找可能的因果变异。然后,他们使用CRISPR锁定GWAS所涉及的每个基因组区域,并进行单细胞测序以评估基因和蛋白表达。
在他们的研究中,这些作者说明了使用STING-seq来发现血液特征(也称为血液性状)的非编码变异所在的靶基因。血液特征---比如血小板、白细胞和红细胞的百分比---在常规血液测试中很容易测量,并在GWAS中得到了充分的研究。因此,他们能够利用代表不同背景的近75万人的GWAS来研究血液特征。
一旦这些作者确定了基因组中可能在血液特征中发挥作用的543个候选区域,他们就使用了一种叫做CRISPR抑制(CRISPR inhibition, CRISPRi)的CRISPR版本,CRISPRi可以使基因组的精确区域沉默。
在对GWAS确定的区域进行CRISPRi沉默后,这些作者观察了细胞中遭受沉默的区域附近的基因的表达情况,以查看特定基因是否开启或关闭。如果他们观察到变异被沉默和未被沉默的细胞之间的基因表达有差异,他们可以将特定的非编码区域与靶基因联系起来。通过这样做,他们可以确定哪些非编码区对特定性状至关重要(哪些不是),这往往也可以确定这些非编码区发挥作用的细胞途径。
图片来自Science, 2023, doi:10.1126/science.adh7699。
论文第一作者、纽约基因组中心和纽约大学的博士后助理John Morris说,“STING-seq的力量在于我们可以将这种方法应用于任何疾病或性状。”
使用STING-seq来测试一系列可能的变异并查看它们对基因的影响,消除了科学家们以前在面对变异或最接近变异的往往但不总是靶基因的基因之间的连锁时进行的猜测。就一种称为单核细胞计数的血液特征而言,利用CRISPR导致一个称为CD52的基因明显地表现出显著的改变---虽然CD52接近感兴趣的变异,但它不是最接近的基因,所以可能在以前的方法中被忽略了。
在另一项分析中,这些作者发现了一个名为PTPRC的基因,它与10种血液特征相关,包括那些与红细胞和白细胞以及血小板有关的血液特征。然而,在附近有几个GWAS确认的非编码变异,要了解哪些变异(如果有的话)可以调节PTPRC的表达是一个挑战。应用STING-seq使他们能够通过观察哪些变异改变了PTPRC的表达来分离出哪些变异是因果关系。
STING-seq及其他
虽然STING-seq可以通过沉默变异来确定靶基因和因果变异,但它并不能解释所产生的效果的方向---一种特定的非编码变异是否会提高或降低附近基因的表达。这些作者将他们的方法向前推进了一步,构建出一种称为beeSTING-seq(base editing STING-seq)的补充方法,该方法使用CRISPR精确插入一个遗传变异,而不是仅仅抑制基因组的一个具体的区域。
这些作者设想STING-seq和beeSTING-seq被用来确定一系列疾病的因果变异,这些疾病可以通过基因编辑---如用于治疗镰状细胞性贫血中的那样---或通过靶向特定基因或细胞通路的药物进行治疗。
Lappalainen说,“如今我们可以将非编码变异与靶基因联系起来,这为我们提供了证据,表明可以开发小分子或抗体疗法来改变特定基因的表达。”(生物谷 Bioon.com)
参考资料:
John A. Morris et al. Discovery of target genes and pathways at GWAS loci by pooled single-cell CRISPR screens. Science, 2023, doi:10.1126/science.adh7699.