清纯唯美 Nat Genet:阿尔茨海默症和帕金森病的单核苷酸多态性接洽, 揭示两种疾病的遗传风险位点的变异
发布日期:2024-10-04 19:09 点击次数:67
telegram 裸舞 撰文 ︱王念念珍 起头︱逻辑神经 阿尔茨海默症 (AD)和帕金森病(PD)是两种最常见的神经退行性疾病。尽管全基因组关聚积洽(GWAS)已详情了多个潜在的基因风险位点 【1-2】 。 然而大大皆风险位点皆位于非编码区,因此尚不廓清这些基因是否与疾病功能关系,亦或者是与其他基因辩论联。 单核苷酸多态性 (简称SNPs)主如若指在基因组水平上由单个核苷酸的变异(碱基的转换或颠换、插入或缺失)所引起的DNA序列多态性。它是东谈主类可遗传的变异中最常见的一种。大大皆的功能性非编码SNPs不错通过扰乱转录因子的勾通和调控元件的功能来改革基因的抒发,从而来阐扬其作用 【3-4】 。 值得正式的是,这些调控元件具有高度的细胞类型特异性,这辅导SNPs也有细胞类型特异性 。因此需要在正确的组织和区域布景下对每一种脑细胞类型中活跃的退换元件进行分类和功能揭示,进而匡助发达常见神经退行性疾病分子发病机制中的基因风险位点功能的迫切性。 在于2020年10月26日以:Single-cell epigenomic analyses implicate candidate causal variants at inherited risk loci for Alzheimer’s and Parkinson’s diseases 为题发表于 Nature Genetics 杂志,好意思国斯坦福大学医学院的Thomas J. Montine 讲授和Howard Y. Chang讲授互助团队旨在通过单细胞染色质图谱来毅力细胞类型特异性调控元件,并驾驭机械学习来匡助权衡AD和PD的功能性SNPs。接洽者详情了AD和PD中几个非编码GWAS位点的靶基因和细胞类型;这些数据和技能也为其他神经系统疾病中的驾驭提供了诱骗,使咱们省略更全面地了解遗传性非编码变异在疾病中的作用。 染色质的可及性 (chromatin accessibility)赓续长入为 灵通染色质 (open chromatin), 指考究的核小体结构被破损后,首先子、增强子、绝缘子、千里默子等顺式调控元件和反式作用因子不错接近的区域,与真核生物的转录调控密切关系。 早在2013年,斯坦福大学医学院的的William J. Greenleaf讲授和Howard Y. Chang讲授推行室互助开发了一种不错用于接洽染色质可及性的步调,称为 Assay for Transposase-Accessible Chromatin with high throughput sequencing ,即 转座酶可接近性染色质测序技能,或转座酶可及性染色质测序技能,亦或染色质灵通性测序技能, 简称ATAC-seq。 其旨趣是通过转座酶Tn5容易勾通在灵通染色质的特质,然后对Tn5酶拿获到的DNA序列进行测序 【 5-7 】 。 与其他技能(举例接洽一样染色质特征的FAIRE-Seq或DNase-Seq)比较,ATAC-Seq的主要上风在于该测定所需的细胞数目更少,何况其两步法操作相对浅易 。 那么,鉴于ATAC-Seq的普遍上风,本文中, 率先,作家驾驭ATAC-Seq画图了39名剖判正常个体的新皮层、海马体、黑质、纹状体等脑剖解区样本的大染色质图谱,进而来接洽非编码基因组在神经退行性疾病中的作用 (图1) 。这些大ATAC-seq数据 ,即峰值 (peaks) 标明了染色质可及性的区域各别。 图1 本 文所接洽的大脑区域(左)和脑区样本的 ATAC-Seq峰值(右) (图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168) 图2 样 本的 scATAC–seq 数据(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168)不同脑区的不同细胞的染色质可及性如何呢? 于是作家对样本的7万多个单细胞进行了染色质可及性分析,即单细胞ATAC-Seq(简称scATAC-Seq),并锁定了24个细胞类群(cluster),主要包括振作性神经元、防止性神经元、小胶质细胞、少突胶质细胞、星形胶质细胞和少突细胞祖细胞(OPCs) (图2-3) 。 迫切的是,scATAC-Seq分析标明了特异性的远端/内含子峰的富集,首先子峰的缺失,这与远端调控元件在细胞类型特异性基因调控中的作用是一致的 (图3)。另外,成果也辅导了 scATAC-Seq 的实用性,相等是磋商到,当从含有多种不同细胞类型的大块组织中毅力出特定细胞类型的峰值时, scATAC-Seq 具有显着的优胜性。图3 染色质可及性热图(左)和退换元件基序分析(右) (图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168) 为了进一步接洽是哪些转录因子可能闲逸斥地和保管这些细胞类型特异性的调控才能。作家则对每种细胞类型的峰值进行了基序富集分析,即结构域分析。成果显露了多个已知的细胞类型识别驱动成分,如少突细胞中SOX9和SOX10的基序,OPCs中的ASCL1的基序;以及转录因子SPI1和JUN/FOS永诀在小胶质细胞和神经元中的富集(图3)。这些数据进一步标明了ATAC-seq细胞类型特异性,相等是毅力了胶质细胞(如星形胶质细胞和OPCs)的脑区域的异质性。 图4 30个“神经元类群” (图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168) 磋商到神经元类型和功能的各样性,接洽者想进一步细化了scATAC-seq数据。 批次修订分析 显露了30个“神经元类群”,每个类群则暗示了一种特有的神经元细胞类型或细胞情景,并详情了神经元细胞类特异性的峰值、基因、以及转录因子活性(图5)。 有 趣的是,数据分析详情了在一种PD中丢失的过错细胞类型,即黑质多巴胺能神经元类群,着实来讲是酪氨酸羟化酶阳性多巴胺能神经元群 (图5 ) 。 图5 神经元特异性GWAS SNPs的连锁对抗衡分析 (图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168) 以上数据充分标明了scATAC-seq数据的细胞类型特异性,那么接下来,在染色质可及性的特定细胞类型区域是否富集了与神经退行性疾病关系的SNPs? 细胞特异性连锁对抗衡分析显露,AD的小胶质细胞峰值聚合,每个SNP的遗传概率皆有显贵的增多,而PD的任何细胞类型中,无SNP遗传概率的显贵富集,这可能是因为PD的细胞比AD愈加复杂(图5)。 换句话说,在职何的AD或PD神经元类群的峰值区域中均未发现SNPs的显贵富集。 【补充: 连锁对抗衡 (linkage disequilibrium,简称LD)是指分属两个或两个以上基因座位的等位基因同期出当今一条染色体上的几率,高于惟恐出现的频率。HLA不同基因座位的各等位基因在东谈主群中以一定的频率出现。浅易地说,唯一两个基因不是完满独随即遗传,就会透透露某种进程的连锁。这种情况就叫连锁对抗衡。连锁对抗衡不错是并吞条染色体上的不同区域,也不错是不同染色体上的。】因此, 鉴于上述成果,作家想进一步接洽每个GWAS位点的靶基因。 为此,作家使用HiChIP标记乙酰化组卵白H3赖氨酸27(即H3K27ac),来标记活性的增强子和首先子,从而来画图以增强子为中心的染色质三维构象。数据分析详情了各脑区的共833975个染色质三维交互;67.4%的交互有ATAC-seq峰值出当今两个信号锚定序列,29.2%有ATAC-seq峰值出当今一个信号锚定序列,剩余的3.4%则无ATAC-seq峰值的相通。 这些数据标明:scATAC-seq不错精确定位GWAS多态性的细胞靶点,从而让GWAS SNPs与卑劣靶基因关系联起来。 【补充:信号锚定序列指穿膜卵白中的一种特有的信号序列,其作用是将这些卵白质锚定在脂双层膜上。连锁对抗衡是指分属两个或两个以上基因座位的等位基因同期出当今一条染色体上的几率,高于惟恐出现的频率】 图6 驾驭多档次的多组步调(左)和机械学习(右)来接洽功能性的非编码GWAS多态性(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168) 图7 驾驭多档次的多组步和谐机械学习来接洽AD和PD中的功能性非编码GWAS多态性 (图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168) 为了进一步评释GWAS多态性的功能效应, 率先作家构建了一个AD和PD疾病关系的SNPs库,共9707个SNPs,其中3245个SNPs散播在与AD关系的44个基因座上,6496个则散播在与PD关系的86个基因座上,其中34个SNPs出当今两种疾病的并吞个基因座上。然后作家开发了一种多档次的多组步调来权衡功能性的非编码GWAS多态性: 先将这些SNPs与ATAC-Seq的染色质可及性峰值进行相通分析(Tier3),再毅力出可能影响调控相互作用的SNPs(Tier2),终末毅力出可能胜仗影响转录因子勾通的SNPs(Tier1) (图6-7) ;并驾驭了提拔向量机和等位基因对抗衡分析,最终详情了可能参与AD和PD的基因和分子经由,以及那些参与非编码调控的GWAS位点。 这些也证明多档次的多组步调省略权衡功能性的非编码SNPs。 【补充:提拔向量机(Support Vector Machine,SVM)是一类按监督学习(supervised learning)阵势对数据进行二元分类的广义线性分类器(generalized linear classifier),其决议鸿沟是对学习样本求解的最大边距超平面(maximum-margin hyperplane)。SVM使用搭钮死亡函数(hinge loss)打算涵养风险并在求解系统中加入了正则化项以优化结构风险,是一个具有稀少性和得当性的分类器。SVM不错通过核步调(kernel method)进行非线性分类,是常见的核学习步调之一 。】 图8 AD和PD中PICALM(左)、SLC24A(右)的功能性非编码SNPs分析(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168)紧接着,作家重心眷注了SNPs仍然未知的疾病关系基因、以及当年接洽中的与疾病病原学无关的基因。尽管GWAS标明PICALM、SLC24A、BIN1、KCNIP3等基因与AD辩论,然尚不廓清是哪些多态性驱导致了这种关系。率先以PICALM为例,作家发现,存在一种潜在的功能性变异,该变异扰乱了FOS/AP1因子勾通位点,且这个位点位于PICALM上游的一段突胶质细胞特异性的调控元件序列;且该突变有显着的等位基因对抗衡,即连锁对抗衡,与PICALM和EED均显露三维交互(EED属于参与保管防止转录情景的多梳族眷属成员之一)(图8)。这一成果则标明了PICALM基因的新功能、过火在少突胶质细胞中的止境作用。肖似的,作家发现,SLC24A4基因座也有一个小的连锁对抗衡区域,包含46个SNPs,且SNPs皆位于SLC24A4的内含子内。其中有一个SNPs比较止境,具有小胶质细胞特异性,它会扰乱SPI1基序,并与RIN3基因的首先子进行“信息调换”;这与RIN3在胞吞通路中的作用是一致的,而胞吞通路对AD中小胶质细胞的正常功能至关迫切(图8)。此外,作家也发现,KCNIP3中有94个SNPs。其中一个变异不错破损少突细胞特异性SOX6的基序,该基序参与髓鞘的发生和功能;另外有一个变异位于KCNIP3内含子中,有神经元特异性,并与该基因的首先子有显着的相互作用。总之,这些数据辅导了SNPs具有AD中少突胶质细胞和神经元的特异性功能,以及功能性非编码SNPs的复杂性(图9)。 图9 AD和PD中ITIH1(左)、 KCNIP3 (右)的功能性非编码SNPs分析(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168 MAPT 基因编码tau卵白,在AD中,tau的格外磷酸化会造成神经原纤维缠结。尽管 MAPT 与PD风险有很强的关系性,然而基因位点如安在PD中发 挥作用仍不廓清。作家发现,MAPT有一段很大的连锁对抗衡区域,且其有两个不同的单倍型,即H1和H2,二者皆有跳跃2000个的SNPs,且在MAPT中的有近1800000个核苷酸的颠倒 (图10) 。【单倍型,又称单倍体型或单位型,指个体组织中,完满遗传自父母两边中一个亲本的一组等位基因,即位于染色体上某一区域的一组关系联的SNP等位位点。】 图10 MAPT基因座、核苷酸颠倒、H1和H2单倍体(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168) 同期,作家画图了MAPT位点的染色质可及性单倍体特异性图谱和三维染色质交互图谱,并从杂合子的H1/H2中剥离出纯合子的H1/H1和H2/H2,从而来探究两个单倍体的功能异同。作家发现, MAPT首先子的上游有一段H1特异性的调控元件序列,以及MAPT的卑劣包含KANSL1基因的首先子序列;MAPT上游的H1特异性调控元件与MAPT内含子的第二个调控元件以及与MAPT首先子的相互作用增强 ( 图10-11) 。 此外,作家也发现, MAPT上游的区域鸿沟与KANSL1首先子周围区域之间的H2特异性三维相互作用 (图 10-11) 。图11 MAPT基因座的HiChIP(上)、大ATAC-Seq(中),以及 MAPT的皮层基因抒发分析 (图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168) 终末,作家探究了这些表不雅遗传变化如何影响单倍型特异性的基因抒发。 发现,在 MAPT 基因抒发方面,两个单倍体有显着的各别,这种基因各别可能辅导了 MAPT 单倍型所介导的病感性作用。 这些数据分析发达了H1和H2单倍型之间的MAPT碱基颠倒区域的基因组序列是如何不同的;或换言之,通过改革MAPT基因序列的标的,这种碱基颠倒可能会改革基因的抒发 (图 10-11) 。 作家果然也发现, 在位于MAPT上游有一段神经元特异性的调控元件基序,且在单倍体H1中,该元件基序会增强与MAPT首先子的相互作用。 图12 对MAPT基因座的HiChIP(上)、scATAC-Seq(中)、核苷酸颠倒(下)的数据分析 (图片引自:Corces, M.R., et al.. Nat Genet 2020; 52: 1158–1168) 著作论断 接洽标明了AD和PD中遗传性非编码变异(即SNPs)作用的高分辨率表不雅遗传学表征,拓展了咱们对AD和PD遗传变异的长入,并为神经退行性疾病和其他复杂遗传疾病的非编码变异的表不雅基因组接洽提供了参考。 多档次多组学拿获技能不错匡助咱们通过染色质可及性峰值相通来探究来影响基因抒发的多态性,并不错通过三维染色质相互作用来反映基因靶标的多态性,从而来接洽这些变异的功能,而且接收机器学习的步调不错匡助权衡或长入多态性如何扰乱转录因子勾通。 鉴于上述步调的上风,比较较以往的接洽,本文中,作家探究了AD和PD中更多的基因表型、以及非编码变异的功能。空洞分析也标明MAPT基因位点在AD和PD中的表不雅遗传学特质,从而加深看咱们对AD和PD的非编码变异的长入。 更广泛地说,这项职责提供了一种系统的步调来长入疾病中的遗传变异,也为新挽救靶点提供了接洽念念路和技能。 论文连气儿: https://doi.org/10.1038/s41588-020-00721-x 参考文件: 1、Kunkle, B. W. et al. Genetic meta-analysis of diagnosed Alzheimer’s disease identifies new risk loci and implicates Aβ, tau, immunity and lipid processing. Nat. Genet. 51, 414–430 (2019). 2、Nalls, M. A. et al. Identification of novel risk loci, causal insights, and heritable risk for Parkinson’s disease: a meta-analysis of genome-wide association studies. Lancet Neurol. 18, 1091–1102 (2019). 3、Gallagher, M. D. & Chen-Plotkin, A. S. The post-GWAS era: from association to function. Am. J. Hum. Genet. 102, 717–730 (2018). 4、Nott, A. et al. Brain cell type-specific enhancer–promoter interactome maps and disease-risk association. Science 366, 1134–1139 (2019). 5、Jason D Buenrostro, et al., Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA. Nat Methods. 10 1213–1218 (2013). 6、Trevino, A. E. et al. Chromatin accessibility dynamics in a model of human forebrain development. Science 367, eaay1645 (2020). 7、Corces, M. R. et al. An improved ATAC-seq protocol reduces background and enables interrogation of frozen tissues. Nat. Methods 14, 959–962 (2017).
相关资讯