串联重复序列是人类基因组中数量最多的变异类型之一,天然具有多态性且在长度上高度不稳定。重复长度随世代传递扩增是一个公认的进程,这导致了许多人类疾病,主要累及中枢神经系统。迄今为止,已经发现了至少50种疾病与扩增位点相关,受以前方法学的限制,其中一半是在过去的10年间被发现的。现在广泛使用的分子学诊断方法(外显子或基因panel)仍旧存在限制,从而导致漏诊,尤其是对那些非常罕见和(或)临床上无法识别的疾病。大多数这些疾病是通过家系模式发现的,还有一些仍待确认。最近长读长测序技术的发展提供了一个独特的机会来系统性研究串联重复序列和动态突变在人类遗传疾病中的组成。在这篇综述中,作者总结了已有的和最新的关于动态突变疾病的遗传学知识以及这些疾病在病理生理机制的多样性,并概述了个性化治疗的前景。
重复长度随世代传递扩增是一个公认的进程,导致了至少50种已知疾病。最早发现的两个动态突变都位于chrX,于1991年被发现,分别为FMR1基因5`UTR区的CGG重复(导致脆性X综合征)和AR基因1号外显子的CAG重复(导致脊髓延髓肌肉萎缩症)。在接下来的10年出现了一股动态突变的发现浪潮,揭示了超过25种遗传性疾病的发病基础,其中大部分主要影响中枢神经系统。
如最初的发现所示,STR扩增主要有两种:影响编码区的扩增,主要导致蛋白质内异常的聚谷氨酰胺(ployQ,主要由CAG密码子编码)或聚丙氨酸(ployA,由GCN密码子编码),和影响基因非编码区的扩增。CAG三核苷酸重复扩增,包括亨廷顿舞蹈病,脊髓小脑共济失调1型(spinocerebellarataxias type 1,SCA1),SCA2,SCA3,SCA6,SCA7,SCA17和齿状核红核苍白球路易体萎缩症(dentatorubral-pallidoluysianatrophy,DRPLA)通常与含有该蛋白(或部分)的神经元核内蛋白包涵体相关,突变的蛋白(或部分)表现出polyQ延伸。这些包涵体的形成原因是异常的polyQ易于形成β片状结构导致分子间交叉β寡聚并形成不溶性纤维聚集体,这一机制通常被描述为蛋白水平的毒性功能获得。PolyA多肽也能形成β片状结构,但是polyA扩增通常比polyQ小,具有可变效应,可能导致功能获得或缺失,取决于发生突变的基因和蛋白质。
非编码区的动态突变更加多样化,其影响很大程度上取决于基因内重复的类型,长度和位置。它们可能出现在基因的5`UTR,内含子和3`UTR中。位于5`UTR,启动子或其它调节区域的动态突变通常富含GC,如FMR1中的三核苷酸重复(CGG),CSTB中的十二核苷酸重复(CCCCGCCCCGCG)和C9ORF72中的六核苷酸重复(GGGGCC)。大型且通常GC丰富的5`端调控区的动态突变通常(但不是全部)与相应等位基因的高甲基化和基因沉默相关,例如引起脆性X综合征的全突变(>200个拷贝)。内含子区的动态突变大多数是最近才被描述与疾病相关的,涉及不同的长度模体(主要是三,四,五或六核苷酸重复)和GC含量。与疾病相关的3`UTR的动态突变只有2个,分别是强直性肌营养不良1型(DM1)(DMPK 3`UTR区的CTG重复)和SCA8(ATXN8OS 3`UTR区的CTG/CAG重复)。值得注意的是,非编码区,尤其是内含子区的动态突变通过各种不同的机制发挥作用,其中大多数为显性遗传,尽管在一些情况下是隐性的,通常是由于扩增导致基因功能丧失。
尽管在1991-2003年,动态突变被认为是人类疾病的一个重要来源,在接下来的5年中没有更多动态突变疾病被发现。在2011年,一个显性遗传的C9ORF72基因中的六核苷酸重复被发现重新引起了一些寻找动态突变疾病的兴趣,这个位点是在2006年于一个大家系中通过连锁分析定位的。但是外显子测序作为最流行的疾病基因检定策略,仍旧限制了动态突变的发现。
事实上,由于串联重复序列(tandem repeats,TRs)的重复性和在人类基因组中大量存在,在全基因组范围内研究TRs非常困难,在很长一段时间内都被RepeatMasker等生物信息学工具所掩盖。包含重复序列的短读长通常被定位到基因组的多个区域,因此被裁剪或丢弃。此外,精确的调用由相同重复序列的多个拷贝组成的多态等位基因的基因型是一个计算上的挑战。因此通常的二代测序流程中不包含TRs的分析,在检测SNP/indel和结构/拷贝数变异之外,还需要特定的工具。现在已经开发了一些专门评估基因组(或外显子组)数据中的拷贝数的生物信息学工具,包括 LobSTR, HipSTR,TREDPARSE,ExpansionHunter,STRetch,GangSTR和exSTRa。但是,到最近为止,这些工具中的大多数只能在特定的基因座上调用特定模式的基因型。最近TRhist和 ExpansionHunter DeNovo的开发改变了这一状况,它们可以在全基因组范围内评估动态突变的存在。但是,没有连锁分析数据或先验假设的基于短读长测序分析动态突变模式仍旧是一个挑战,因为动态突变有诸多可能出现的模式,在人类基因组中数量巨大,并且很难明确区分致病性动态突变和正常的多态性等位基因。因此TRs扩增很可能构成了一个巨大的未开发的致病性变异库。最近的一项研究分析了17231名自闭症谱系障碍患者的串联重复,结果表明,超过2500个基因座的重复扩增总和可能贡献了自闭症风险的2.6%,但统计分析无法区分潜在的高外显率动态突变和多基因低外显率风险因素。
文章来源网络
Scan, pay close attention to us
Scan, focus on weibo
Guangdong ICP for 14058608-5 with Copyright @ 2023 guangzhou exhibition service co., LTD. All rights reserved
Technical support:联享品牌网站建设