论文部分内容阅读
脊髓小脑共济失调3型(SCA3)是常染色体显性遗传的神经退行性疾病,该疾病是因SCA3基因编码区存在大于47个由CAG编码的谷氨酰胺串联重复引起的。以往的绝大部分研究都关注CAG重复扩展后如何导致疾病,但很少有研究解释疾病基因中CAG重复作为一种蛋白质简单重复序列(SSRs)发生扩展的详细机制。本研究针对SCA3中分子致病基础--CAG重复序列,进行了广泛的进化遗传学和群体遗传学分析。从物种间大进化层面的比较到人群中小进化层面的剖析,探寻CAG重复发生扩展的影响因素,为揭示SCA3的分子致病机理和CAG重复的生物学功能提供新的线索和证据。首先,本研究运用进化遗传学和比较基因组学的方法对脊椎动物特别是与人类亲缘最近的灵长目物种的SCA3同源基因的CAG重复区域进行了进化模式分析;其次,进一步比较了SCAs各亚型的CAG重复区域的种间进化模式的异同;最后,选定了CAG重复两侧的一系列SNP构成的单倍型顺式作用元件,研究了其在中国不同地域和民族的健康随机人群中对CAG重复分布频率、重复长度变异方向以及CAG重复和SCA3上下游的其他SSRs位点的杂合性等方面的影响。
本研究结果显示SCA3是古老的功能基因,SCA3的功能结构域在脊椎动物进化过程中因功能保守而受到纯化选择;SCA3的CAG重复区域在脊椎动物进化过程中变异丰富,是该基因内部在进化过程中受到正选择的区段,其编码氨基酸polyQ属于未结构化蛋白(IUPs)肽段,在蛋白结构上有着极大的易变性。此结果为polyQ功能的研究提供了基础和线索。
本研究通过物种的大进化研究,发现脊椎动物SCA3的CAG重复区域,从高等哺乳动物开始出现大于6个连续谷氨酰胺重复的一般定义上的polyQ结构,并呈现物种特异性的演化特征;劳亚兽总目的一些物种和灵长目一样具有较长的完全polyQ重复,且在哺乳动物的进化过程中重复数目没有线性增长趋势;其中灵长目SCA3中CAG重复区域在进化过程中逐步固定形成了人类中的形式,特别是类人猿中的重复序列有着相似的结构模式。脊椎动物尤其是灵长目CAG重复进化规律的解析解答了polyQ结构发生发展的问题,为polyQ功能进化的研究提供了基础。同时还发现CAG重复的进化模式呈现出多种突变模型共同存在的特性。在进化关系较远的物种之间较符合平衡模型和无限等位模型,而在亲缘关系近的物种之间则更接近逐步突变模型。此结果丰富了功能性SSR突变模型的内容。另外,SCAs各亚型致病基因在CAG重复的数目、起源、结构、侧翼序列特征等进化模式方面存在着显著的差异,但在灵长目物种中,SCAs的某些亚型基因之间,其polyQ区域存在着重复长度、打断氨基酸类型和进化趋势上的共性。此结果提示应该更多地关注PolyQ病症各致病基因polyQ结构的特性。
本研究通过人群的微进化研究,发现中国人群SCA3基因CAG重复侧翼区域内不同单倍型与CAG重复的不同长度范围和稳定性之间有强关联性:GCGGCA单倍型与13-24个较短CAG重复相关,且该单倍型下超过90%的CAG等位基因为14个重复长度,连锁的SSRs纯合性增加,此现象在其他种族人群中不存在;另一种与疾病相关的TTACAC单倍型在中国人群研究中与24-45个较长CAG范围相关,同时在此单倍型下,CAG重复等位变异跨度最大、重复数目变长、并且SSRs杂合性增加。此结果揭示了中国人群特殊的CAG重复突变机制,对CAG扩展突变发生的因为有重要提示作用。
我们的研究首次系统全面地从物种大进化和人群微进化两个方面阐述了SCA3基因中CAG重复区域的进化模式和突变机制。就人类而言,在SCA3的CAG重复区域不存在导致疾病的有别于类人猿的特殊分子基础,进一步的研究应该关注人类CAG重复区域与其他区域的内在联系。中国人群的研究结果显示SCA3基因CAG重复序列不稳定性明显与其周围DNA序列碱基多态性的顺式作用元件有关。特异顺式作用元件的有无与SCA3中CAG重复发生数目变异的程度直接相关,该发现为进一步的基因功能和疾病发病机制的研究提供了重要线索。同时,不同种族中存在的这种顺式作用元件影响的差异性提示我们:在SCA3基因功能和疾病发病机理研究中应该更多地关注人群异质性所导致的表型不同与基因型之间的关联性。