论文部分内容阅读
摘 要:TCF4基因在人脑海马体中高表达,该基因与人类智力水平和大脑疾病直接相关。我们采用生物信息学方法,通过进化树得出人类的TCF4基因与大猩猩、黑猩猩等灵长类同源,但人类TCF4基因产生许多氨基酸的替换,最终使人类逐渐进化为高智慧生命。通过SNP分析我们发现黄种人具有智力优势。对基因蛋白互作分析,我们找到两条与智力发育有关的通路TLE1—TCF4—LEF和ATOH1—TCF4—ID2—UBC影响智力发育。
关键词:进化生物学;TCF4;进化树;SNP
1 前言
人类经过约440万年,经历了猿类——南方古猿——能人——智人——现代人的演化。在此演化过程中人类的脑容量、智力水平显著提高,成为当今地球上的高级智慧生命。2015年9月21日,Michael等人宣布他们确认了与人类认知与智力有关的两类基因群M1和M3影响了我们的认知力。通过阅读文献,分析文献中数据,我们筛选到与智力低下有关的TCF4基因。
2 TCF4基因分析
2.1 分子进化分析
于NCBI UniGene数据库中检索Human TCF4,得到非冗余数据。并下载已有物种的TCF4氨基酸序列的FASTA文件。用Mega7做出有/无标示尺度的进化树。
对有标示尺度进化树分析,人类的TCF4与大猩猩、黑猩猩等同源。且人类与黑猩猩,大猩猩之间相隔数万年产生进化分支。对无标示尺度进化树分析,人类的聚类结果左上方節点的自支持率为0。进化树是以数学聚类分析为基础外加生物学条件约束而产生的,因此,尽管在氨基酸序列分析中人类和穴居人、鸭嘴兽的氨基酸序列得分值相似,但考虑到生物学条件,这个结果置信度低,所以不能将其归为一类,而应视作两个类型。所以,从氨基酸替换数目的进化树来看,人类分为一个独立分支。
2.2 SNP分析
做完TCF4蛋白的进化树后,我们继而研究TCF4在不同人种中的差异表达。因为,从宏观数据知,微软研究型员工中黄种人比例超过2/3,每年的奥林匹克数学、物理等竞赛中黄种人成绩遥遥领先。所以,我们猜想TCF4基因在不同人种中差异表达,继而导致不同的人种智力水平差异。
于NCBI数据库中找到了人类TCF4基因的组织差异表达。分析发现,TCF4在大脑中表达量最高,且SD值也很大。说明TCF4基因的确存在较大的差异表达。
为了深入挖掘TCF4在不同人种中的遗传信息,我们决定做该基因的SNP分析,并建立遗传多态信息与人类疾病的联系。利用EMBL数据库获取了当前人类TCF4基因最全面的SNP信息。为了更全面地分析TCF4上的SNP对人类疾病的影响,我们从Ensembl中下载了大量的表型数据,导入R,绘制Manhattan图。
通过曼哈顿分析,7个SNP对人类大脑急病有显著影响。上图4显示了目前已经确定的SNP结果,我们的目的在于找出能够产生错义突变。因为这些突变结果有较大可能产生疾病,如智力障碍,抑郁等。通过筛选,选择红线以上的部分SNP。我们挖掘出四个错义突变SNP,从达尔文的进化论角度分析,劣势物种在自然选择中被淘汰,而错义突变产生的遗传多态性使个体智力水平低,在生存中处于劣势。故错义突变SNP的致病等位基因频率非常低。我们选择rs143244149(rs14)和rs13987625(rs13)作为主要研究对象。结合Population数据库做出了二者在不同人种中的分布。
对于rs13,我们发现东亚、欧洲、美洲人种中,均不存在错义突变SNP,而美国黑人,非洲人种这些黑人人种中分别存在0.1%和0.4%的错义突变SNP,即黑人人种中有相对较大的可能性患有智力障碍症。另外,对于rs14仅存在于美洲,且美国白人人种有0.2%的错义突变率。这也说明白人人种有相对较大的可能性患有智力障碍症,或者这两个错义突变对黑人人种与白人人种的智力有负影响。那么,黄种人相对聪明也是有生物学依据的。
2.3 基因蛋白互作通路分析
通过文献追踪,我们得到TCF4基因参与的基因蛋白互作通路TLE1—TCF4—LEF
TLE1合成转录阻遏物,结合多个转录因子,抑制NF-κB基因表达(该基产物与NF-kB结合抑制NF-kB活性),当NF-kB基因被抑制后,NF-kB被激活,进入细胞核,激活有关基因表达,促进细胞分裂。同时在CTNNB1基因介导下,LEF/TCF基因协同作用参与Wnt信号通路,帮助大脑的海马回形成,发育。
ATOH1—TCF4—ID2—UBC
该通路多发生与胚胎时期,ATOH1转录翻译形成转录调节因子激活TCF4基因的表达,TCF4合成转录因子4后与转录调节因子共同激活E-box,从而激活神经发育的负调控机制。该机制是自主神经元正常发生的条件。转录因子4同时激活ID2基因,ID2基因激活后合成抑制因子,抑制基因的过量表达。最后TCF4、抑制因子经过泛素化途径降解。
3 结论
TCF4基因对人类智力水平有显著影响,该基因突变易患智力低下症;.进化上TCF4基因编码的转录因子4在各个物种中存在差异,其中人类的转录因子4与黑猩猩,大猩猩具有同源性,但是因为人类转录因子4发生了较大程度的氨基酸替换使得人类的转录因子4不同于其他物种,这是人类成为高智慧物种的一个重要原因;在SNP表型数据方面,不同人种中TCF4基因的SNP分部比例不同,其中黑人人种中错义突变的SNP比例较高,黄种人较低,说明黄种人在智力方面更具有优势;在通路方面TCF4基因主要参与了TLE1—TCF4—LEF和ATOH—TCF4—ID2—UBC从而参与智力的调节。
参考文献:
[1]Johnson MR,Shkura K,Langley SR,Delahaye-Duriez A,Srivastava P.Systems genetics identifies a convergent gene network for cognition and neurodevelopmental disease.Nat Neurosci,2016,19(2):223-232.
[2]Jayanth V Chodaparambil,Kira T Pate,et.Molecular functions of the TLE tetramerization domain in Wnt target gene repression.EMBO Journal,2014,33:719-731.
[3]Hassina Benchabane,Nan Xin,et.Jerky/Earthbound facilitates cell-specific Wnt/Wingless signalling by modulating b-catenin-TCF activity.The EMBO Journal,2011,30:1444-1458.
[4]http://asia.ensembl.org/Homo_sapiens/Variation/Population?db=core;r=18:55227800-55228800;v=rs8766;vdb=variation;vf=8348.
[5]https://www.ncbi.nlm.nih.gov/unigene/?term=Human TCF4
作者简介:
熊东彦,就读于东北农业大学生命科学学院,研究方向为生物信息学。
关键词:进化生物学;TCF4;进化树;SNP
1 前言
人类经过约440万年,经历了猿类——南方古猿——能人——智人——现代人的演化。在此演化过程中人类的脑容量、智力水平显著提高,成为当今地球上的高级智慧生命。2015年9月21日,Michael等人宣布他们确认了与人类认知与智力有关的两类基因群M1和M3影响了我们的认知力。通过阅读文献,分析文献中数据,我们筛选到与智力低下有关的TCF4基因。
2 TCF4基因分析
2.1 分子进化分析
于NCBI UniGene数据库中检索Human TCF4,得到非冗余数据。并下载已有物种的TCF4氨基酸序列的FASTA文件。用Mega7做出有/无标示尺度的进化树。
对有标示尺度进化树分析,人类的TCF4与大猩猩、黑猩猩等同源。且人类与黑猩猩,大猩猩之间相隔数万年产生进化分支。对无标示尺度进化树分析,人类的聚类结果左上方節点的自支持率为0。进化树是以数学聚类分析为基础外加生物学条件约束而产生的,因此,尽管在氨基酸序列分析中人类和穴居人、鸭嘴兽的氨基酸序列得分值相似,但考虑到生物学条件,这个结果置信度低,所以不能将其归为一类,而应视作两个类型。所以,从氨基酸替换数目的进化树来看,人类分为一个独立分支。
2.2 SNP分析
做完TCF4蛋白的进化树后,我们继而研究TCF4在不同人种中的差异表达。因为,从宏观数据知,微软研究型员工中黄种人比例超过2/3,每年的奥林匹克数学、物理等竞赛中黄种人成绩遥遥领先。所以,我们猜想TCF4基因在不同人种中差异表达,继而导致不同的人种智力水平差异。
于NCBI数据库中找到了人类TCF4基因的组织差异表达。分析发现,TCF4在大脑中表达量最高,且SD值也很大。说明TCF4基因的确存在较大的差异表达。
为了深入挖掘TCF4在不同人种中的遗传信息,我们决定做该基因的SNP分析,并建立遗传多态信息与人类疾病的联系。利用EMBL数据库获取了当前人类TCF4基因最全面的SNP信息。为了更全面地分析TCF4上的SNP对人类疾病的影响,我们从Ensembl中下载了大量的表型数据,导入R,绘制Manhattan图。
通过曼哈顿分析,7个SNP对人类大脑急病有显著影响。上图4显示了目前已经确定的SNP结果,我们的目的在于找出能够产生错义突变。因为这些突变结果有较大可能产生疾病,如智力障碍,抑郁等。通过筛选,选择红线以上的部分SNP。我们挖掘出四个错义突变SNP,从达尔文的进化论角度分析,劣势物种在自然选择中被淘汰,而错义突变产生的遗传多态性使个体智力水平低,在生存中处于劣势。故错义突变SNP的致病等位基因频率非常低。我们选择rs143244149(rs14)和rs13987625(rs13)作为主要研究对象。结合Population数据库做出了二者在不同人种中的分布。
对于rs13,我们发现东亚、欧洲、美洲人种中,均不存在错义突变SNP,而美国黑人,非洲人种这些黑人人种中分别存在0.1%和0.4%的错义突变SNP,即黑人人种中有相对较大的可能性患有智力障碍症。另外,对于rs14仅存在于美洲,且美国白人人种有0.2%的错义突变率。这也说明白人人种有相对较大的可能性患有智力障碍症,或者这两个错义突变对黑人人种与白人人种的智力有负影响。那么,黄种人相对聪明也是有生物学依据的。
2.3 基因蛋白互作通路分析
通过文献追踪,我们得到TCF4基因参与的基因蛋白互作通路TLE1—TCF4—LEF
TLE1合成转录阻遏物,结合多个转录因子,抑制NF-κB基因表达(该基产物与NF-kB结合抑制NF-kB活性),当NF-kB基因被抑制后,NF-kB被激活,进入细胞核,激活有关基因表达,促进细胞分裂。同时在CTNNB1基因介导下,LEF/TCF基因协同作用参与Wnt信号通路,帮助大脑的海马回形成,发育。
ATOH1—TCF4—ID2—UBC
该通路多发生与胚胎时期,ATOH1转录翻译形成转录调节因子激活TCF4基因的表达,TCF4合成转录因子4后与转录调节因子共同激活E-box,从而激活神经发育的负调控机制。该机制是自主神经元正常发生的条件。转录因子4同时激活ID2基因,ID2基因激活后合成抑制因子,抑制基因的过量表达。最后TCF4、抑制因子经过泛素化途径降解。
3 结论
TCF4基因对人类智力水平有显著影响,该基因突变易患智力低下症;.进化上TCF4基因编码的转录因子4在各个物种中存在差异,其中人类的转录因子4与黑猩猩,大猩猩具有同源性,但是因为人类转录因子4发生了较大程度的氨基酸替换使得人类的转录因子4不同于其他物种,这是人类成为高智慧物种的一个重要原因;在SNP表型数据方面,不同人种中TCF4基因的SNP分部比例不同,其中黑人人种中错义突变的SNP比例较高,黄种人较低,说明黄种人在智力方面更具有优势;在通路方面TCF4基因主要参与了TLE1—TCF4—LEF和ATOH—TCF4—ID2—UBC从而参与智力的调节。
参考文献:
[1]Johnson MR,Shkura K,Langley SR,Delahaye-Duriez A,Srivastava P.Systems genetics identifies a convergent gene network for cognition and neurodevelopmental disease.Nat Neurosci,2016,19(2):223-232.
[2]Jayanth V Chodaparambil,Kira T Pate,et.Molecular functions of the TLE tetramerization domain in Wnt target gene repression.EMBO Journal,2014,33:719-731.
[3]Hassina Benchabane,Nan Xin,et.Jerky/Earthbound facilitates cell-specific Wnt/Wingless signalling by modulating b-catenin-TCF activity.The EMBO Journal,2011,30:1444-1458.
[4]http://asia.ensembl.org/Homo_sapiens/Variation/Population?db=core;r=18:55227800-55228800;v=rs8766;vdb=variation;vf=8348.
[5]https://www.ncbi.nlm.nih.gov/unigene/?term=Human TCF4
作者简介:
熊东彦,就读于东北农业大学生命科学学院,研究方向为生物信息学。