CG类8-mer在六个物种基因不同功能位点区域上的分布规律

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:huyuxuan0601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
每个基因组序列k-mer频谱是确定的,不同基因组序列的k-mer频谱各不相同.研究k-mer频谱的内在使用规律可以帮助我们更好的理解基因组序列结构、各类k-mer在功能序列上的分布特征以及所反映的生物学功能.前期工作研究了不同物种基因组序列8-mer频谱的分布规律.除了极个别物种外,发现8-mer频谱存在独立选择定律,即三种CG类(0CG、1CG和2CG)8-mers是各自独立进化的,任何DNA序列均是由这三种CG类模体组合而成的.基于独立选择定律,本文以人类、斑马鱼、拟南芥、水稻、蚊子和蜜蜂这六个物种基因的转录起始位点、转录终止位点、翻译起始位点、翻译终止位点、内含子与外显子结合处以及外显子与内含子结合处这六个功能位点区域的序列为目标序列,分析各个功能位点区域上三种CG类8-mer频谱的分布和8-mer相对频率的位置分布,以及三种CG类8-mer中x-mer(x=3,4)的使用差异,探讨CG类模体在基因不同功能位点区域上的分布规律与物种进化之间的关系.  首先,给出了三种CG类8-mer在六个功能位点区域上的8-mer频谱,发现人类、斑马鱼、拟南芥和水稻的三种CG类8-mer频谱仍然遵守独立选择定律,蚊子和蜜蜂三种CG类8-mer频谱不遵守独立选择定律.其次,计算了六个功能位点区域上三种CG类8-mer频谱分布的最概然频次与随机中心频次的相对距离.发现人类、斑马鱼、拟南芥和水稻中的三种CG类8-mer频谱的相对位置出现进化分离现象(RD0>RD1>RD2),且分离程度与物种进化呈正相关关系.也就是说,随着物种进化水平的提高,三种CG类8-mer频谱分布之间的距离在逐渐变大.蚊子的三种CG类8-mer频谱位置的进化分离与前四个物种正好相反(RD0<RD1<RD2),蜜蜂的三种CG类8-mer频谱位置没有明显的分离现象.最后,计算了六个功能位点区域上三种CG类8-mer频谱分布的相对标准差RS.发现人类、斑马鱼、拟南芥和蜜蜂中的三种CG类8-mer频谱的相对标准差有明显的规律,即RS0<RS1<RS2,与全基因组一致.也就是说,1CG和2CG类8-mer使用频率的保守性明显高于0CG类8-mer.水稻和蚊子0CG和1CG模体的保守性关系仍有RS0<RS1.但水稻在六个功能位点区域上2CG模体的保守性低于1CG模体.蚊子的三种CG类模体的保守性没有明显差异.  探讨了三种CG类8-mer在基因六个不同功能位点区域上的分布.结果显示,三种CG类8-mer的分布在基因六个不同功能位点区域上均不相同,且呈现各自的分布特点.脊椎动物的分布相近,植物间的分布相近,蚊子和蜜蜂的分布更具多样性.转录起始位点的分布和翻译起始位点的分布有一定的相似性,转录终止位点的分布与翻译终止位点的分布相近,两个起始位点和两个终止位点的分布具有对称性质.外显子与内含子结合处和内含子与外显子结合处的分布是对称的.人类、斑马鱼、拟南芥和水稻三种CG类8-mer在基因两个起始和两个终止位点区域的分布随着物种的进化呈现出规律的变化.但六个物种在外显子和内含子结合区域呈现出相似的分布形式.蚊子和蜜蜂在两个起始和两个终止位点区域的分布与前四个物种的分布明显不同.  采用三种CG类8-mer中x-mer(x=3,4)的相对使用频率来表征CG类8-mer的信息得到新对称相对熵,计算了新对称相对熵在六个物种基因不同功能位点区域上的分布.结果显示,人类、斑马鱼、拟南芥和水稻的2CG类新对称相对熵的偏离程度最大,1CG次之,0CG的几乎没有偏离.表明1CG和2CG类8-mer信息是组成功能位点区域的主要信号模体,0CG模体构成了区域的背景.蚊子和蜜蜂较特殊,在六个功能位点区域上的分布都表现出了明显偏好性,且分布形状与前四个物种都不相同.蜜蜂的偏离程度最大,蚊子的偏离程度最小.  总之,人类、斑马鱼、拟南芥和水稻基因各个位点区域的序列构成遵守独立选择定律,六个功能位点上三种CG类8-mer分布各不相同,且分布形式与物种进化紧密相关.显示了含CG类模体是组成各类功能序列的核心模体,它们在功能位点区域的含量和分布差异决定了不同区域的功能差异.蜜蜂和蚊子不遵守独立选择规律,三种CG类8-mer在功能位点区域上有自己的特殊分布规律.独立选择定律为我们研究序列的结构提供了全新的思路,对于探讨序列与功能的关系具有重要的理论意义.
其他文献
学位
采用飞秒脉冲的饱和吸收光谱方法研究了GaAs/AlGaAs多量子阱中电子自旋的注入和弛豫特性,测得电子自旋极化弛豫时间为80ps.说明了电子自旋-轨道耦合相互作用引起局域磁场的随
量子信息是信息科学与量子力学相结合的新兴交叉学科,包括量子通信和量子计算两个重要方面.量子密集编码是量子通信的一个重要分支,其基本原理是通信双方共享处于最大纠缠态
利用四维地震数据间的差异来分析和描述地质目标体的属性变化,达到认识储层动态变化和寻找剩余油气的目的.四维地震也就是该文将要介绍的时移地震,就是三维空间加一维时间构
本文采用硝酸腐蚀银箔、铜箔得到一定粗糙度的活性衬底,置于简易样品池中,进行乙炔、乙烯、一氧化碳、氢气、甲烷和乙烷的表面增强喇曼光谱研究,探索一种新的诊断微量气体的方法
原题呈现rn“东方神童”魏永康,2岁就掌握1000多个汉字,4岁几乎学完小学课程,8岁进重点中学,17岁考入中科院硕博连读……竟因到北京读书后,生活完全无法自理,后来被中科院劝
期刊
信息技术的发展是人类社会发展的一个重要的组成部分,而材料科学的发展是信息技术发展的重要标志,电子管、半导体、到现在的非线性材料飞速发展无不标志着信息技术发展的重要
该文通过密度泛涵理论blyp/dnp对CH、新型碳化钪内掺富勒烯ScC@C以及CSi的几何结构和电子结构进行了系统研究.我们发现,ScC在C内是可以稳定存在的,只是内掺后碳笼的体积略有
随着超大规模集成电路中电子器件尺寸的减小和单位面积器件密度的增加,导致电子器件尺寸的收缩,金属导线变得更长和更窄了,电子电迁移电阻和电容就不能再忽视了。本文建立了一个
光子晶体的带隙结构是描述光子晶体的重要性能之一,也是光子晶体应用开发的基础.因此,对光子晶体的带隙结构及其光学传输特性的研究是对光子晶体进行基础性研究的重要内容,对