基因组GC含量与碱基、密码子和氨基酸使用偏好的关系

来源 :电子科技大学 | 被引量 : 9次 | 上传用户:tszhzhc159
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术的发展,大量的微生物基因组数据被发布在公用数据库中。这使得用比较分析法挖掘序列的规则或新的序列模式更加方便。在这些基因组的研究中,基因组GC含量对核苷酸和氨基酸组成的影响引起了特别的注意。先前的工作已经表明不同物种DNA双链中的GC含量有很大差异。在真核生物中,基因组GC的含量变化范围比较小,大约从30%到50%,而在原核生物中的基因组GC含量变化范围比较大,大约从25%到75%。这篇文章总共对目前已测序的所有原核生物,即来自不同物种的2670株细菌和古细菌的基因组进行分析。这些原核生物的基因组GC含量变化范围从14%至75%,比之前报道的范围要广。文章主要分析了基因组GC含量和碱基、密码子和氨基酸使用偏好的关系,包括以下几项工作内容:第一,我们分析了整个基因组中密码子三个位点上的碱基使用频率、密码子使用频率和氨基酸使用频率分别对应的距离,即碱基距离、密码子距离和氨基酸距离,以及这些距离和基因组GC含量的关系,通过热图的方式直观的表现出来,并计算了碱基距离、密码子距离和氨基酸距离与基因组GC含量差值之间的线性关系;我们列举了个别GC含量少的碱基、密码子和氨基酸作为例子,针对整个已测序的原核生物对基因组GC含量和碱基频率、密码子频率和氨基酸频率的关系做了验证工作,证明其存在线性关系。第二,对于基因组GC含量和基因组长度关系,我们从不同的系统发育谱系角度进行了分析;同时,我们将原核生物数据分别按照基因组GC含量和所属门类进行分组分析,对比研究这两组的结果表明,基因组GC含量对碱基、密码子和氨基酸的使用偏好的影响比系统发育更大;而对基因组GC含量和t RNA基因的使用频率做了线性分析结果表明,基因组GC含量对氨基酸使用偏好的影响更多的是直接作用于碱基序列,而不是转录过程。最后,提供了数据预处理小工具,使得即使数据更新迅速,文中大量的数据提取工作在后期继续分析的重复使用时得到简化,提高效率。总而言之,在这篇文章中,我们通过之前未用过的热图法分析了基因组GC含量对碱基、密码子和氨基酸使用偏好的影响,并分析讨论了这个影响力的作用强度和作用渠道。
其他文献
本文首先对国内外海水入侵问题研究方法和现状进行概括,针对研究区所在地大连近几年来海水入侵研究现状进行总结,进而提出本研究课题的内容及方法。论文详细分析了大连市海水
平顺县地处太行山东南端。境内群山起伏,沟壑纵横,地形复杂,海拔高低悬殊,最高处靖林山主峰风泽岭1876.3米,而北部河谷仅380米,气候差异很大,为各种植物生长提供了条件,仅查
论文旨在研究社会变革和养老金体系之间的关系。无论男性还是女性,有偿工作决定了他们的养老金水平。因此,在女性较早进入劳动力市场的欧洲国家,老年女性得到的保护程度较高
本文依托国家自然基金项目“湖泊沉积物营养释放对水华藻类种群演替的作用”(20507017),调研选取人工湖泊玉渊潭以及天然湖泊太湖为研究对象,研究玉渊潭水体与沉积物中营养物质
本文通过放射性生态环境调查,在全省范围内划分出七片高背景区,依据高背景区的成因及目前生态环境现状,结合我省"十一五"发展规划,提出对国民经济发展的影响及放射性生态环境
研究生素质教育是研究生教育改革的必然,与其它素质教育既有联系也有明显区别;它更注重受教育者(研究生)的科研素质和超越素质的培养。因此,不论是把它当作教育思想还是看作教育类
多环芳烃(Polvcyclic Aromatic Hydrocarbons, PAHs)是环境中普遍存在的一类有机污染物。在多环芳烃中,菲属于较简单的一类低分子量PAHs,除存在于石油外,大多来自焦炭不完全燃烧以
乌鲁木齐县保护地快菜以其投入低、种植简单、生长周期短、病虫害少、见效快等优点,受到广大种植户的认可,种植面积逐年扩大。本文总结出快菜的种植与管理技术,以供种植户参
把握苏州市成立全国惟一的"国家历史文化名城保护示范区"这一机遇,《苏州历史文化名城保护规划(2013-2030)》提出以全面的名城保护观为指导思想,在古城构建以公共交通和慢行