基于复杂网络特征的DNA和蛋白质序列相似性分析

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:TNicholas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术的发展,特别人类基因组计划和千人基因组计划的完成,人类积累了大量的DNA和蛋白质序列数据。分析和理解这些DNA序列和蛋白质序列的特征、功能、结构和物种进化是目前生物学家承待解决的问题,也是一项极具挑战性的工作。本文从一个全新的角度研究DNA和蛋白质序列的相似性,即序列的进化特征。利用DNA和蛋白质顺式序列构造复杂网络,利用复杂网络特征研究DNA和蛋白质序列的相似性。对于DNA序列,借鉴生物学的中心法则的思想为DNA序列构造5种复杂网络。选择9个物种的线粒体DNA序列为例,利用每个网络的特征为9个物种的线粒体DNA序列构造向量,根据欧几里德距离和向量夹角余弦作为度量构造相似性矩阵,利用相似性矩阵构建系统发育树。由此产生的9个种物种之间的系统发育树表示的物种之间的亲缘关系与实际情况一致。然后对构造的5种复杂网络中的部分复杂网络的全局特征基于向量的欧几里德距离或向量夹角余弦分析9个物种的线粒体DNA序列的相似性。由此产生的9个种物种之间的系统发育树表示的物种之间的亲缘关系与实际情况部分一致。最后对9个物种的线粒体DNA序列的5个顺式核苷酸序列复杂网络的局部特征分析DNA序列的相似性。以9个物种的顺式五核苷酸序列网络的拓扑系数为例来说明DNA序列的相似性。对蛋白质序列,首先对每条蛋白质序列构造2个网络,分别为二和三氨基酸顺式序列网络。然后,利用每个网络的14个特征为每个蛋白质序列构造向量,根据向量的欧几里德距离作为度量构造相似性矩阵,利用相似性矩阵构建系统发育树。由此产生的10个物种之间的亲缘关系与实际情况基本一致。我们还考查只用三氨基酸顺式序列网络的全局特征基于向量的欧几里德距离分析蛋白质序列的相似性。对蛋白质二和三氨基酸顺式序列网络以及三氨基酸顺式序列网络基于全局特征进行相似性分析。结果显示两个网络基于欧几里德距离的相似性矩阵建立的10个物种的系统发育树基本相同。最后,利用构造的蛋白质序列的2个顺式氨基酸序列复杂网络的局部特征分析蛋白质序列的相似性。
其他文献
2019年8月26日《土地管理法》修正案正式通过,明确规定集体经营性建设用地可入市交易。然而,该修正案却未对集体经营性建设用地的入市范围、主体、期限、收益分配等四个方面
【正】 深化企业改革,改善经营机制是经济体制改革的重点。在改革中,是否尊重全民所有制企业独立的经济利益,确认其企业的集体产权制问题是关系到国有企业在市场竞争中能否有
这款配置选择P42GA原因很简单。价格下调并趋于稳定使其成为高档领域的绝对热门。从一定程度来说它就是配置发烧的代名词。不少朋友在选择硬盘时最注重往往是价格,实际上这忽
现在如果我们提到声卡,更多会想到创新的一系列产品,甚至还有不少人还会想到AC^+97这个名词。可是如果要选出声卡中最经典的产品,除了上述两者之外,你绝对不能把帝盟(DIAMOND)的M
【正】 最近本刊异人就中西文化、传统与现实等问题采访了他。异人:听说您正在写一篇关于中国传统智慧的文章。为此我想请您谈谈传统与现实的关系这个间题。
目前使用中国电信的ADSL上网的用户很多,不少地方电信局为用户选配的都是带路由功能的高档外置ADSL Modem,如仅让其工作在普通Bridge模式下,无疑是一种资源浪费。下文将带领大
本文报告吉林省九台县饮马河乡居民开展人体寄生虫分布调查。应粪检人数522人, 实检人数501人,受检率96%,共检获蠕虫4种:蛔虫34.3%,蛲虫4.6%,鞭虫1.2%,华支睾吸虫17.2%;原虫5种:人
1998年,湖北地区酒类市场在国家宏观经济政策调控、国有企业改革步伐加快,下岗职工人员增加及长江流域特别是湖北地区遭遇百年不遇的洪灾的情况下,整个酒类市场比较疲软。第
期刊
清华同方的动感飘旋系列在市场的知名度已经比较高了,而动感星旋是清华同方为立体打造“SPORT STAR”的产品形象,最新推出的系列产品。由于MP3播放器的大部分消费者都为年轻人,