基因组序列的特征提取和进化树构建方法研究

被引量 : 0次 | 上传用户:benben8383
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划(HGP)的完成,基因组序列迅猛的增长,吸引了越来越多的研究人员对全基因组的系统发生树的注意。目前越来越多的研究倾向于使用全基因组进行系统发育分析,因为这考虑了所有的生物特征并可作为所有生物的共同指标。从生物的基因组角度研究物种间的进化关系,才能获得更加全面的关于进化的信息。科学界普遍认为全基因组进化树与物种进化树更接近。而研究人员发现对不同基因构建的进化树往往不一致,因为对全基因组作系统发育分析时,物种的进化方式除了直向遗传外,还存在其它进化方式。因此,对基因组序列进行系统发育分析有非常重要的意义。本文主要研究了基因组序列的统计关联特征,基于统计关联特征的基因组序列的相似性分析,并采用一种新的模糊聚类方法对基因组序列构建进化树。首先,本文利用三联体和单联核苷酸的联合概率分布的差异来表示序列之间的差异,提出了一种新的基于统计关联特征(TBC)方法对全基因组序列进行相似性分析。将TBC特征矩阵数据归一化,再利用指数切比雪夫距离法构造模糊相似矩阵,最后用模糊聚类中的传递闭包法来构建进化树。该方法不需要多序列比对,计算简单。通过对四组基因组序列(48个HEV病毒、24种冠状病毒、24种转铁蛋白和20种哺乳动物)进行系统发育分析,实验结果验证了该统计特征的有效性。其次,本文提出了一种新的模糊聚类方法用于全基因组序列的进化树构建。利用上述的TBC统计关联特征构造特征矩阵,运用分裂层次聚类方法构建进化树,在分裂过程中采用模糊K均值算法将数据对象分为两类,分裂过程反复进行,直到类中的对象数目为1为止。通过对四组基因组序列(20种哺乳动物、24种冠状病毒、24种转铁蛋白和48个HEV病毒)进行系统发育分析,实验结果验证了该模糊聚类方法的有效性。
其他文献
为了提高白车身品质,缩短白车身调试周期,开发了螺钉车检具这个过程控制工具。本文简略介绍了螺钉车检具的起源及概念,明确了螺钉车检具的功能、目的及作用,详细介绍了螺钉车
目的:探讨螺旋CT三维重建在胫骨平台骨折中的临床应用.方法:回顾性分析1999~2004年38例胫骨平台骨折病例,手术前均行X线摄片,而后行螺旋CT三维重建并与手术对照.螺旋CT的扫描
对商用车进气胶管目前存在的问题进行了分析,并探讨了解决方法;介绍了热塑性弹性体的特点及其在商用车进气管路上的应用。实际应用结果表明:热塑性弹性体在提高产品质量的同
本文综述近年来国内外对寒冷损伤的病理生理的研究进展及治疗方法的改进,重点讨论寒冷损伤发生过程中细胞的损伤变化、微循环系统的损伤及其功能的改变,复温后再灌注损伤及复
近年来,随着新型永磁材料不断涌现及性能的不断完善,电力电子装置的快速发展以及现代控制理论算法的日益成熟,使得永磁同步电动机系统的研发和应用进入了一个新阶段。在此背景下
<正>还原历史环境,判断佛像真伪鉴定佛像的真伪,可以从造型样式、质地、工艺制作等多方面进行。除了这些看得见、摸得着的方法以外,有一点往往被人们忽略,这就是从作品的历史
我国提出构建和谐社会,医疗体制改革也必须与社会发展的大趋势相一致。我国正处于新一轮医疗改革方法的探讨和尝试阶段,改革能否令公众满意,关系到社会和谐稳定与可持续发展。我
FlexRay是下一代车用网络的主流协议,它具有传输速率快和实时性强的特点,能够满足汽车对安全性和操控性的苛刻要求。目前整个汽车行业对FlexRay技术的研究和推广程度非常有限,相
工程机械属于专业性、功能性强的重型机械产品。设计丌发较多地关注功能性能、结构强度和系统可靠性等方面的工程设计领域,缺乏对工业设计的关注,从而影响了产品和品牌的发展
电动汽车以电能为能源,具有零排放低污染的突出优点,是当前能源短缺、环境污染情况下诞生的新一代交通工具。而驱动电机及其驱动系统是电动汽车上的核心部分,本文以电动汽车为出