基因数据相似性分析方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:zhang444051115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的开展,以及各种生物基因序列的研究,产生了越来越多的庞大的分子序列数据,对这些序列数据进行科学的分析和处理推动了生物信息学的发展。序列相似性分析是生物信息学的基础,通过相似性分析获得的大量序列信息可以用来推断基因的结构、功能和进化关系,因此基因数据的相似性分析方法研究已成为生物信息学领域中一个非常重要的研究课题。论文在综述基因数据表示以及相似性分析方法研究现状的基础上,对聚类分析方法、序列相似度度量方法、基因数据的空间表示和基于空间表示的相似性分析方法进行了系统研究。本文取得的研究成果主要有:1.提出了一种基于多维伪F统计量的基因表达动态聚类分析方法。该算法可动态地调整聚类个数,根据多维伪F统计量获得最佳聚类数目,实验结果表明该算法聚类质量较好。针对基因微阵列数据缺失值严重影响聚类结果,本文利用模糊C-均值算法能很好地处理数据间的重叠性和相关性的特点,将它应用到基因表达数据的缺失问题处理中,提出了基于模糊C-均值的填充算法FCMimpute,实验结果表明,FCMimpute填充在处理缺失值问题上是可行的、有效的,并且其填充性能表现尤为优越。2.提出了一种基于比对相似度动态矩阵的聚类算法。在DNA基因序列方面,本文研究分析了基于图BAG聚类算法,给出了一种cutoff初始值、最小长度阀值和分割/合并类的确定方法,提出基于比对相似度动态矩阵的聚类算法。实验结果表明该算法具有较好的聚类正确率。3.提出一种基于双重核苷酸出现频率的序列相似度度量方法。针对大量DNA多序列比对计算复杂问题,给出了DNA序列的相邻双重核苷的分类,通过序列的数字特征描述序列,给出了一种基于双重核苷酸出现频率的序列相似度度量方法,可有效地表示序列的相似度,且计算简单。4.提出了一种DNA序列图形表示,定义了一个序列特征参数,给出了可凝聚层次聚类的进化树构建算法。针对DNA序列的图形表示存在退化现象,本文提出一种3D曲线表示法—N曲线,证明了N曲线中不存在环和退化现象,且符合DNA序列的对称性;定义了一个新的序列特征参数Z_inv,该特征参数计算简单且非常接近于特征值λ;根据DNA序列三维图形表示,提出一种基于可凝聚层次聚类的进化树构建算法,实验结果表明了该算法的有效性。5.提出了RNA二级结构的2D、3D、4D空间表示方法,对RNA二级结构进行了相似性分析。针对RNA二级结构表示法中主要的高复杂性和退化问题,本文提出了RNA二级结构的2D、3D、4D空间表示方法,并证明了该表示法的有效性,采用矩阵不变量对RNA二级结构进行了相似性分析,通过不同物种的RNA二级结构的相似性/相异性比较实验,表明了该方法的有效性。6.提出了一种蛋白质序列的6D表示,定义了一种蛋白质组的相似性度量方法。根据氨基酸的分类提出蛋白质序列的6维表示方法,并获得了一些数值特征,给出了蛋白质序列的特征构造方法,并根据提取的特征参数定义蛋白质组的相似性度量方法并构建系统发育树,与现有的构建进化树方法不同的是,该方法不需要多序列比对,实验结果表明了该方法的有效性。
其他文献
目的:通过本试验进一步探讨吸烟对支气管哮喘患者气道炎症的影响,了解吸烟哮喘患者对激素治疗的敏感性,从而为临床治疗提供更有效的手段。方法:选取35例慢性持续期哮喘患者,
目的:基于中医下法,将“六腑以通为用,腑气以降为顺”及“肠肝循环”理论应用到本试验中。观察以清肝泄热,温化寒湿为治法,运用茵陈术附汤合龙胆泻肝汤加味治疗乙肝肝硬化腹
目的通过研究盐酸氨溴索对吸烟大鼠肺组织病理改变,气道阻力和肺顺应性以及对支气管上皮细胞和肺泡巨噬细胞中激活蛋白-1(AP-1)和铜锌超氧化物歧化酶(CuZn-SOD)蛋白及其mRNA
近年来,随着云计算和大数据等新兴技术的兴起,高能物理学、天体物理学、生物信息学等以数据为中心的科学领域开展的大型科学实验计算规模愈加庞大,产生和积累的科学数据量显
近年来,国家政策强调基层组织和居民在参与老旧小区改造中的积极作用,同时地方政府各部门间要加强统筹协调,但是具体实践中依然存在许多问题。本文借鉴具有大量实践经验的英
目的:探讨a-氨基-3-羟基-5-甲基-4-异恶唑丙酸(AMPA)受体及突触后致密蛋白95(postsynaptic density protein 95,PSD-95)棕榈酰化失衡在铝致大鼠海马LTP损害中的作用及其作用机制。方法:1.建立动物染铝模型:健康雄性成年SD大鼠60只,随机分为生理盐水(空白对照组)、10mmol/kg、20mmol/kg、40mmol/kg麦芽酚铝染毒组,每组15只
人类社会的发展进程中贫困现象长期存在,扶贫资源如何更好地聚焦于贫困人口是国内外共同面临的难题。改革开放以来,中国政府通过大规模的扶贫开发,让广大农村贫困人口摆脱了
目的研究分析肝硬化腹水临床的治疗措施。方法 31例肝硬化腹水患者作为研究对象,全部患者针对自身症状态及机体耐受情况给予基础治疗、用药指导及腹水引流等治疗,观察治疗效
目的通过对婴儿胆汁淤积性肝病(infantile cholestatic hepatopathy,ICH)致病病因与转归的分析,研究治疗前后的肝功能指标。对比不同病因治疗前后的临床表现、诊断学参数变化,获得其高危影响因素及预后评估指标。方法回顾性分析2014年3月至2018年3月在医院中进行住院治疗的72例患有婴儿胆汁淤积性肝病的婴幼儿临床病历资料。总结患儿的年龄、性别、喂养史、家族史、新生儿期黄
[目的]探讨超声造影与彩色多普勒超声在老年肝脏肿块诊断中的应用及意义。[方法]选取2012年10月~2015年1月来我院治疗的76例患者为研究对象,采用超声造影与彩色多普勒超声对