基于信息熵理论的基因组特性研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ieksmc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从处理遗传信息的角度来看,细胞本身构成了一个信息处理独立基本单元,从DNA的复制、转录到RNA翻译为蛋白质,对生物的遗传信息进行存储、传递。按传统的遗传学观点,所有的遗传信息都存储在生物的遗传物质之中,这个信息处理系统控制着生物的发育、生长和遗传。要揭示生命内部的具体工作机制,使用信息科学中的方法来研究遗传信息的存储、传递和表达是必不可少的。信息论是研究信息的度量、传递、交换和存储的一门科学。由于遗传信息作为一种信息,其存储与传递也必然遵循信息存储与传递的一般规律,因而可以采用信息论方法对遗传信息进行分析。本文首先针对基因组翻译起始和终止区域的碱基分布,如保守性、周期性等问题,提出了一种基于信息熵方法的模型进行分析。对DNA序列上起始密码子、终止密码子附近区域的碱基分布情况进行了统计,使用该模型的方法计算了该区域每个位点的信息熵,进而计算出信息剩余度,绘制出信息剩余度曲线。分析了各位点的保守性,对编码区域和非编码区域中的不同进行了分析比较。对编码起始、终止位点附近区域的信息熵分析的结果显示:在原核生物中,其编码区域的信息剩余度呈现非常强的周期为三的性质;亲缘较近的序列,其信息剩余度曲线相互聚集;在原核生物生物特有的SD区域,信息剩余度相对较大。而对真核生物的分析结果则相对较差,需要进一步的研究。同时,针对基因组序列相似性分析问题,本文提出了一种基于信息熵的相似性度量模型。将两条比对后的序列间的平均交互信息量与它们的联合熵之比作为它们的相似性度量。使用该度量构建了11个物种的相似性矩阵,对它们的相似性进行了分析,结果在一定程度上与生物分类学相契合。通过距离矩阵所构建的进化树,也反映了它们之间的进化关系,表明该模型的设计具有合理性。本文使用信息熵方法所得的实验结果表明,信息熵能够很好地表征一些生物学特性,它在生物信息学中的应用还有待人们进行更深入的研究。
其他文献
为合理的开发和利用青海省东部黄河谷地热量资源,选取黄河谷地4个气象站近55年(1961—2015年)逐日平均气温资料,采用气候倾向率、滑动平均法和累积距平法等统计方法,对黄河谷地
本文以实例重构的方式阐述了概率分析法在事业单位财务风险预测中的应用。主要原理就是用财务收支的历史数据,建立马尔可夫预测的数学模型。利用初始状态和状态转移概率矩阵,
企业财务管理可以分为刚性财务管理和柔性财务管理。在理论基础、财务管理组织、财务计划、财务资源、财务管理对象、财务关系、财务管理文化等方面,刚性财务管理和柔性财务管
1.概述近年来,随着科学技术的迅速发展,出现了多种多样的报警装置。目前,已经投入使用的有:电子、声学、光学、微波、红外等几大类的报警装置。其中红外报警器由于具有隐蔽
为探讨牛尾山药组培苗移栽入土的适宜基质,选用当地的基质材料在网室大棚内进行山药组培苗不同基质移栽试验。结果显示:不同基质对山药组培苗生长的影响不同,以处理1即营养土对
在烟草行业,测量设备管理是企业计量管理的管控重点之一,如何对测量设备实施有效管理,在满足标准要求的同时实现企业效益最大化是企业管理的核心所在,本文以山东中烟测量设备
在沈从文的性爱叙事中纷纭的性爱意象参与了小说文本意境的建构。头发其特定的文化内涵表现为蕴含着政治功用的“政治的头发”和具有着性吸引力的“审美的头发”。沈笔下的头
描述了第二代人的可靠性分析方法Atechnique for human error analysis(ATHEANA)在三里岛事故人误事件分析中的应用.分析结果显示了ATHEANA方法在认知失误分析方面的可用性和
本文在2016年全国技能大赛农产品质量安全检测项目取得优异成绩的基础上,对近年来针对该项目的训练从组织管理、指导训练、保障条件、院校学习交流等方面进行了总结,以期为相
复合滤棒物理特性指标抽检是过程质量监控的重要内容,采样数据的表征性和准确性决定了监控效果的好坏,在相同条件下,样本量越大,抽样误差越小,但是所产生的抽样成本越高。本