平行同源基因中内含子得失率算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:houguangyun1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
剪接体内含子的发现已有30余年,但目前对其进化机制和进化动力学的了解很贫乏。学术界对内含子的进化问题一直存在争议,其中之一就是内含子得失率。内含子的进化研究方法常是用已观测到的数据来重构内含子的演化过程。重构过程需要五个基本步骤:第一、基因组序列和基因的注释;第二、选择同源基因;第三、标定内含子的位置;第四、构建系统发生树;第五、内含子得失率计算。前四步的研究比较成熟,第五步是目前研究得最少的部分,也是最值得探讨的一步,不同的判断方法将得到不同的内含子进化过程。对平行同源基因进化过程中内含子得失率现存两种矛盾的结论,即“得到大于丢失”和“丢失大于得到”。本文通过对现存的内含子得失判断方法的研究,获得一种新的、更合理的算法来重构内含子的进化过程。   本文首先分析了内含子得失研究以及算法研究的重要性;接着具体介绍了得失率研究的背景技术,包括系统发生树的构建方法和工具,同源基因的比对方法和工具等;第三章对内含子得失的算法做了介绍、对比、研究、分析,并提出一种新的判断内含子得失的算法。   目前判断内含子得失的算法主要是建立在最大简约法的理论基础上,即进化过程中内含子得失事件发生最少的理论假设,认为得失数越小的进化方式越接近真实的进化过程。具体的方法有“Dollo简约法”以及在Dollo简约法基础上作改进的“Dollo改进法一”,它们得出相反的结论,“Dollo简约法”认为内含子获得多于丢失,“Dollo改进法一”认为内含子丢失多于获得。分析发现:Dollo改进法一得出的结论片面,其仅能对部分平行同源基因的内含子得失作统计;Dollo简约法偏重于内含子丢失,不是最佳的判断方式。本文对上述问题做了修正和改进,以内含子得到和丢失的可能性相同为原则,提出一种新的内含子判断方法(取名叫“Dollo改进法二”),并通过计算机仿真的方法来分析六个物种的平行同源基因的内含子得失。结果表明,本文提出的新方法使得失数降低,是更好的判断内含子得失的方法;内含子得到多于丢失,即平行同源基因进化方式以内含子得到为主的结论,其对内含子的功能也是一种很好的解释。
其他文献
随着信息时代的来临,数码相机、摄像机等电子产品已走入千家万户,人们可以方便地获取到高分辨率的数字图像。为了信息传递、共享和交流,需要能够在手机、PDA、MP4等小屏幕的移动
人类的虹膜具有唯一性、稳定性、不可改变性和高度的抗欺骗性,因此基于虹膜的生物识别技术广泛应用于安全控制和电子商务等许多领域。随着虹膜识别技术的日益进步,人们对识别
电力的安全运营是其他行业正常运转的基本保障,为了保证电力供应,需要对电力供应相关的备品进行储备。电力行业的分散布局决定了备品分散在各个执行机构不能集中储备,由于没有面向全局的规划储备方案,备品大量重复储备,占用大量流动资金并消耗大量保管费用。同时由于设计时没有统一规划,使得备品信息成为‘数据孤岛’,备品储备信息无法共享,在应急维修中不能快速的找到相邻单位的空余设备来完成紧急任务。为了降低运营成本,
近年来,计算机犯罪一直是有增无减,严重影响到社会的安定,计算机取证是有效打击计算机犯罪的重要手段,其关键在于保证提取的电子证据具有法律认可的证明力。   与传统证据相比
语音合成技术是人机交互研究中比较重要的技术之一,并且已经应用到了社会生活的许多领域。语料库构建技术作为语音合成技术开发中的一个重要模块也受到研究人员的普遍关注。
当今社会随着人们生活水平的提高以及生活习惯、饮食习惯的改变,肿瘤的发病率和死亡率在不断上升,已成为威胁人类健康的最主要疾病。肿瘤早期的诊断和个性化治疗是减少肿瘤患
神经外科导航系统(Neurosurgery Navigation System)是现代影像技术、立体定向技术与先进的计算机技术相结合的产物,它的主要功能包括:在术前通过手术规划与模拟,可以减少手术
随着遥感影像的空间分辨率不断提高,传统的基于像素的信息提取技术已不能很好地提取影像中的土地信息,它产生的专题图中土地完整性差并且混分、错分现象严重,同时无法解决“同谱异物”与“同物异谱”的问题。根据高分辨率遥感影像的特点,本文以对象为最小的操作单元进行农村地区土地信息提取,对象通过影像分割得到。针对现有的对象分割技术在分割过程中出现的精度缺陷与自动化程度低等问题,提出了一种基于多特征数据融合与对象
随着社会信息化与网络化的高度发展,信息安全的重要性也与日俱增。身份识别技术作为信息安全的一个分支以其特有的稳定性、唯一性和方便性,得到越来越广泛的应用。   掌纹图
GCC是GNU中的旗舰产品,也是开源世界的重量级产品,大多数开源产品都是基于这个编译器的。GCC是一个编译器的集合,其中的C++编译器就是G++。GCC采用前端、后端相结合的方式,前