RNA二级结构比对动态时间规整算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:jill_bai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA研究是生物信息学领域的重要内容之一。RNA结构决定RNA功能。RNA二级结构比对是结构生物、结构化学和生物信息学中的基础性问题。RNA二级结构比对研究对RNA二级结构预测和RNA功能的研究有重要意义。首先,提出了一种新的RNA二级结构表示方法,将RNA二级结构表示成一条时间序列,序列元素为非负整数。这种表示法不受RNA二级结构是否含有假结的影响,能够完整地表示RNA二级结构的结构信息。其次,在这种表示法的基础上,提出一种新的、基于动态时间规整算法的RNA二级结构比对算法,即DTW-RSC算法。算法将RNA二级结构转化成与RNA等长的时间序列,通过动态时间规整算法计算时间序列间规整距离,以此度量RNA二级结构间相似性,规整距离越小代表相似性越高。再次,针对DTW-RSC算法比对效果和计算时间花费两方面,对算法进行优化并提出基于带约束的加权动态时间规整的RNA二级结构比对算法,即CWDTW-RSC算法。算法加入全局约束半径限制,缩小规整路径搜索范围,并在计算过程中运用权重调整机制,提高计算时对结构差异性影响较大的序列点对的计算权重,使得差异性和相似性结果更加显著,提高RNA二级结构数据集比对结果的区分度。最后,通过两组对比实验分别验证DTW-RSC算法和CWDTW-RSC算法的可行性。第一个实验分别在四组不同数据集上运用DTW-RSC算法进行比对实验。第二个实验以算法运行时间和比对结果分布情况为评价标准验证CWDTW-RSC算法的优化效果。实验结果表明,DTW-RSC算法具有可行性,CWDTW-RSC算法比对结果区分度更高。
其他文献
HMIPv6是一种基于移动IPv6的新型网络,在移动IPv6的基础上引入移动锚点,减少了移动节点向家乡代理绑定更新的次数,但正是由于移动锚点的引入,使得移动节点进行MAP域间切换的
数据挖掘能对企业的决策有很大的作用,在企业的决策支持系统(DSS)中处于举足轻重的地位。数据挖掘和数据仓库技术致力于研究的领域是:如何提高企业的运转效率和决策的有效性。
推荐系统是信息过滤领域一项重要的技术。随着电子商务的发展,网络中新增的用户和项目越来越多。面对如此庞大的项目群,用户往往只对很少一部分项目进行评分,更多的项目通常
当前,互联网已在全球范围得到普及,网络将人们之间的距离拉得更近,使得信息的交流更加便捷。人们可以利用它上网、聊天、访问微薄等。企业为提供内部信息交流而构建内部企业
对于一个企业来说,经营管理已经成为其的基础与核心。对于一个煤矿企业来说,信息化经营管理有利于提高企业的管理水平,增加企业的核心竞争力。工作流技术是当前计算机应用领域和
鼻咽癌在我国南方各省发病率高,我省同样是高发区之一,其主要治疗方法是放射治疗。本课题结合我省鼻咽癌高发的特点,利用引进的国际先进IGRT技术设备,基于锥形束CT进行计划设
电力短期负荷预测对电能优化调度和电力市场规划有十分重要的意义,尤其是在电力企业由计划经济的垄断经营模式转变为市场经济的竞争经营模式,且当前电力供应紧张的情况下,准
随着信息技术的发展和企业信息化水平的提高,商业智能(BI)在信息企业的经营与决策中扮演着越来越重要的作用。数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)及报表展现等
实现社区医疗信息系统(CHIS)的标准化,可以避免资源浪费和信息管理混乱的现象,提高社区卫生服务信息资源的利用率。加快信息交流速度,将会在促进社会进步、创造健康环境等方
非线性系统是动力学研究最重要的对象。随着工程技术的发展,一方面,被研究的对象日益复杂,亟待更精确的数学模型描述;另一方面,动力学系统不可避免的要受到各种外界干扰的影响,这就