【摘 要】
:
20世纪90年代以来,生命科学研究取得了突破性的进展,随着人类基因组计划的开展与现代生物技术的发展,人类积累的大量生物信息数据为揭开生命奥秘提供了数据基础。序列分析成
论文部分内容阅读
20世纪90年代以来,生命科学研究取得了突破性的进展,随着人类基因组计划的开展与现代生物技术的发展,人类积累的大量生物信息数据为揭开生命奥秘提供了数据基础。序列分析成为计算生物信息学的一个重要研究领域。序列模体(Motif)发现是序列分析中的核心问题,它涉及到基因的发现、转录因子结合位点的发现、启动子的发现等生物学问题。模体发现是通过寻找不同序列间的相似片段来归结出这些序列片段中所蕴涵的特征模式。近年来,在模体发现的算法研究方面,人们已经探索出了一些有效的算法。但不幸的是,随着数据规模的不断扩大,大多数算法对这个NP-完全问题的执行效果都不理想。所以,积极探索更加有效的模体发现算法已成为生物序列研究领域中的重大课题,并受到越来越广泛的关注。本文研究了DNA序列中模体发现问题的算法。首先介绍了序列模体发现问题,并对现有的模体发现算法进行了详尽的分析。在分析当前算法的基础上,提出了一种有效的SDA穷尽搜索的模体发现算法。该算法首先基于分治的思想把大规模的样本序列数据集转化为一系列的子图,然后把序列模体发现问题转化为子图中团的查找,在子图中团的查找算法中,采用深度优先搜索结合回溯策略进行查找。理论分析和实验表明当前的算法具有优于其它算法的总体评价,能够应用于实际的模体发现问题。
其他文献
随着互联网的迅速发展,WWW已经成为全球最大的信息库。但是面对WWW里浩如烟海的信息,如何快速准确地找到所需信息或是提取有用知识便成为一个急需解决的问题。将传统的数据挖
运动目标检测是图像处理与计算机视觉领域中一个非常活跃的分支。运动目标检测的结果包含了视频场景中的时空信息,反映了该视频流中主要的内容信息,在基于内容的视频分析、视
在计算机技术飞速发展的今天,信息已成为社会稳定和发展的重要战略资源,尤其在军队、企业和政府机构内部信息系统中,存有的敏感信息越来越多,信息安全显得至关重要。而移动介
回转窑是水泥制造工业中重要的生产设备,为了确保生产质量,对回转窑运行过程进行控制十分重要,其中窑内温度是非常关键的被控变量。出于其控制过程具有非线性、不稳定、时滞
本文在分析遗传算法(GA)在结构优化与参数优化方面的基础之上,提出基于遗传编程(GP)的结构参数混合优化方法,利用遗传编程的树形结构编码方式,分析了结构和参数协同优化对结
无线传感器网络(WSN)是随着微机电系统、传感器技术、无线通信和计算机网络技术的飞速发展而产生的,并以其低功耗、低成本、分布式和自组织的特点带来了信息感知界的一场变革
步态识别主要是通过人们走路的方式鉴别人的身份。步态识别具有远距离识别、非侵犯性和难以隐藏等优点,因而备受计算机视觉研究者的关注。首先,本文使用改进单高斯模型法重建
手势是一种自然而直观的交流手段,随着人机交互逐渐向以人为中心转移,基于视觉的手势识别研究也逐渐成为人们研究的热点。本文以智能教室的研究为背景,设计并实现了基于手势
天地通信监控中心是载人航天工程测控通信系统的重要组成部分,是在轨飞船及空间实验室中航天员与地面指挥系统间进行话音和图像通信的枢纽,负责整个通信过程中天地话音和图像的
本文研究了基于模糊逻辑的核电站检修机器人运动控制的方法。首先,简单介绍了核电站检修机器人的应用背景、现实意义,分析了核电站检修机器人的运动学问题,包括履带式移动平