生物信息学中的模式发现算法研究

来源 :黑龙江大学 | 被引量 : 1次 | 上传用户:zhhs555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息数据的快速增长促使人们发展新的技术去认识它,利用它。这是认识世界,改造世界的必然途径。生物信息学研究的对象是DNA序列、蛋白质序列。motif是生命密码的一种表现形式,因此利用多序列生物数据发现motif意义重大,它可以使我们发现基因表达的方式和原理。我们将混合模型应用在motif发现过程中,提出了基于样板候选集的生成方法,改进了greedyEM算法。对于精确motif发现问题,提出了用motif家族树的方式来减小模式空间,通过候选筛的方法来减小比对次数的新算法。生命性状是由基因决定,当前基因如何决定性状的研究已从单个基因决定作用转向多个基因的协同作用研究。在分子水平上,DNA序列调控区的motif对DNA的转录翻译起着重要作用,因此对调控区motif的关联分析对研究基因表达有着重大意义和理论价值。本文针对两个不同基因表达模式的起动子motif关联集差异进行分析,提出了先建立FP-树,然后建立字典树森林进行分析比较的有效算法。我们还给出了另外一个挖掘算法,该算法适用于起动子motif数据中的关联规则的发现。
其他文献
计算机科技迅速发展、不同层次的应用需求的涌现,导致了当今网络数据的急剧增加,汉语有着庞大的用户群体,如何在海量的中文信息中提取出我们想要的,有用的信息呢?第一步当然是让计
随着软件工程技术的不断发展,开发软件的规模和复杂度不断增加,软件开发的中心任务逐渐由过去的代码实现为主变为现在以需求分析为主。需求分析中最大的困难之一是开发者对目标
足球机器人系统是典型的多智能体系统,它要求多个机器人在实时对抗的环境中协作完成一个共同的任务,为研究多机器人的协作与控制提供了理想平台。FIRA的MiroSot足球机器人系
工作流管理技术作为一种过程建模和过程管理的核心技术,可以与其它系统有效地结合,实现符合政府、企业需求的各种业务管理系统,如电子政务系统、项目管理系统、客户关系管理
数字图书馆是一种数字信息的获取系统。现有的数字图书馆尽管在数据存放上拥有了分布式存储的技术,但在与用户交互的角度仍然是局限于C/S模式,这种模式有着固有的网络瓶颈,单点
计算机系统和数据库中保存的数据格式是不兼容的,很多时候开发者要解决的主要问题是如何通过Internet来交换这些数据。共享、交换数据是实施电子商务的基础,数据交换问题的解
并行程序的开发是并行计算中一个公认的难题。其中一个重要的原因在于缺乏系统的开发并行程序的方法和相关的辅助工具。现有的大多数并行程序设计模型本质上是对并行程序编码
管理信息系统(MIS)在各行各业得到广泛的应用。由于其处理对象主要是文本和数字等简单信息,表达形式单一,缺乏直观性和决策可视化,很难有效分析复杂的空间地理信息而成为阻碍
随着软件系统规模和复杂性的不断增加,软件体系结构在软件开发中的作用显得越来越重要。软件体系结构是软件系统的高层抽象,用于描述整个系统的结构和行为。目前,软件体系结构已
随着计算机科学技术的飞速发展,系统仿真技术已经成为许多领域进行科学探索和创新的常用手段。其中,制冷空调系统的仿真一直是系统仿真中的一个研究热点,但它要取得良好的效