DNA序列的最大频繁模式挖掘

来源 :南昌大学 | 被引量 : 0次 | 上传用户:natelie_hu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是由统计学、生命科学、计算机学等众多学科复合所构成的学科,也是目前研究的热点学科之一。数据挖掘是通过计算机实现统计学和人工智能中的一些算法的技术,主要用于从海量的数据中找出其隐含的各种规律,是当前计算机数据分析最有效的技术。生物序列数据作为生物数据最重要的数据之一,将数据挖掘技术应用于生物序列数据的分析处理是目前研究者们最关注的研究领域。对序列功能元素进行鉴别以及找出各序列间的相互关系是生物序列数据挖掘最主要的任务。生物序列数据挖掘最为重要的研究内容就是生物序列模式挖掘,其对发现并解读其序列功能元素起着无可替代的作用。生物序列数据中最重要的是DNA序列数据。当今,通过数据挖掘技术处理DNA序列数据,对于DNA序列数据分析来说,这是一次非常大的尝试。分析研究DNA序列最为重要的算法就是DNA序列数据挖掘算法,怎么样才能设计出更为有效的DNA序列数据挖掘算法呢?不妨考虑:第一,结合生物学背景和相关领域的知识研究设计出适用的挖掘算法,使挖掘出的结果更够用生物学进行解释,满足生物学实际应用的需求;第二,通过设计出针对DNA序列数据的挖掘算法的方法,以此提高算法效率,但是,前提是在充分考虑DNA序列数据与一般序列数据特征区别的基础上。本文对现有的一些序列模式挖掘算法的实用性和算法效率进行研究分析,并根据DNA序列的特点,就算法存在的一些问题,提出了一种新的DNA序列模式挖掘算法-JMPS,以达到提高生物序列模式挖掘算法的效率和性能的目的。实验证明,该算法具有很强的可行性和有效性。
其他文献
Internet技术不断地向纵深发展,成为信息交流不可缺少的渠道,标志着人类进入了信息社会。由于以太网技术成功在Internet上应用,促使以太网技术不断加入传统的工业测控、家庭
伴随着基于计算机应用的不断发展而现存的计算机安全问题,大部分是由于应用软件本身的安全缺陷引起的,而应用软件本身的安全问题大部分是由软件的源代码缺陷所造成的,基于源代码
随着互联网技术的发展,网络用户剧增。电子商务也越来越受到企业和消费者的青睐。电子商务推荐技术作为电子商务中的重要技术,模仿销售员向客户推荐客户偏好度较高的产品。如
教育教学质量依然是高校教育最为关心的问题,学生成绩管理和教学质量分析是教学管理工作者最棘手的问题。高校一直在致力于进行教学改革,提高教学质量,大部分高校还是采用传
随着经济的发展和工业的繁荣,中央空调在各个领域发挥着重要的作用。常规中央空调为工业现场管理模式,以分散控制为主,已经无法适应人们对居住、办公等环境舒适度日益增高的需求。有一部分厂家能够集中控制其中央空调,然而一般采用有线通信方式控制,这种方式布线要求高、维护难度大。随着工业“4.0”和智能制造化的提出,管理人员希望在时间上实现同步管理和在空间上能够分开控制对应的中央空调机组,最终实现降低管理成本和
针对鸡西煤矿机械有限公司采煤机实验台都是采用有线的方式,传感器是来回移动的,而且工业现场中有大量的油和水,使得线缆容易被腐蚀等问题,设计了基于ZigBee的无线巡检仪,通
学位
随着社会经济的日益发展,人们安全意识的日益提高,大量的监控摄像头被安装到公共场所用于日常安全监控。面对海量增长的监控视频数据,人工早已无法应对,利用计算机技术对视频
信息化是当今世界经济和社会发展的大趋势,电子政务作为提高政府公共行政管理效率的重要手段和衡量国家竞争力水平的显著标志之一,受到各国政府的普遍重视。推进电子政务建设
故障定位是软件调试的主要任务之一。开发人员花费大量的时间和精力来人工正确定位故障。自动故障定位技术可以辅助开发者。在故障定位领域,已经提出了许多技术,输入测试套件,然
随着互联网的不断深入发展,3G技术的日趋成熟,移动互联网逐渐成为互联网未来发展的一个重要的方向,便携化便成了人们对移动互联网的直接需求。互联网与移动终端设备的融合,手
学位