【摘 要】
:
目前,数据挖掘(Data Ming,DM)采用较新的技术是粗糙集(Rough Set,RS)。它在分析和处理不完整、不一致和不精确的数据并进行知识的约简时不需要先验经验。粗糙集主要的研究内
论文部分内容阅读
目前,数据挖掘(Data Ming,DM)采用较新的技术是粗糙集(Rough Set,RS)。它在分析和处理不完整、不一致和不精确的数据并进行知识的约简时不需要先验经验。粗糙集主要的研究内容是属性约简,而求核属性是属性约简的关键步骤。现在很多约简算法是从核属性开始,然后通过启发式搜索找到最小约简。差别矩阵求核方法是常用的求核方法,许多学者在此基础上进行改进,但是其效率都不是很理想。程序演化作为提高算法效率的新的方向和途径,在国内外已经引起了广泛的关注,将其用于提高差别矩阵求核算法是一个新的方向。本文围绕提高算法效率的程序演化策略,探索应用演化策略来改进差别矩阵求核算法。本文主要研究工作如下:(1)阐述差别矩阵求核原理,对最新基于差别矩阵求核改进算法进行了研究分析,总结差别矩阵求核算法效率不高的一些原因,为降低算法复杂度提供思路。(2)依据程序演化的应用方式特点,实现使用Haskell函数式语言规范描述差别矩阵求核算法。先不考虑其算法的效率,但保证其正确性,为以后的演化提供基础。(3)分析研究规范描述了的差别矩阵求核算法,结合算法低效率的原因,使用程序演化中Tupling与Accumulation演化策略对程序进行优化,提高算法的效率。(4)研究分析演化后的算法,引入数据集合划分方法以提高生成差别矩阵效率,再结合使用Accumulation演化策略对以上算法进行演化。演化后的求核算法比原差别矩阵求核算法效率高,使用仿真试验证明本文算法的正确性和高效性。
其他文献
近年来,数据的多样性使得传统的聚类算法已经无法满足数据分析的要求,于是人们提出了多视角聚类。现有的多视角聚类技术主要分为三类,协同训练算法、基于多核聚类算法和基于
IPv6替代IPv4成为下一代网络协议已是历史的必然。随着IPv6应用规模的扩大,针对IPv6的入侵方式层出不穷,现有的入侵检测系统不能适用于IPv6网络环境。为解决此问题,本文设计
我国拥有丰富的文物资源,但是对这些文物资源的保存却十分困难。在“大数据”的时代背景下,为了更好的对文物资源进行鉴赏、交流和保护,建立一个完善的数字化文物保护体系势
可信计算立足于终端,在终端构建一个信任根,以信任根为起点,通过完整性度量技术,建立信任链,实现信任由信任根扩展到硬件平台、操作系统,直至整个网络,保证整个计算环境的可信。
随着互联网的普及与应用,当前的计算机系统已经发展成为了复杂的、开放式的系统,这给社会的发展和人们的生活带来了极大的便利,但是网络规模不断扩大的同时也极大地促进了网
随着信息技术及相关产业的发展,网上在线数据库已成为一个巨大的信息资源仓库,这些在线数据库信息不能被传统搜索引擎检索,只能通过向接口提交查询来获取,这些信息被称为Deep
互联网规模的不断扩大,必将促使具有海量地址空间的1Pv6协议在全球范围内逐步取代地址资源匮乏的lPv4协议。又随着移动通信和无线接入技术的飞速发展,以及便携式移动设备的普及
随着计算机科学技术的飞速发展,计算机软件的规模日益庞大,调试和维护越来越困难。而另一方面,软件的安全形势严峻,对未受信源提供的代码的安全执行问题逐渐凸现出来。在这种
原油开发过程是一个比较庞大且复杂的系统工程,涉及数据种类较多,对于原油产量的影响程度也各不相同。目前的油田生产管理多以原油产量为中心,原油产量成为衡量油田生产水平
随着工业化和各种科学技术的发展,将图形图像处理技术应用到地震勘探工作中已成为一种研究趋势,而地震剖面图像增强已成为地震剖面预处理中的研究热点。但是,由于图像增强算