基于粗集理论的数据挖掘方法及应用研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:softmysoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从存放在信息库的大量数据中挖掘出有用知识的一种新技术。粗糙集理论作为一种处理不完全、不精确及不确定信息的有效方法,因其具有强大的数值分析能力,故在数据挖掘领域大有用武之地。目前基于粗糙集理论的数据挖掘技术已经成为人工智能领域中一个新的研究热点。论文对数据挖掘技术进行了深入的讨论,介绍了其相关概念,针对其普遍存在的海量高维数据、信息不完备数据、可理解性等问题,提出一种基于粗糙集的数据挖掘方法。首先,详细阐述了粗糙集的产生、发展及其在数据挖掘领域中的应用。其次,讨论了粗糙集的约简方法,利用粗糙集理论对数据样本进行约简,获取约简的规则集,使得规则数目大为减少,充分地提高了数据的处理能力。接着针对粗集只能处理离散化的属性,研究讨论了各种连续属性离散化方法。论文中对目前神经网络也进行了分析,并针对训练神经网络时由于样本数据中含有大量的、不完全的、有噪声的、模糊的、随机的数据,造成的网络结构复杂以及计算速度慢等问题,提出了一种基于粗糙集的构造神经网络的方法,即运用粗糙集方法对输入样本进行约简,确定神经网络隐含层神经元个数。利用基于粗集的数据挖掘技术构造的粗神经网络模型,具有计算简单、收敛速度快等特点。最后将该方法用于间歇式反应釜,通过粗神经网络建模,从而实现对间歇式反应釜的釜内温度的估计。仿真结果与实测数据比较表明,模型估计准确,误差小,与常规方法相比,网络的训练时间短。综上,基于粗糙集的数据挖掘技术是一种有效的数据处理方法,它可以为建模与控制等研究工作提供有用的信息。由于该方法具有较高的估计精度及较快的学习效率,所以更有利于实时应用。
其他文献
现如今,我国作为全球排名第一的产煤大国,煤炭业早已成为关系国民经济命脉的重点行业。并且在未来不短周期内,我国的能源结构基本不会发生大的变化,仍将继续以煤为主,煤炭产业将持
随着我国制造业的迅猛发展和IT技术的不断更新,ERP(Enterprise Resources Plan,企业资源计划)系统已被人们广泛的接受并导入到企业管理中,用于加速企业信息化建设,实现企业管理的
试验机是非常重要的精密检测仪器,广泛用于材料的质量控制和新材料的力学性能研究,试验机几乎应用于所有可以看到的材料检验领域,它的应用单位包括了科研院所、大专院校、工业企业、商检机构、航空航天和国防军工领域。本课题在试验机研究中应用嵌入式操作系统,并把USB接口作为一个功能模块进行了研究,论文的主要工作如下:1)系统的介绍了AT91RM9200微控制器的试验机系统的硬件总体结构,进行了外围接口模块的设
我国煤炭行业近几十年来开采力度的加大,开采量的不断增加,导致煤矿开采地区的地形结构发生了较大变化,不同含水层发生了位移移动,造成部分地区发生了煤矿突水事故,给煤矿带
含集中质量的复杂域弹性板结构被广泛应用于机械工程、电子设备和航空航天等领域,其动态特性是影响系统工作可靠性的重要因素之一。为了保证系统的高可靠性,需要对含集中质量的复杂域弹性板的动态特性进行深入研究。本文采用解析模态分析、有限元模态分析和试验模态分析相结合的方法,研究了含集中质量的复杂域弹性板的动态特性,具体内容如下:1.根据复变共形映射理论,结合现代数值方法,借助三角插值法和法向收敛法,求解了复
无线传感器网络(WSNs)的MAC协议处于网络协议的底层部分,它决定无线信道的使用方式,对无线传感器网络的性能有极大影响,是保证无线传感器网络高效通信的关键网络协议之一。传统
质子交换膜燃料电池具有环境友好、燃料利用效率高、工作温度低、比能高、启动速度快等优点,适用于交通工具、分散电站等领域。但是成本高、寿命短等缺点严重制约着它的大规模
纤维复合材料非对称形体容器因其结构的特殊性往往采用人工缠绕,但人工缠绕生产出的容器缺点极其明显,不仅外观粗糙、强度低、成本高,而且性能难以保证,这一现状一直制约着整个复
随着计算机、自动化、信息技术的发展,现代飞行器技术发生了巨大的变化,昔日的模式已难以适应现代战争的需求,一种有效的解决途径就是采用航迹规划。为此本文研究了低可观测飞行
当今水环境的安全问题引起了广泛的关注,针对镇江市位于长江与大运河交界处,辖区内水网密布,同时经济以重化工业为主的现状,根据传统水质自动检测方法的特点,在技术上提出了