基于粗糙集的加权朴素贝叶斯分类算法研究

来源 :长沙理工大学 | 被引量 : 9次 | 上传用户:aa283488665
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘作为信息技术自然演化的结果之一,引起了整个信息产业界的极大关注。数据挖掘是从大量包含结构化、半结构化、文本、图形和图像的原始数据中,采用数学的、非数学的、演绎和归纳的知识发现方法,提取隐含在其中的,可用于决策支持、信息管理等方面的知识和信息的过程。数据分类是数据挖掘的一个重要组成部分,现在主要的分类技术有贝叶斯分类器、基于决策规则的分类器、决策树分类器、粗糙集、遗传算法和贝叶斯信念网络等。自1982波兰科学院院士Z.Pawlak提出粗糙集以来,粗糙集理论得到了广泛关注,现主要用于近似分类、属性和属性值约简、属性依赖性分析等。本文利用了粗糙集在知识约简时,能够保持分类能力不变的特性,将粗糙集理论与得到广泛应用却受条件独立性假设条件限制的朴素贝叶斯分类算法结合,取长补短,使朴素贝叶斯算法的分类能力得到提高。本文的主要研究工作包括两个方面:1.属性约简与朴素贝叶斯结合的算法研究。分析了几种属性约简算法,包括值约简和属性约简的算法。然后利用基于属性序的属性约简算法与朴素贝叶斯分类算法进行结合,提出了一种基于属性序约简的加权朴素贝叶斯分类算法。新算法一方面可以简化数据集,另一方面可以参与权值的计算,有效地利用了朴素贝叶斯和粗糙集约简的优势,使分类的精度和适应性得到了一定程度的提高。2.将粗糙集中核属性的求取方法与朴素贝叶斯算法进行结合,提出了一种基于核属性的加权朴素贝叶斯分类算法,使朴素贝叶斯的条件独立性假设限制条件得到弱化,求核属性可使数据集得到简化,为朴素贝叶斯算法的实现准备了前提条件,这样取长补短,使分类精度得到了提高。
其他文献
教育评价是教学活动中的一个重要环节,评价的目的是为了使所有的学生在学力和身心等方面都能得到充分的发展。英语课堂教学评价是英语课程的有机组成部分,科学的评价体系是实现
目前对LTE技术的研究是移动通信领域研究的热点问题之一,为了提供更高的传输速率,各个研究机构将MIMO(多输入多输出)技术作为其研究技术核心。从目前技术发展来看,在无线通信系
电子信息技术的发展使战场环境变得更加复杂,电磁环境作为战场的重要特征,分析其构成与特征对于认识战场环境至关重要。信息化武器装备是电磁信号的发出者,它们在空间密集分布,使
<正>2014年12月6日,"海淀区2014年大龄职工单身交友联谊会"在工人文化宫举行,海淀区总工会职业介绍所主办了此次活动,来自海淀区机关事业单位及海淀区多领域科技类公司共15家
上世纪20年代,奥地利学者贝塔朗菲提出了系统理论的思想。系统论的出现,突破了笛卡尔提出的分析思维方式,为现代复杂问题研究提供了有效的思维方式,使人类的思维方式发生了深
高分子成型加工原理是材料化学专业最重要的专业课程之一。根据课程和材料化学专业对人才需求的特点,在教学过程中调整课程结构,合理组织教学内容,改善教学方法,通过多媒体教
随着半导体技术的飞速发展,器件的微型化和集成化成了主要的目前集成电路行业的趋势。在处理器行业,也提出了融合理念,并推出了新的产品APU。APU的问世对半导体测试带来了新
随着知识经济时代的来临和终身教育的倡导,人们进入了一个高效学习的社会,阅读对人的生存与发展的重要性日益显现出来。阅读能力是一个人终身学习、发展的基础能力,人们越来越认
本文在高分子溶液热力学相平衡理论和结晶动力学指导下,采用热致相分离(简称TIPS)法成功制备了具有独立形态的聚-L-乳酸(PLLA)和PLLA/聚己内酯(PCL)捆束纳米纤维球晶。在低温
我国的中小企业数量多,分布广,涉及行业广泛,是我国国民经济的重要增长点,是促进经济发展和社会进步的重要力量。改革开放以来,国家对中小企业的政策支持更是为中小企业的发