朴素贝叶斯分类及其应用研究

被引量 : 75次 | 上传用户:JZH122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
朴素贝叶斯是数据挖掘领域重要的分类算法之一,与其它方法相比,朴素贝叶斯方法具有算法简单、分类效果稳定和速度快等特点。朴素贝叶斯模型一般假设属性之间相互独立,然而这个假设在实际应用中往往是不成立的,这给朴素贝叶斯模型的分类性能带来一定影响。对此,现有大量研究工作试图通过放松属性间的独立性假设来提高朴素贝叶斯分类的性能,主要可以分为结构扩展、局部学习、属性选择和属性加权。本文重点从结构扩展和属性加权两个方面改进朴素贝叶斯分类模型。具体研究工作包括:1)结构扩展方面:采用关联规则中的频繁项集来体现多属性之间的关联性,从而避免了强属性集的选择过程,并构造了一种双层贝叶斯结构;针对基于频繁项集的贝叶斯分类算法(FISC)存在的概率估计方式粗糙和分类器集成过于简单的缺点,分别提出了基于M-估计的贝叶斯分类算法(FISC-M)和加权集成的贝叶斯分类算法(WFISC);为解决FISC时间开销较大的问题,提出了项集长度约束条件,在保证分类精度的前提下缩短了算法的运行时间,进一步提升了FISC-M和WFISC的性能。实验结果表明,FISC-M与WFISC的性能大大超越了原始的FISC,并且优于目前性能较优的一些贝叶斯分类算法。2)属性加权方面:将变精度粗糙集理论应用到贝叶斯分类算法中,提出了一种基于变精度粗糙集的属性加权朴素贝叶斯分类算法(AWNB-VPRS)。该算法采用变精度粗糙集方法来确定属性的重要程度,综合考虑了属性的加权近似精度和属性的信息增益。实验结果表明AWNB-VPRS模型在许多领域比基于传统粗糙集的贝叶斯分类模型更有效。3)实际应用方面:将所提算法应用于冠心病中医诊疗临床规律的分析挖掘中,建立了冠心病中医辨证诊断模型,在一定程度上进一步验证了算法的有效性。
其他文献
在物元概念的基础上,本文给出了形式化描述事情的基本元——事元的概念,研究了它们的性质及变换,同时研究用事元描述知识,为知识的形式化表示提供了新的方法。此外,事元的引入,也为
自上世纪以来,汽车工业的飞速发展使得世界汽车保有量急剧增加。汽车工业的发展,推动了人类社会的快速进步。然而,汽车在给人类带来交通便利和社会繁荣的同时,也给环境造成了
离心雾化法是商业生产中普遍使用的一种大批量合金微粉生产方法,具备生产效率高、微粉颗粒均匀、生产成本低的优点,但一般的雾化法制备的微粉颗粒为球形。而作为电磁波吸收剂
一直以来,听力技能常被人们称为消极技能,这是一种误解。听力要求学习者不仅要被动吸收而且要积极主动的参与,因为输入和输出同样重要。在导入部分,笔者阐明了本文的研究目的
随着全球环境污染和能源短缺问题的日益严重,寻找新能源已经是各国不得不面临的现实。众所周知,太阳能是当前世界上最丰富、最清洁、最有大规模开发利用前景的可再生能源之一
生物柴油和单甘酯的制备都是基于油脂的酯交换反应。两者制备的反应底物都是不互溶的两相。本文将新型的纤维反应器应用到油脂酯交换反应制备生物柴油和单甘酯中,研究了碱催
各行各行皆有其工作性质,而其工作人员为达成其任务,则须具备一些相关的角色特性。源于对现实中幼儿教师生存境况及其面临尴尬与困惑的关注,也源于对幼儿教师职业特质与幼儿
近些年,随着德育研究的不断深入,韩国高校德育工作逐渐进入人们的视野,并引起了众多学者的讨论与关注。本文结合韩国高校德育理论研究的现有成果,以2009年9月至2010年7月在韩
光皮木瓜[Chaenomeles Sinensis(Thouin)Koehne]为蔷薇科木瓜属多年生落叶灌木或小乔木。木瓜药食同源,以成熟的果实入药,性酸、涩、温,内含齐墩果酸、熊果酸、黄酮、苹果酸、
<正>一、听评课的重要意义学校工作以教育为中心,教学是学校教育的重点。教学方法是提高教学质量的关键,而听评课是改进教学方法的一种最直接、最具体、最经常也是最有效的一