基于高维数据的加权朴素贝叶斯算法研究

来源 :统计与决策 | 被引量 : 0次 | 上传用户:sun8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对具有复杂结构的高维数据分类问题,文章提出一种基于特征选择和约简的加权朴素贝叶斯算法(WNBC-FSR)。该算法基于距离相关和最大信息系数的方法,从相关性和冗余性两个角度对高维数据进行特征筛选;采用属性和类别变量间的最大信息系数对属性进行加权,构建并训练加权朴素贝叶斯算法。实验结果表明:在几种算法的比较中,无论是从AUC还是F1值来看,WNBC-FSR算法的分类效果均是最优的。
其他文献
近年来,心力衰竭虽然在一定程度上得到了控制,但是其发病率、死亡率仍然较高,严重影响了患者的生活质量。本病依然是危害人类健康的重大问题之一。周亚滨教授从事中医药治疗
《TOUCH》在引擎方面使用了时下技术较为领先的Unity3D引擎开发。Unity3D引擎是一款专业游戏引擎,具有非常好的跨平台性,支持客户端、移动、Web等多种平台,包括PC、iOS系列、And
文章运用中国健康与营养调查数据(CHNS)中2000-2015年人口数据作为考察对象,将可分解测度贫困指数(FGT)基于农村贫困线、城镇贫困线以及整体贫困线分解为组内与组间两个部分
总结近年来对破格救心汤的一系列研究及临床运用,发现主要集中于心力衰竭方面,而实验研究也主要是对于心脏功能的评定及君药附子煎煮的成分分析。以此文综述之,以期破格救心
在规律变化迅速的类似股票的时间序列的预测问题上,传统离线模型无法即时对自身进行调整而导致模型准确度降低,而传统在线模型也会因为异常数据导致模型不稳定,为提高神经网
2008SNA下的就业核算制度难以满足分享经济就业核算需求,社会整体就业规模未能得到有效反映。研究分享经济就业核算理论与统计方法,既是了解就业市场现状、把握分享经济劳动
由于现在城市污染严重,人们不仅要关注园林景观的质量,还应关注园林景观的环保建设。在这种环保热潮下,人们最先拥有的应该是低碳意识。本文首先对低碳理念的运用原则进行阐
在有限回归混合模型的应用中,用于变量选择的惩罚似然方法在统计学中发挥了重要作用。然而,普通的惩罚似然方法对离群值很敏感。文章提出了一种稳健的惩罚似然方法,可同时进