【摘 要】
:
数据挖掘技术是近几十年迅速发展起来的一门交叉学科。其中的数据分类研究,由于现实生活中很多常用的决策问题都可以与分类过程相对应,其对于实际生活有很重要的现实意义。经
论文部分内容阅读
数据挖掘技术是近几十年迅速发展起来的一门交叉学科。其中的数据分类研究,由于现实生活中很多常用的决策问题都可以与分类过程相对应,其对于实际生活有很重要的现实意义。经典的朴素贝叶斯分类模型虽然是一种简单高效的分类模型。但是由于其要求属性之间满足的条件独立性假设限制性太强,使得它无法准确表达属性之间的依赖关系,进而对分类的精度产生影响。本文在基于互信息的朴素贝叶斯分类(MI-NBC)模型中使用互信息值区分强弱属性,并进行特征选择的思想,提出了基于广义互信息的贝叶斯(GMI-NBC)模型。该模型针对每条样本记录分析,每个特征值所提供给分类的互信息指标值,并以此为依据来划分相对于本条记录的强弱属性。然后在分类开始之前删去弱属性,仅使用强属性进行分类。虽然相对MI-NBC模型,GMI-NBC对每条记录进行特征筛选,进行的特征选择次数更多,但是由于进行的是更加细粒度特征筛选,对每条记录都会留下其中最重要的特征属性,相比MI-NBC一刀切的办法更加细致,更具有针对性。最后通过在多个UCI数据集上进行实验,并比对实验结果,表明GMI-NBC模型在大部分数据集上相对MI-NBC和NBC模型有更好的分类准确度,表明了其可行性。
其他文献
中国是地下水资源蕴藏较为丰富的国家,地下水资源在国家水资源中占有举足轻重的地位。近年来,由于地下水存在着不合理的开采以及管理薄弱的问题,诱发了一系列生态、地质环境
当前,构建公共服务型政府,对于我们国家来说具有重要的现实意义,它既是加强政府自身改革和建设的需要,也是建设社会主义和谐社会的必然要求。而在构建公共服务型政府的体系之
近年来,随着信息技术的高速发展,电子商务行业也得到了迅猛发展。学术界因此也掀起了一股研究网络购物环境下消费者行为的热潮。过去对实体商店的研究早己发现,品牌形象与顾
进入新世纪以来,社区服务在我国城市经济社会发展中的地位和作用与日俱增。党的十六大第一次将“发展社区服务,方便群众生活”写入政治报告。这不仅为社区服务的大发展提供了
Web设计是一个整合了设计学、心理学、技术和商业的综合性学科。在Web设计过程中,需要整体考虑设计的美观性、用户的体验性以及技术的先进性等综合因素。其中用户体验和Web标
在事业单位分类改革的大背景之下,以公立医院为代表的公益二类事业单位人事制度如何发展,成为关注的焦点。通过创新公立医院编制管理方式,建立符合医疗行业特点和医学发展规律的人事制度,充分地调动和激发从业人员的积极性,努力提高医疗服务的质量和效能,是公立医院人事制度改革的关键环节之一。中央文件明确要求落实公立医院用人自主权,探索进行编制管理方式改革创新,逐步实行备案制管理,形成能进能出的灵活的用人机制。江
随着全球性的电力工业结构重组和解除管制的市场化改革,发电商和供电公司都将作为独立的市场主体参与竞争。电能因为难以大规模长期储存且缺乏短期价格弹性,其价格的波动远远
区域上市公司是宏观经济运行的晴雨表。掌握上市公司经营管理情况,分析经营和财务活动中的潜在风险,可防范系统性金融风险,推动经济金融平稳健康发展。但在人民银行日常管理
深化优质服务工作系统研究通过深入分析当前电力企业优质服务工作的战略规划和深化优质服务工作的必要性、紧迫性,通过开展与国内先进行业(企业)的比较分析,找出差距和关键改
利用2018年全国第六次卫生服务调查的江苏省数据,反映家庭医生签约服务对慢病患者卫生服务利用的影响。结果显示,慢病患者对家庭医生签约服务的知晓率及签约率总体偏低;相比