基于信息论的二阶树增广贝叶斯模型的研究与设计

来源 :吉林大学 | 被引量 : 0次 | 上传用户：zhuxianwei00

【摘要】

：

自大型计算机到客户端-服务器的转变后,云计算揭开了IT行业的又一新篇章,与云计算密不可分的大数据也同样引得了人们广泛的研究。在信息数据爆炸的今天,海量数据的存储与分析

【作者】

：

吴杨

【出处】

：

吉林大学

【发表日期】

：

2016年期

【关键词】

：

贝叶斯网络属性加权条件互信息贝叶斯分类器二阶TAN

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自大型计算机到客户端-服务器的转变后,云计算揭开了IT行业的又一新篇章,与云计算密不可分的大数据也同样引得了人们广泛的研究。在信息数据爆炸的今天,海量数据的存储与分析逐步得到了人们的关注,如何最大化地利用大数据这一“财富”更好地为企业或某一行业服务,是大数据时代研究的热点。以医疗行业为例,医学领域的发展也同样离不开数据挖掘技术的辅助,利用数据挖掘技术对海量数据包括大量病人以及病人症状等进行分析决策,在应用技术成熟的前提下不仅提高了医疗行业的信息化使用效率,同时对病症的判断提高了准确度。随着数据挖掘技术不断的发展,在很多方面都已取得了很好的突破,但是就域中变量的因果关系来说,仍是一大难点。而贝叶斯网络与其他算法不同的是,它在分类的过程中考虑属性之间存在的依赖关系,通过描述体现这种依赖关系,并借助这种关系更加精确的进行分类。其最大的优点是能够通过图形化的方式展示变量之间的关系,为此,构建良好的贝叶斯网络模型以及更好的表达变量之间的关系具有非常重要的意义。在贝叶斯分类器的研究进程中,通过对结构模型的研究和扩展,虽然在分类能力上有所差距,但是依据各不相同,最经典的包括朴素贝叶斯(NB)、树扩展贝叶斯(TAN)、均依赖估测贝叶斯分类器(AODE)模型等。其中NB为最为简单的受限制性贝叶斯分类器,研究者们相继以NB为基础,探索并扩展了更加合理且准确度更高、分类性能更好的贝叶斯分类器模型。NB与AODE模型的特点都是复杂度较低,但是AODE在分类性能上明显优于NB模型,在AODE分类器的基础上进行扩展至ANDE虽然具有更高的分类性能,但考虑到ANDE模型在提升分类性能的同时,计算复杂度成级数的增长,在当前的技术实现下很难应用到实际中,因而关注度不高。TAN分类器根据变量间的条件互信息进行链的扩展,实现树增广模型,其分类性能也同样优于NB。NB、TAN、AODE等都在小数据集上表现优异,但是在数据量很大时体现出其劣势,因此,在面对海量数据的时候,尽量避免复杂度过高以实现贝叶斯分类器在大数据集下表现出良好的分类性能。本文的研究目的是以经典且模型简单的贝叶斯分类器为基础,改善模型简单的分类器模型以实现大数据分析的分类性能,描绘出新的贝叶斯分类器模型。以NB扩展到AODE模型为基础,在所有属性节点中每一属性节点作为另一个父节点,并最终进行平均,这样能够更好的利用属性间的因果关系实现分类性能的提高,其缺点是未考虑到冗余属性的噪声影响,因而在一定程度上会对分类性能产生影响。以此为出发点,分析TAN模型的特点,按照NB扩展为AODE的思路,进行TAN模型的扩展,此方法虽然看似是模型的累加,实际上是将NB和AODE等此类模型扩展为二阶的树结构,进而能够提高准确度,按照此思路实现的分类器模型,对数据集进行训练和测试,检查其结果。在此基础上,去掉AODE模型的缺点,即进行属性加权,再次实现TAN模型的扩展,并最终进行数据的检验。即实现属性加权的二阶TAN模型均依赖估测分类器。这样不仅将朴素贝叶斯分类器提升至二阶,同时去除了AODE模型的缺点,创新的同时高效地提升了分类器的分类精度。经实验证明,基于属性加权的二阶TAN模型的均依赖估测分类器能够很好的使用于大数据集中,在大数据集下表现出更好的分类性能,具有很高的精确度。

其他文献

第十五届中国青岛国际塑料橡胶工业展览会中国青岛国际塑料原料及改性技术展览会

展出时间:2013年8月15日-17日展览会地址:青岛国际会展中心(崂山区苗岭路9号)【机械包装模具原材料】四大专题展2.5万m2展出面积,350余家参展企业,1.6万专业观众,全球30多个

期刊

青岛国际会展中心橡胶工业塑料原料改性技术

基于深度图像的识别与配准技术研究

表面检测在工业检测领域具有重要地位,现代智能制造对表面压陷量检测提出了自动化、智能化检测的要求。其中自动化检测就是通过模仿人眼进行检测。目前自动化检测系统基本都

学位

表面形貌检测激光位移传感器深度图像识别配准

全肠外营养在消化系统恶性肿瘤中的临床应用

<正>消化系统恶性肿瘤由于肿瘤导致机体能量消耗的增加,脂肪、蛋白质分解加速以及消化吸收功能障碍,病人常常出现营养不良甚至恶液质,造成手术治疗的失败,对放、化疗耐受力下

期刊

消化系统恶性肿瘤生存期手术后原发性肝癌全肠外营养TPN

浅析司法的功能及其局限性

作为社会发展所不可或缺的组件,为社会的经济、政治、文化的发展提供了保障。但是由于外界环境的影响和司法本身所具有的弊端我们可以了解司法不是万能的,在有些领域使用司法

期刊

司法功能纠纷解决社会和谐司法独立

南乐县2所小学一年级学生家长预防儿童性侵犯知识态度行为调查

目的了解县城小学一年级学生家长预防儿童性侵犯知识、态度及教育活动状况,为开展以社区为基础的预防儿童性侵犯教育提供参考依据。方法采用自填式问卷,对河南省南乐县2所小

期刊

性暴力健康知识态度实践对比研究学生保健服务

物理教学试讲训练指导——教案设计的心理学分析

在教案设计中心理学分析具有重要地位。在师范生的教学试讲中从心理学角度了解学生的认识状况，把握教材结构、特色、内容是帮助师范生进行教案设计的良好途径。

期刊

教案设计心理学分析师范生教学试讲认知状况教材

分流模挤压非对称断面铝型材有限元数值模拟分析

采用了一种基于Deform-3D结合Pro/Engineer的对分流模挤压过程中焊合面相互穿透网格进行重构的技术,并对空心型材分流模挤压过程中金属的流动行为、温度场及模芯受力情况进行

期刊

分流模挤压网格重构数值模拟Deform-3D

湿法烟气脱硫系统数学建模与仿真分析

石灰石-石膏湿法烟气脱硫工艺作为一种技术相对成熟、运行稳定可靠、吸收剂资源丰富、副产物易于综合利用、脱硫效率高的脱硫方法,在大型火力发电厂中得到了广泛的应用。但是

学位

烟气脱硫格栅填料吸收塔数学模型仿真

小学生创造性思维的培养

摘要：本文简要论述了小学生创造性思维的培养，旨在充分调动学生眼、手、口、脑等器官，引导学生积极主动探索知识，努力激发学生的创造性思维，以便提高创造能力，实现教育目的。　　关键词：小学生创造性思维培养创造能力　　数学教学中培养学生的创造能力，首先应该从培养学生的创造性思维入手，使学生的思维逐步具有灵活性、深刻性、独创性。根据陶行知先生“教、学、做合一”理论，我在教学中充分调动学生眼、手、口、

期刊

小学生创造性思维培养创造能力

论青少年公民意识培养的意义

注重公民意识培养是世界各国教育面向２１世纪共同关心的课题。对青少年学生进行公民意识的培养是改变公民教育薄弱的要求，也是发展社会主义市场经济的需要。增强公民意识更是建设

期刊

青少年公民意识市场经济精神文明

基于信息论的二阶树增广贝叶斯模型的研究与设计

与本文相关的学术论文