贝叶斯学习理论及其应用研究

被引量 : 180次 | 上传用户:yhmlivefor48
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯学习理论使用概率去表示所有形式的不确定性,通过概率规则来实现学习和推理过程。贝叶斯学习的结果表示为随机变量的概率分布,它可以理解为我们对不同可能性的信任程度。本文介绍了贝叶斯学习理论的基本观点和它的研究现状与意义,并就贝叶斯网络的表达能力、学习过程和推理机制进行了研究和讨论。在此基础上,主要研究了贝叶斯学习理论中的几个关键问题:贝叶斯网络分类模型、主动贝叶斯分类器、基于贝叶斯潜在语义索引的文本挖掘和基于贝叶斯模型选择的聚类分析。本文的贡献包括以下几个方面:朴素贝叶斯分类模型和特征约简:提出了一种基于类条件分布的特征约简方法,该方法去除在各个类别中分布近似均匀的特征,从而在对概率估计影响较小的情况下,使数据的类分布熵降低。试验表明,该方法在选取与信息增益约简法同样个数的特征时,能显著提高分类的精度。同时给出了朴素贝叶斯分类模型的参数学习方法,研究了朴素贝叶斯分类器的最优性条件,指出决定贝叶斯分类的因素是最大后验概率的顺序而不是具体的后验概率估计数值。讨论了增强朴素贝叶斯性能的三种方式:增加扩展弧、选择贝叶斯分类器和提升贝叶斯分类器。主动贝叶斯分类器:提出了一种主动贝叶斯分类模型,该模型主动的从未标注样本集中选择有利于改进分类性能的训练例子。候选的未标注样本不必与已标注的样本直接作比较,而是通过分类模型对其作出评价,同时模型的参数修正也可增量地进行。给出了基于最大最小熵的主动学习和基于不确定抽样与最小分类损失相结合的主动学习策略,讨论了增量地分类测试实例和修正分类参数的方法。人工和实际的数据实验结果表明,该方法在带有类别标注的样本较少的情况下,获得了很好的分类效果。基于贝叶斯潜在语义分析的文本挖掘:提出了一种半监督文本挖掘算法。在贝叶斯潜在语义模型的框架下,由用户提供一定数量的潜在类别变量,而不需要任何带有类别标注的样本,将一组文档集划分到不同的类别中。它分为两个阶段:第一阶段,利用贝叶斯潜在语义分析来标注含有潜在类别变量的文档类别,第二阶段则通过朴素贝叶斯模型,结合未标注文档的知识,对剩余的文档贴标签。实验结果表明,该算法具有较高的精度与召回率。基于贝叶斯模型选择的聚类分析:提出了一个基于贝叶斯后验概率的模型选择算法。与基于贝叶斯混合模型的聚类相比,我们给出了后验概率的直接表达式,而避免了EM迭代。对于参数的学习,我们给出了两种不同的贝叶斯估计策略:最大后验估计和条件期望估计。基于该后验模型,设计了一种层次聚类算法。通过测试,两组数据准确
其他文献
中国法学会商法学研究会2004年年会曾就我国商事登记制度现状及其完善构想进行了充分探讨,可见,对我国商事登记制度的研究具有极为重要的理论和实践意义。这也从另一个方面反映
上海市民营企业在国民经济和社会发展中发挥着越来越重要的作用,本文力图通过对上海市民营企业中高学历青年的实证调查,采用问卷和个案调查收集资料,从社会学角度对其生活质量进
高射频是提高自动武器命中概率的主要技术途径之一,本文所研究的高频点射步枪是对于自动武器新概念及新结构的探索,包括以电子方式控制发射的高频点射弹药以及适合发射该种弹药
我国汽车工业近几年飞速发展,产量持续增长,品种不断增加,实施精益制造成为汽车行业的重点推进项目,精益制造的最终目的是消除浪费。提高精益生产指标:如FTT(First Time Thro
在当今社会竞争中,市场营销活动是企业获得竞争优势、取得竞争力的重要依据。企业若想在市场中占有较高的市场占有率,必须开展良好的市场营销活动。本文结合兖州东方机电有限公
确定了反式白藜芦醇苷(醇)向顺式白藜芦醇苷(醇)的转化率方程分别为y=0.05x+19.137和y=0.2219x+3.7006。 高效液相色谱(HPLC)法测定葡萄酒中白藜芦醇含量的条件为:流动相A
坝体的破坏和失事使土石坝渗透破坏机理的研究成为一个迫切需要解决的问题。特别是近年来面板堆石坝的迅速发展使堆石坝料中渗透特性的研究更加迫切。尽管粗粒料中的非达西渗
学业自我既是个体自我结构系统中的重要组成部分又是学生学习的动力因素,一直是人格心理学、教育心理学关注的课题和研究热点。本研究在对国内外学业自我研究资料综述分析的基
本研究在甘南藏族自治州合作地区牧场随机选取年龄在1岁左右发育正常、健康无病,自然放牧下的阉割甘南藏羊6头和相同条件的阉割蒙古羊6头为研究对象,进行宰前采血,采用利用氨
随着世界经济的快速发展,能源的消耗量却在逐年增加,在地下常规能源的储量愈来愈少的今天,怎样充分的利用现有的地下常规能源,实现用有限的资源获取更大的经济和社会效益,已经成为