多分类器融合的文本分类研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:gandianci20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济和信息技术的迅速发展,各类信息呈现出爆炸式增长,而文本数据依旧是最主要、最直接的信息载体。为从海量文本信息中快速有效地提取有价值的信息,数据的分析及利用方法展现出了必要性,这也使得信息检索、信息过滤等技术正在不断被人们深入研究和广泛应用。作为它们的基础工作,文本分类特别是其重要分支的中文文本分类技术具有重要的研究意义。计算机自动判别文本的类别并不是件轻而易举的工作,人们需要预先设定好类别标准,对文本进行符号化描述,转化为计算机能够识别和理解的方式,并设计对应的文本分类算法,从而利用计算机强大的运算能力代替人工进行分类。课题就应用模糊积分进行多分类器融合的文本分类技术展开研究,论文首先说明了相关的研究背景和意义,分析了国内外文本分类技术的研究现状,叙述了本文中采用的研究方法及内容,然后介绍了神经网络分类器与k NN分类器,提出了由于不同的文本分类器各自存在优势与不足,故通过多分类器联合可以进一步提高分类准确性的新观点,而模糊积分则是其中一种有效的联合方法。再对以模糊积分为融合工具的多神经网络分类器的联合文本分类以及多k NN分类器的联合文本分类从建立模型到如何应用于文本分类中进行了详细的阐述,并对这两种多分类器融合的文本分类的适用情况进行了一定探讨。本文所做的主要研究工作是选取BP神经网络分类器、RBF神经网络分类器和采用K-means算法的RBF神经网络分类器,分别利用Sugeno模糊积分和Choquet模糊积分作为融合算子,将多个神经网络文本分类器结合起来,又选取k NN分类器、类内均值k NN分类器及基于中心向量分类方法改进的k NN分类器,利用Sugeno模糊积分和Choquet模糊积分作为融合算子,将多个k NN分类器结合起来,以求得更加理想的中文文本分类结果。论文最后,运用算例将单个文本分类器各自的计算结果和多分类器融合的文本分类结果进行了对比,表明基于模糊积分的多分类器融合的文本分类方法比传统的单个文本分类器准确率有了一定的提高。通过本课题的研究,为中文文本分类算法的优化探索了一种新的思路。
其他文献
在企业财务管理中,良好的会计内控工作,能够有效的管理和控制资金使用,强化财务管理的执行和监督,提高财务管理水平,维护企业利益。然而,在实际工作中,企业的财务会计内控工作还存在
"再生茭",即利用原有"青练茭一号"品种,改变其移植时间和栽培方式,从而改变其孕茭时间和采摘上市时间,其收获时间恰为"青练茭一号"春季供应结束后的空白期,谓之"青练茭一号"
改革开放以来中国经济快速发展,城镇化进程快速推进,社会结构发生深刻变革,城乡居民生活水平全面提升。但随着城镇化进程的不断加速,生态环境问题日益凸显,不同地区频繁出现
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
应用空间啮合原理和旋转变换矩阵理论,推导了圆锥滚子从动件圆柱分度凸轮的理论工作廓面方程及单侧面加工凸轮实际工作廓面方程;廓面采取单侧面加工时,给出了刀具误差对凸轮
将基于模块的构型管理方法应用到民机研制过程之中,在型号研制初期综合考虑需求、设计、制造、客户服务、保障、试飞和适航等各方面的要求,按照模块化思想并规划模块和产品结
流动人口是推动兵团社会经济发展的重要因素,吸纳、集聚流动人口,对兵团经济社会发展具有积极作用。本文依据2011—2017年兵团流动人口动态监测数据,对兵团流动人口的特点、
关于湖北省政协成立的时,历来有两种意见:一是从湖北省各界人民代表会议协商委员会成立之日算起,即1950年10月20日,按此算法,2010年就是省政协成立60周年;另一种意见是从正式
设计构造了3-P//R⊥4r⊥R型三维纯移动的并联机器人机构,进行了机构运动输出特性分析及自由度计算;给出了其位置分析的正、逆解析解,讨论了其运动参数的取值范围,并分析了该
目前,高校教师承担高质量人才的培养任务,同时他们还肩负着塑造高校声誉的重任。他们的身体健康状况关系到学校的发展情况和高等教育发展水平,因此高校教师的身体健康状况需