【摘 要】
:
传统的文本分类方法大多数使用单一的分类器,而不同的分类器对分类任务的侧重点不同,就使得单一的分类方法有一定的局限性,同时每个特征提取方法对特征词的考虑角度不同。针对以
【基金项目】
:
黑龙江省自然科学基金资助项目(F201201)
论文部分内容阅读
传统的文本分类方法大多数使用单一的分类器,而不同的分类器对分类任务的侧重点不同,就使得单一的分类方法有一定的局限性,同时每个特征提取方法对特征词的考虑角度不同。针对以上问题,提出了多类型分类器融合的文本分类方法。该模型使用了word2vec、主成分分析、潜在语义索引以及TFIDF特征提取方法作为多类型分类器融合的特征提取方法。并在多类型分类器加权投票方法中忽略了类别信息的问题,提出了类别加权的分类器权重计算方法。通过实验结果表明,多类型分类器融合方法在二元语料库、多元语料库以及特定语料库上都取得了很好的性能,类别加权的分类器权重计算方法比多类型分类器融合方法在分类性能方面提高了1.19%。
其他文献
目的:探讨增殖细胞核抗原(PCNA)及鳞状细胞癌抗原(SCCA)作为评价宫颈鳞癌新辅助化疗(NACT)敏感性及疗效指标的可行性。方法:收集2006年4月~2012年4月桂林医学院附属医院56例IB
我国传统建筑具有独特的民族特色,经过漫长的发展形成了成熟的建筑建造制度。建筑的装饰随着建筑技术的发展不断成熟,它不同于结构,只追求实用合理,建筑装饰是一个朝代的体现
以最低生活保障信息系统的需求出发,重点研究了低保信息系统的设计与实现。本系统采用ASP.NET作为前台开发工具,开发的低保信息系统最终能够实现社会家庭生活数据采集功能管
行政诉讼法实施以来,执行难一直是横亘在其中的一大难题,尤其是行政相对人胜诉执行难的问题非常严重,本文分为两个部分,主要探讨行政机关败诉情况下的执行难问题,并从执行难
课外阅读是一种开放式的不受时间、地点、形式约束的语文学习方式;是课内阅读的延伸和补充。有了良好的课外阅读习惯,不仅丰富学生的知识,开阔学生的眼界,扩大学生的思维,还
为适应经济全球化的到来,我国对国际贸易政策进行了适时的调整。本文从我国国际贸易政策,即加速国内自贸区的建设和改革、“一带一路”战略、转变外贸发展方式这三个方面出发
在新时代文化建设的背景下,高校电影通识教育需形成一个以统一的文化价值观为核心体系:重构电影史、以更合理的电影史标准来选择入史影片,挖掘更宽厚的人文内涵,给予大学生以正确
案例教学法以高仿真性、高模拟性,在教学过程中充分强调师生的双向交流和实际能力的锻炼,有效激发学生创造性学习的积极性。在高职商务英语日常教学中,有效应用案例教学法是
系统地论述了医学期刊所具有的社会功能、经济功能和文化教育功能及我国医学期刊的结构,包括类别结构、出版频率结构、学科结构、语种结构、内容结构、载体结构、时间分布结构
课堂教学是学校教育的基本形式,是整个教育教学活动的中心环节和重要基地。新教学改革不断深入,素质教育向纵深发展,新的教育理念与传统课堂教学方式的矛盾,丰富的教学内容与