面向中文网络评论情感分类的集成学习框架

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:fdsa5218
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文针对中文网络评论情感分类任务,提出了一种集成学习框架。首先针对中文网络评论复杂多样的特点,采用词性组合模式、频繁词序列模式和保序子矩阵模式作为输入特征。然后采用基于信息增益的随机子空间算法解决文本特征繁多的问题,同时提高基分类器的分类性能。最后基于产品属性构造基分类器算法综合评论文本中每个属性的情感信息,进而判别评论的句子级情感倾向。实验结果表明了该框架在中文网络评论情感分类任务上的有效性,特别是在Logistic Regression分类算法上准确率达到90.3%。
其他文献
(EV71 ) Enterovirus 类型 71 引起每年导致孩子的几百死亡的严重 hand-foot-and-mouth 疾病(HFMD ) ;然而,当前为 EV71 没有有效处理。在这研究, EV71 poly 蛋白质(EV71-P1 蛋
10月16日,国家主席习近平在人民大会堂同挪威国王哈拉尔五世举行会谈。习近平指出,中挪关系自2016年正常化以来收获了累累硕果。推动中挪关系持续健康稳定发展,符合两国人民共同利益,也符合和平、发展、合作、共赢的时代潮流。明年,中挪将迎来建交65周年,中方愿同挪方以此为契机,共同开辟中挪关系更加美好的未来。习近平强调,双方要不断巩固和增进政治互信,坚持相互尊重、平等相待的交往原则,充分尊重并切实照顾
蛋白质 phosphorylation 是在调整蛋白质功能起一个必要作用的最普通的 translational 以后修正过程之一。Helicoverpa armigera 单身者 nucleopolyhedrovirus (HearNPV )编
Caspases 是有在 apoptosis 的必要功能的 aspartate 特定的 cystein 依赖的朊酶的一个 evolutionarily 保存的家庭并且通常作为不活跃的酶原在房间存在。除了煽动性的 caspa
这次经济增长速度放缓的深层次原因究竟是什么,如何根据造成生产过剩和国民经济增长速度下行的症结,形成有针对性的治疗方案和改革及政策措施,是缓解和解决问题的关键。这里笔者
本文首先对混响室的发展、原理、主要性能参数进行了介绍,在此基础上依据标准 IEC 61000—4—21中的规定,对混响室的校准方式进行了详细介绍和分析,并以辐射电磁场抗扰度为例
5月27日,为期两天的七国集团(G7)峰会在意大利小镇陶尔米纳闭幕。从会后发布的联合公报看,七国集团内部在贸易、反恐、难民等议题上取得共识。各方在联合公报中表示,将保持市场
6月19日,在德国法兰克福,中国国家超级计算无锡中心工程师杨晋吉吉(左二)和中国国家超级计算无锡中心副主任、清华大学副教授付昊桓(右二)展示认证证书。新一期全球超级计算机500
现代金融体系是现代化经济体系的核心。习近平总书记在十九大报告的第五部分"贯彻新发展理念,建设现代化经济体系"中明确指出,"要着力加快建设现代金融",同时"深化金融体制改革,增
<正>Dear Editor, We report the results of a preliminary investigation of data collected between 2005 and 2012. A National Human Rabies Surveillance program was