结合词性信息的基于注意力机制的双向LSTM的中文文本分类

来源 :河北科技大学学报 | 被引量 : 0次 | 上传用户:ez062009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于LSTM的中文文本分类方法能够正确地识别文本所属类别,但是其主要关注于学习与主题相关的文本片段,往往缺乏利用词语其他方面的信息,特别是词性之间的隐含的特征信息。为了有效地利用词语的词性信息以便学习大量的上下文依赖特征信息并提升文本分类效果,提出了一种结合词性信息的中文文本分类方法,其能够方便地从词语及其词性中学习隐式特征信息。利用开源数据并设计一系列对比实验用于验证方法的有效性。实验结果表明,结合词性信息的基于注意力机制的双向LSTM模型,在中文文本分类方面的分类效果优于常见的一些算法。因此识别文本的类别不仅与词语语义信息高度相关,而且与词语的词性信息有很大关系。
其他文献
当2013年12月20日中国移动江苏公司(以下简称江苏移动)正式对外宣布提供4G服务时,全省4G友好测试客户尚不足1000人,数千个4G基站只覆盖了南京、无锡核心城区,移动4G手机只有3
在分析中国草原资源状况、特点的基础上,剖析了草原资源管理面临的困难和问题,为落实生态文明体制改革,实现草原资源永续利用,提出了合理界定草原范围,强化空间规划与用途管
本文采用ProCAST软件模拟了铝合金轮毂低压铸造充型及凝固过程,优化铸造工艺,消除铸件缺陷,使模具的设计和铸造工艺更合理,从而大大缩短开发周期,降低生产成本。在本论文中,
竞技体操是我国的优势项目,是实施奥运战略的重要组成部分,但是,我国竞技体操运动员的运动寿命都普遍偏短,很少有“常青树”的存在。在我国体操后备力量紧缺的时期,研究如何
本论文包含四章内容,绪论介绍了论文工作的背景;第2章到第4章报道了Y2O3∶Eu3+纳米粉末和透明陶瓷的制备、形貌结构表征及发光性质研究结果.绪论首先介绍了近几年重点研究的
人力资源管理是企业的一种核心管理活动,而绩效考评是其中一项关键性工作,激励是人力资源管理的核心,绩效考评和激励是调动员工积极性的重要手段。只有通过科学、公正地评价
新闻故事化已成为电视荧屏上遍地开花的一种电视新闻叙事模式。新闻故事要在新近发生的事实基础上挖掘升华,情节要起伏跌宕,要注意悬念和细节,不过,新闻故事化目前还存在若干
文章较系统地介绍了胜水淳行《犯罪社会学》的第一章“犯罪研究的对象”和第二章“犯罪社会学的概念”的内容。胜水淳行认为,犯罪现象是由犯罪事实,犯罪人及社会三个要素构成
目的:通过检测特发性血小板减少性紫癜(idiopathic thrombocytopenicpurura,ITP)患者外周血CD3~+、CD4~+、CD8~+T淋巴细胞凋亡率、CD8~+T淋巴细胞占淋巴细胞比例及其CX3CR1mR
目的探讨认知行为康复训练对老年2型糖尿病患者焦虑、抑郁等不良心理状态的影响。方法将2014年4月至2017年4月在我院接受治疗的78例糖尿病合并焦虑、抑郁患者随机等分为对照