融合知识感知与双重注意力的短文本分类模型

来源 :软件学报 | 被引量 : 0次 | 上传用户:Ddaqdd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类任务作为文本挖掘的核心问题,已成为自然语言处理领域的一个重要课题.而短文本分类由于稀疏性、实时性和不规范性等特点,已成为文本分类亟待解决的问题之一.在某些特定场景,短文本存在大量隐含语义,由此给挖掘有限文本内的隐含语义特征等任务带来挑战.已有的方法对短文本分类主要采用传统机器学习或深度学习算法,但该类算法的模型构建复杂且工作量大,效率不高.此外,短文本包含有效信息较少且口语化严重,对模型的特征学习能力要求较高.针对以上问题,提出了KAe RCNN模型,该模型在TextRCNN模型的基础上,融合了知识感知与双重注意力机制.知识感知包含了知识图谱实体链接和知识图谱嵌入,可以引入外部知识以获取语义特征,同时,双重注意力机制可以提高模型对短文本中有效信息提取的效率.实验结果表明,KAe RCNN模型在分类准确度、F1值和实际应用效果等方面显著优于传统的机器学习算法.对算法的性能和适应性进行了验证,准确率达到95.54%, F1值达到0.901,对比4种传统机器学习算法,准确率平均提高了约14%, F1值提升了约13%.与TextRCNN相比,KAe RCNN模型在准确性方面提升了约3%.此外,与深度学习算法的对比实验结果也说明,该模型在其他领域的短文本分类中也有较好的表现.理论和实验结果都证明,所提出的KAe RCNN模型对短文本分类效果更优.
其他文献
自我国恢复高考以来,心理健康教育就被纳入我国高校的教育体系之中,并且得到了一定的发展。然而,就当前的高校心理健康教育发展现状来看,多数高校的心理健康教育仍集中于解决部分学生的心理问题,导致心理健康教育工作全面化、个性化、系统化不足。在这样的背景下,高校心理健康教育的发展也面临着不小的阻力。将积极心理学运用于高校心理健康教育中去,能够提升高校大学生的身心健康发展水平。本文基于积极心理学视野,探讨研究
就业是最大的民生工程,同时是社会稳定的重要保障。而经济和环境是影响就业的重要因素,研究两者对就业的影响方向及作用机制,对实现充分就业具有重要意义。有别于已有研究考察经济或环境单个因素对就业的影响,选取2008—2017年30个省(自治区、直辖市)的数据构建动态面板模型,将经济和环境纳入同一分析框架,研究经济增长、空气污染及两者交互项的就业效应和作用机理。研究结果表明:第一,经济增长、空气污染的就业
人物造型设计是我国很多影视作品中展现人物形象、性格以及地位的重要途径,在我国影视行业发展中,良好的人物造型设计是助推影视作品人物形象效果升级的重要技术手段,在实际工作中,人物形象塑造中必须注重人物造型的设计。本文首先就人物造型设计进行了分析,而后探讨了其在影视人物形象塑造当中发挥的作用。
<正>[教学设想]司马迁的《史记》被鲁迅盛赞为“史家之绝唱,无韵之《离骚》”,其“摩形传神,千载如生”的人物刻画艺术,成为后世典范。而《高祖本纪》《项羽本纪》是其中的精彩篇目。本教学设计以“欣赏个性化的人物语言”为微专题,从纵观始皇、慷慨悲歌、抉择考验和成败归因四个角度对二者进行比较阅读。
期刊
<正>研究目的和研究方法研究目的:本白皮书通过盘点国内移动应用发展环境、热门技术创新动态,分析影响移动应用发展的技术趋势,以及细分应用领域的技术创新热点,洞悉开发者所面临的挑战和机遇,帮助开发者厘清不断发展的技术局面,提供可落地的行业洞察。
会议
<正>一、基本情况重庆市璧山区位于长江上游地区、重庆大都市区内,紧邻重庆主城区,曾因工业污染、养殖污染,给农业生态环境造成重大影响。近年来,璧山区通过修建冬水田、生态湿地等办法,有效阻止了农业生产中的氨氮总磷污染河流,同时通过建立水污染防治管理信息系统,对水质进行全方位监测,有效改善了河流水质。
期刊
在素质教育背景下,高中音乐的重要性逐渐凸显,尤其是对于正处于人生成长的重要时期的高中生。结合学生的实际情况分析,积极开展教育教学指导对学生而言具有重要的意义。而生活化教学作为一项重要理念,有助于丰富音乐教学的内涵,提高学生学习音乐知识的积极性。基于此,本文将结合生活化理念在高中教学中的运用意义,从融入生活化元素、创设生活化情境、组织生活化练习、创造生活化作品、结合生活化活动多个视角分析,具体阐述在
目的 探讨急性大动脉粥样硬化(large artery atherosclerotic, LAA)性脑梗死患者早期神经功能恶化(early neurological deterioration, END)的危险因素。方法 回顾性分析310例急性LAA性脑梗死患者,并将51例END患者设为试验组和259例非END患者设为对照组。比较2组患者的年龄、性别、高血压病史、糖尿病病史、血小板、糖化血红蛋白、
唐代书法比肩两晋,是书法发展史上的一座高峰。学界对唐代书法的研究主要集中于美学、艺术学等方面,对书法术语的研究也仅限于术语翻译和审美术语的阐释,从语言学角度探究唐代书法术语的成果较少。本文以唐代书法术语为研究对象,以唐代书论为主要语料来源,对唐代书法术语进行收集、整理,共筛选出书法术语490个;借助《汉语大词典》《辞源》《辞海》等工具书从语言学角度对部分书法术语进行考释;结合术语学、词汇学知识探求