基于深度神经网络的文本表示与分类研究

来源 :北京交通大学 | 被引量 : 11次 | 上传用户：utpaxiao

【摘要】

：

文本分类是自然语言处理领域的经典任务之一,目标是识别出文本所属的类别。文本分类在邮件检测、情感分析和主题标记等领域都有广泛的应用。然而,好的文本表示方法才是提高文

【作者】

：

刘腾飞

【出处】

：

北京交通大学

【发表日期】

：

2018年01期

【关键词】

：

自然语言处理深度学习神经网络注意机制表示学习文本分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本分类是自然语言处理领域的经典任务之一,目标是识别出文本所属的类别。文本分类在邮件检测、情感分析和主题标记等领域都有广泛的应用。然而,好的文本表示方法才是提高文本分类等自然语言处理任务性能的关键。传统的文本表示采用词袋模型或向量空间模型,这不仅失去了文本的上下文信息,还面临着高纬度、高稀疏性的问题。近年来,随着数据量的增加和计算性能的提高,使用深度学习技术对文本进行表示和分类受到极大的关注。采用卷积神经网络、循环神经网络和具有注意机制的循环神经网络等对文本进行表示,然后进行文本分类等自然语言处理任务,都比传统方法有更好的性能。本文设计了两个基于深度神经网络的句子级文本表示与分类模型。具体如下:(1)基于双向循环和卷积神经网络的文本表示与分类模型-BRCNN。BRCNN的输入是句子中的每一个词对应的词向量;在使用循环神经网络来提取句子中的词序信息后采用卷积神经网络来提取句子的更高级特征;卷积操作之后使用最大池化操作来获得句子向量;最后采用Softmax分类器进行分类。循环神经网络能够捕捉到句子中的词序信息,而卷积神经网络能够很好的提取出有用的特征。在8个文本分类任务上的实验表明:BRCNN模型能够得到更好的文本特征表示,获得与现有技术相当或更高的分类正确率。(2)基于注意机制和卷积神经网络的文本表示与分类模型-ACNN。ACNN模型使用具有注意机制的循环神经网络获得上下文向量;然后使用卷积神经网络提取更高级的特征信息;采用最大池化操作得到句子向量;最后,采用Softmax分类器进行文本分类。在8个文本分类基准数据集上的实验表明:ACNN提高了模型收敛的稳定性,能够比BRCNN更好的收敛到一个最优或局部最优解。另外,本文还设计了一个双向注意的注意机制。双向注意的注意机制是通过对前向循环神经网络和后向循环神经网络都使用注意机制得到前向上下文向量和后向上下文向量,然后进行级联得到上下文向量。本文的ACNN模型中的注意机制层使用的即是双向注意的注意机制。

其他文献

某中学一例结核病暴发疫情现场调查分析

目的：对学校结核病疫情及时进行调查处理,控制疫情的传播。方法：对学生密切接触者进行结核菌素试验、胸部X线检查和痰实验室检查。结果：通过现场调查发现16名病人,其中3名涂阳,

期刊

学校结核病暴发调查School Tuberculosis Outbreak Investigate

GVR断路器性能及其在辽河油田的应用

GVR断路器具有紧凑的结构、先进的技术,可终生免维护,其永磁机构性能优良,不但操作动作可靠,而且可与多种控制器配合,尤其适用于环境恶劣、供电要求可靠性高的场所。辽河油田

期刊

GVR断路器性能优良保护灵活在油田应用

民勤县农业水价综合改革现状分析及思考

石羊河流域重点治理规划实施以来,农业水价综合改革成为民勤县农业节水用水、高效用水的工作重点,并取得了一系列成效。基于此,介绍了民勤县农业水价综合改革、农业用水精准

期刊

农业水价改革节水民勤县

经典抗精神病药物对分裂症患者血脂代谢的影响

目的：探讨经典抗精神病药物对分裂症患者血脂代谢的影响。方法：随机抽取78例分裂症患者的住院资料,治疗开始及结束分别查血脂（包括：胆固醇、高密度脂蛋白、甘油三酯、载脂蛋白A、

期刊

典抗精神病药物分裂症血脂Coventional Antipsychotics Schizophrenia Blood lipid

老年性前列腺增生两种手术治疗方式的护理效果观察

目的：探讨传统开放性耻骨上经膀胱前列腺摘除术和经尿道前列腺电切术（TURP）的护理效果。方法：将45例患者按时间倒序的不同术式设立对照组和观察组,通过对两组患者手术满意度、术

期刊

前列腺增生经尿道前列腺电切术护理benign prostatic hyperplasia Transurethral Resection of Prost

明代富户参与基层社会稳定、发展的原因考察

<正>明代方志、墓志及文集中,有诸多关于缙绅、富商之家和地方富户参与基层社会协调与稳定活动的记载。他们的活动主要表现为:立足于血缘关系的族里周济与立足于地缘关系的社

会议

基于深度神经网络的文本表示与分类研究

与本文相关的学术论文