基于深度神经网络的文本表示与分类研究

来源 :北京交通大学 | 被引量 : 11次 | 上传用户:utpaxiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是自然语言处理领域的经典任务之一,目标是识别出文本所属的类别。文本分类在邮件检测、情感分析和主题标记等领域都有广泛的应用。然而,好的文本表示方法才是提高文本分类等自然语言处理任务性能的关键。传统的文本表示采用词袋模型或向量空间模型,这不仅失去了文本的上下文信息,还面临着高纬度、高稀疏性的问题。近年来,随着数据量的增加和计算性能的提高,使用深度学习技术对文本进行表示和分类受到极大的关注。采用卷积神经网络、循环神经网络和具有注意机制的循环神经网络等对文本进行表示,然后进行文本分类等自然语言处理任务,都比传统方法有更好的性能。本文设计了两个基于深度神经网络的句子级文本表示与分类模型。具体如下:(1)基于双向循环和卷积神经网络的文本表示与分类模型-BRCNN。BRCNN的输入是句子中的每一个词对应的词向量;在使用循环神经网络来提取句子中的词序信息后采用卷积神经网络来提取句子的更高级特征;卷积操作之后使用最大池化操作来获得句子向量;最后采用Softmax分类器进行分类。循环神经网络能够捕捉到句子中的词序信息,而卷积神经网络能够很好的提取出有用的特征。在8个文本分类任务上的实验表明:BRCNN模型能够得到更好的文本特征表示,获得与现有技术相当或更高的分类正确率。(2)基于注意机制和卷积神经网络的文本表示与分类模型-ACNN。ACNN模型使用具有注意机制的循环神经网络获得上下文向量;然后使用卷积神经网络提取更高级的特征信息;采用最大池化操作得到句子向量;最后,采用Softmax分类器进行文本分类。在8个文本分类基准数据集上的实验表明:ACNN提高了模型收敛的稳定性,能够比BRCNN更好的收敛到一个最优或局部最优解。另外,本文还设计了一个双向注意的注意机制。双向注意的注意机制是通过对前向循环神经网络和后向循环神经网络都使用注意机制得到前向上下文向量和后向上下文向量,然后进行级联得到上下文向量。本文的ACNN模型中的注意机制层使用的即是双向注意的注意机制。
其他文献
目的:对学校结核病疫情及时进行调查处理,控制疫情的传播。方法:对学生密切接触者进行结核菌素试验、胸部X线检查和痰实验室检查。结果:通过现场调查发现16名病人,其中3名涂阳,
GVR断路器具有紧凑的结构、先进的技术,可终生免维护,其永磁机构性能优良,不但操作动作可靠,而且可与多种控制器配合,尤其适用于环境恶劣、供电要求可靠性高的场所。辽河油田
通过分析现存的健康教育问题,阐述利用现代数字化技术建立资料平台并开展数字健康教育的重要性,提出开展数字化、体系化健康教育工作的建议。
<正>~~
石羊河流域重点治理规划实施以来,农业水价综合改革成为民勤县农业节水用水、高效用水的工作重点,并取得了一系列成效。基于此,介绍了民勤县农业水价综合改革、农业用水精准
目的:探讨经典抗精神病药物对分裂症患者血脂代谢的影响。方法:随机抽取78例分裂症患者的住院资料,治疗开始及结束分别查血脂(包括:胆固醇、高密度脂蛋白、甘油三酯、载脂蛋白A、
目的:探讨传统开放性耻骨上经膀胱前列腺摘除术和经尿道前列腺电切术(TURP)的护理效果。方法:将45例患者按时间倒序的不同术式设立对照组和观察组,通过对两组患者手术满意度、术
<正>一、系统概况上海港交管一期是集雷达、通信、导航、计算机数据处理和显示于一体的高技术系统,是我国最大的水上交管系统,也是目前世界上最先进的VTS系统之一.包括横沙、
<正>明代方志、墓志及文集中,有诸多关于缙绅、富商之家和地方富户参与基层社会协调与稳定活动的记载。他们的活动主要表现为:立足于血缘关系的族里周济与立足于地缘关系的社
会议
为扎实推进预防腐败工作,把惩治和预防腐败体系建设引向深入,11月2日,淮北市妇幼保健院召开医院机构廉政风险防控管理工作动员会,医院领导、职能科主任、党员参会。