基于深度学习的中文新闻分类算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:zdt19880709
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的迅猛发展,面对数量剧增且结构复杂的文本数据,急需寻找更有效的方式对这些资源进行分类管理。文本分类能够有效的处理文本信息,提高对信息的利用程度。新闻是人们获取消息、了解时事的最有效途径,其内容主要是由非结构化文本数据构成,对新闻分类进行研究具有重大的现实意义,有助于新闻个性化推荐、广告推送等领域的发展。本文主要使用深度学习技术对新闻分类进行研究,主要工作内容如下。首先,对文本分类的研究背景和意义进行介绍,并分析了文本分类的国内外研究现状,对其现阶段所存在问题进行总结,然后从新闻分类的角度,提出了相应的改进算法。其次,针对传统的卷积神经网络在对中文文本进行分类时,存在的特征提取不充分、难以处理句子结构信息和捕获长距离依赖关系等问题,提出了一种基于TCABlstm(Text Convolutional Attention Bidirectional Long Short-Term Memory)的混合神经网络分类模型。该模型对传统的卷积神经网络进行改进,来增强对文本局部特征的提取能力;并构建了结合注意力机制的双向长短期记忆神经网络模型来捕获文本上下文相关的全局特征;最后结合两个模型提取文本特征的优势,以此来提高分类的准确性。再次,针对常用预训练模型训练的词向量存在一词多义的现象,以及分词技术对中文文本分词的影响,采用BERT模型来对字向量进行表征。同时考虑到新闻数据文本内容较长,而BERT模型进行文本表征时受到长度的限制,为增强表征文本的代表性,在使用BERT模型进行分类之前,采用TextRank算法提取新闻关键句信息。最后,将本文所提出的两种算法分别在两个真实数据集上进行实验,结果表明两种模型能够有效提高中文新闻分类的准确率。
其他文献
智能分析与诊断系统在实际应用当中发挥着越来越为重要的作用,针对信号系统设备的管理水平,对保证运输安全生产,起到了重要的作用。基于神经网络的智能分析与诊断系统,更是在安全运输生产中做到及时的发现问题,诊断问题,处理问题的重要手段。对于快速高效并且规范准确的诊断出故障和问题,提出了越来越高的需求。针对网络发展日新月异的今天,做到安全行车,确保运输中的信号监测、报警问题,适应新形势新技术,本文提出一种基
基于视觉的同时定位与构图(Simultaneous Localization and Mapping,SLAM)可以为机器人等无人平台提供环境的三维结构信息、自身的位置以及语义信息,是机器人向智能化发展必不可少的关键核心技术。然而,现阶段的语义SLAM算法多基于深度学习等技术实现,存在实时性差、计算过于复杂的问题,很难真正应用于实际的机器人系统。为解决上述问题,本文针对室内场景,研究了机器人语义地
当前,随着互联网信息技术的高速发展,网络购物逐渐取代了实体商店购物成为了日常生活中主要购物方式之一,用户在网上购买商品时,商品的评论内容成为用户购买商品时的主要参考信息之一。一些商家为了提高自己家商品的销售量或者打压竞争对手店铺中商品的销售量,便发布一些商品的虚假评论信息来欺骗消费者,严重影响了电子商务平台的可信度。由于商品的评论信息数据过于庞大,依靠人工辨别这些虚假评论耗时耗力,而使用传统机器学
进入互联网时代以来,人们的生产生活中时刻产生着大量数据,如何快速高效地理解和利用这些信息,成为了当前的研究热点。知识图谱技术的出现在一定程度上解决了这个问题。在知识图谱中,图谱补全是一个重要任务。本文主要研究知识图谱补全技术中的实体类别补全技术和实体关系补全技术。在实体类别补全方面,针对缺少标注数据的问题,本文提出了一种基于迁移学习的实体类别补全模型。该模型先构建了一个映射关系模型,并用映射关系模
形状记忆合金丝驱动六杆机构移动机器人是一种集形状记忆合金传感、控制、驱动与平面连杆传动于一体的新型移动装置。连杆结构把形状记忆合金丝的往复直线运动转化为驱动轮的连续旋转运动从而实现机器人的移动。这种移动装置不仅结构简单,而且可以低压控制,在医疗器械和特种机器人等领域具有广阔的应用前景。本文提出一种形状记忆合金丝驱动六杆机构移动机器人。在给出移动机器人结构组成及工作原理基础上,依据形状记忆合金的本构
无线传感器网络(Wireless Sensor Network,WSN)是通过在目标监测区域内部署大量无线传感器节点,且传感器节点之间可相互通信而形成的自组织网络系统。WSN已被应用于军事、农业、工业等多项领域,且可被部署在人员无法到达的环境复杂的区域,进行区域监测工作。当由于自然灾害或其他原因导致监测区域内大量节点失效,导致WSN覆盖空洞形成且WSN自身修复机制无法修复网络时,需要从外部引入无人
随着人工智能的迅速发展,结合强化学习技术和机器人技术,研究具备一定自主决策和学习能力的机器人操作技能学习系统,已逐渐成为机器人研究领域的重要分支。自主避障能力是家庭服务机器人最基础、最重要的能力。随着家庭生活环境的日益复杂化,针对家庭服务机器人执行避障任务中面临的避障成功率低、训练时间长等一系列问题,设计出具备自主决策和学习能力的算法成为机器人研究领域的重点。本文针对家庭服务机器人的避障技能学习展
混联机器人是一种以并联机构为基础,在并联机构上连接串联机构,组合而成的混联系统。混联机器人通过串联机构,补偿了并联机构工作空间小的缺点,同时继承了并联机构负载能力好、刚度大、末端件惯性小、响应速度快的优点。但就目前而言,混联机器人工程应用较少,局限于汽车发动机复杂型腔及航天设备复杂曲面加工,特别是专业仿真软件对混联机器人的虚拟加工支持尚不成熟,对虚拟监测的研究也少有报道,本文将对一种混联机床进行虚
随着人类对自然界甚至外太空等领域的研究探索逐渐深入,对于能够在极端和复杂环境下工作的移动机器人需求慢慢增加。步行机器人相对于轮式机器人、爬行机器人和滚动机器人等具有更高的应对复杂地形的能力,与此同时,模块化机器人可以根据任务对象和工作环境的不同改变相应的拓扑结构,使得模块化的步行机器人逐渐成为广大研究人员关注的热点。本文以基于2-RRU/URR并联模块的步行机器人为主要的研究对象,对不同足腿数量的
传感器、计算机技术的发展推动机器人向自动化、智能化的方向迈进,机器人开始广泛应用于智能制造、空间探索和物流系统等行业中。但是面对复杂多变的应用环境,机器人还存在建图不完整和定位精度低等问题,因此导航算法的鲁棒性、准确性成为研究的热点。本文以焊接机器人的自主导航为应用背景,结合移动机器人平台,基于多传感器数据融合,探讨机器人在未知环境下建图和定位的改进方案,实现高质量建图和高精度定位,最后完成机器人