基于深度学习的网络新闻文本分类系统研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:wanwan1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,文本数据呈现海量的特征,网络媒体及新媒体平台成为新闻传播事业的重要组成部分,网络新闻成为人们重要的信息来源之一。为了满足大量网络新闻阅读用户的需求、提高内容分发平台对新闻进行个性化推荐的效率,迫切需要对网络新闻进行有效的管理和利用。基于此,本文针对网络新闻文本分类进行了算法的研究与系统的实现,目标是构建分类准确率更高的面向网络新闻的文本分类模型。本文所做的工作主要包括以下几个部分:(1)本文基于网络新闻文本长度较短、关键词与类别标签紧密相关的特点,提出了一种新颖的注意力机制,称为“全注意力机制”。与传统的注意力机制不同的是,全注意力机制在每个时刻都对之前时刻及当前时刻进行注意力的分配,因此能使模型内部的资源分配更合理、使关键信息在不同的时刻发挥不同的作用、使被编码器丢弃的信息被重新利用。(2)本文将全注意力机制分别应用于卷积神经网络和双向循环神经网络中,提出了 FACNN(Full Attention-Based Convolutional Neural Network)和 FABG(Full Attention-Based Bi-GRU Neural Network)模型。为了验证本文工作的有效性,在英文数据集(agnews)和中文数据集(chnews)进行了实验。实验结果表明,FACNN和FABG模型均获得了高于其他对比模型的准确率,验证了全注意力机制、FACNN和FABG的有效性。其中,FABG在agnews数据集上达到了 91.79%的准确率,比以往融合注意力机制的Bi-GRU高出了 1.15%。(3)为了验证模型在实际应用中的有效性和稳定性,本文基于提出的模型构建了一个网络新闻文本分类系统。该系统提供了与用户交互的前端界面,后台对FACNN和FABG进行集成来返回模型结果。在该系统中,用户可以选择需要进行分类的文本的语言、输入文本、获得最终分类结果。
其他文献
防水透湿膜是一种具备防水性能和湿气透过性的功能膜材料,可与面料结合制备功能性服装应用于一些恶劣的雨雪或者湿热环境中,既保证人体的防护性能也为穿戴者提供舒适性。静电
信息系统新用户作为系统实施过程中的活力源泉,他们对系统的态度与系统使用行为直接相关,这不仅影响着新用户自身利益,还可能影响信息系统的正常实施。信息系统可以帮助企业取得竞争优势,但企业在实施信息系统的过程中往往面临失败的风险,且信息系统实施失败率较高。为了帮助企业信息系统取得长期成功,考虑到信息系统实施是一个动态过程,影响系统使用行为的因素相应也在变化。因此,本文对新用户系统使用行为进行动态分析,并
金雀花碱N-亚甲基-(5,7-二羟基-4’-甲氧基)异黄酮(CNF2)是由我们课题小组从中草药苦豆子中提取分离出来的,这是一种具有新颖结构的天然活性化合物。经前期的药效学研究证明,CNF2具有明显的抗肿瘤活性,并且可以抑制MDA-MB-231和4T1两种乳腺癌细胞迁移。为了进一步考察其成药性,本文主要测定了CNF2的基本理化性质,建立了HPLC生物样品的定量分析方法以及研究了CNF2在Spragu
近年来,随着传统化石能源的短缺以及环境污染的不断加重,由光伏、风电等分布式电源组成的微电网对解决上述问题具有重要意义。相比于交流微电网,直流微电网因结构简单、损耗低及较好的可控性,且不存在多级变流器变换环节及无需考虑无功环流、频率和功角稳定性等的优点,具有较好的发展前景。实现直流微电网系统各单元间协调控制以保障负荷功率的均衡分配,进而保障系统电压稳定,已成为直流微电网的关键问题。本文采用由分布式电
全息技术不同于传统的摄影技术,它能够同时恢复一个物体的振幅和相位信息,尤其是在三维成像领域有巨大的潜力。因此,自诞生以来,全息技术为研究者广泛关注。近年来,一方面,随着计算机科学与技术的飞速发展,更为简易的计算全息应运而生;另一方面,信息时代的来临,必然要求作为信息载体的全息技术能够实现多通道的信息传输,因此复用全息技术也是当下的研究热点。随着激光的发明,非线性光学得到了迅速发展。由于非线性光学过
农村土地承包经营权流转事关各流转主体尤其是农户的切身利益,长期以来一直受到我国政府和社会各界的广泛关注。然而,近年来流转问题日益凸显,究其原因,就是当前乡镇政府的职
股权激励是当代企业为了留住焦点人才,来实行的一种持久鼓励机制,股权激励存在于期权鼓励之间,是指企业附前提的赐与所激励授予者一部分股东权益,使他们作为股东来介入企业的决议计划,承担企业的危害并从中获得利润,从而使员工加倍勤恳的服务于公司的持久成长的一种达到利益共同体目标的实行方式。伴随着公司股权的日益分散化以及管理机制的日趋复杂多元化,世界各国的大企业为了有效并且合理激励公司员工,纷纷推行了股权激励
近年来,随着海洋资源的开发和利用,如何利用现有资源快速搜索到水下目标成为一个亟待解决的问题。无人水下潜航器(Unmanned Underwater Vehicle)作为一种自带能源、搭载探测设备、自主完成任务的智能运载体为该问题的解决提供新的思路。本课题针对无人水下潜航器协同在线搜索海底目标问题展开研究,使其能够快速完成对水下目标的搜索任务。在解决系统协同在线优化搜索问题时,考虑到UUV的续航能力
近年来,纳税人数量的激增和税源结构的显著变化,让目前税务机关提供的纳税服务和税收征管都面临着巨大的考验。普通的小微企业老板、个体工商户户主难以完全了解最新的税收政策,不能充分地享受税收红利,同时也无法很好的履行纳税义务,因此,迫切地需要依靠专业化的服务机构和从业人员来帮助其办理相关涉税事宜。涉税专业服务的出现,可以缓解政府纳税服务资源不足的问题,发挥中介机构在与政府、纳税人之间进行沟通、服务、监督
在当前市场经济的激烈竞争下,伴随着互联网、大数据、云计算和物联网等新技术的爆炸式增长,企业所面临的竞争压力持续增加,市场竞争情报分析对企业具有十分重要的意义,竞争情报工作愈加重要,已成为企业在资本、技术、人才之后的第四竞争要素。随着生活水平的提高,家用汽车已走进千家万户,针对目前市场保有率最高,同时也是普通群众接触最为广泛的A级轿车及其国内市场进行竞争情报分析,对企业科学决策具有指导意义,对民众最