基于深度学习的中文新闻文本分类研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户：jeremeah

【摘要】

：

随着大数据技术的发展,文本分析所面临的数据量正在迅速的增长,对这些数据进行处理,并且从中获取重要的信息以便于管理者进行分析和决策对于社会发展有着重要意义,因此,自然

【作者】

：

刘鸿培

【出处】

：

西南财经大学

【发表日期】

：

2004年期

【关键词】

：

文本分类分词方法深度学习卷积神经网络门限结构 GRU

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据技术的发展,文本分析所面临的数据量正在迅速的增长,对这些数据进行处理,并且从中获取重要的信息以便于管理者进行分析和决策对于社会发展有着重要意义,因此,自然语言处理这一研究领域正受到越来越多的关注。目前,文本分类正在由以统计和机器学习为基础的传统方法向基于复杂神经网络结构的深度学习方法逐渐过渡。然而,传统的深度学习框架在文本处理方面的应用还有着种种问题和提高的空间,本文研究了多种深度学习模型地原理以及在自然语言处理方面的应用,并且提出了使用改进的循环神经网络结合改进的卷积神经网络进行文本分类的方法。具体研究内容及结果如下:1、对国内外自然语言处理的技术进行了文献研究和介绍,对文本分类的基本流程和概念进行了详细介绍,包括分词方法、词向量生成算法、常用深度学习模型原理等。2、对于词向量生成方法,研究并修改了英文环境中最新的词向量化方法ELMo模型,并且将其应用到中文文本分类任务中,与传统的word2vec方法进行了实证效果的比较。3、对于中文文本分类模型,本文基于卷积神经网络和循环神经网络提出了一个新的深度学习模型,通过将GRU和GCNN模型结合,用循环网络和卷积网络对文本信息进行特征提取,并且通过GRU结构缩短原本LSTM结构的训练时间,并且在搜狗新闻数据上的分类准确率达到了95.83%,相比其他对比模型达到了准确率的提升的目的,证明了该方法的合理性。

其他文献

旅游精准扶贫践行体系研究

加强乡村旅游精准扶贫,是实现乡村振兴的重要途径之一。旅游精准扶贫是一种在精准扶贫理念和旅游扶贫理念的指导下,充分发挥贫困地区的旅游资源优势,积极带动当地贫困人口参

学位

乡村旅游旅游扶贫精准扶贫践行体系军营村

同洲电子大股东“掏空”行为分析

一直以来,代理问题都是出现在管理层与股东之间,大家在研究委托代理问题的时候大多把目光都关注在了管理层与股东产生冲突所产生的成本上面,但是在最近几十年,大股东与中小股东之间的委托代理问题也得到了越来越多学者的关注。在我国,上市公司普遍具有股权较为集中的特点,使得国内的上市公司面临大股东持有的股份太多、拥有的权力越大的问题,因此大股东侵占中小股东利益的动机就越强烈。按照目前的经济形势,我国经济方面的制

学位

大股东掏空行为经济后果

基于安卓的城市智能交通流信息发布系统研究

随着我国经济地迅猛发展,私家车保有量急剧增长,高峰时期道路拥堵情况极为严重,国家虽加快城市道路建设的步伐、但仍无法满足车辆增长的要求,城市交通拥堵问题成为亟需攻破的

学位

交通流信息Android技术智能交通

利用颜色特征进行图象检索

在基于内容的图象检索中，颜色作为图象的一种重要视觉信息，已得到广泛应用。对利用颜色特征进行图象检索中的三个关键问题：颜色的表示，颜色特征的提取和基于颜色的相似度量进行了讨论。在此基础上，介绍了利用颜色特征进行了图象检索的具体实例。

期刊

多媒体数据库图象检索颜色特征相似度量

外周导入中心静脉置管术在极低出生体重儿中的应用

目的介绍外周导入中心静脉置管术(PICC)应用于22例极低出生体重儿(VLBW)的经验.方法选择贵要、肘正中、头静脉、腋静脉置管,持续生命体征及血氧饱和度监测(SaO2).结果 20/22

期刊

外周导入中心静脉置管术极低出生体重儿VLBW静脉营养PICC病例分析

基于深度学习的中文新闻文本分类研究

与本文相关的学术论文