深度学习在文本挖掘中的应用研究

来源 :内蒙古民族大学 | 被引量 : 0次 | 上传用户:liqiusheng2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪的时代是信息的时代,随着计算机技术、数据存贮技术日新月异的发展和改进,应用领域也得到了快速扩展,世界也随着信息的大量涌入而发生着天翻地覆的变化,文本数据资源正以指数级的速度增长着.对于许多用户来说面对如此大量的文本信息,但知识却相对贫乏的现象,人们从大量的信息中获取有意义的、相关性强、具有针对性的知识变得困难,所以将文本信息按照某些主题分类是一个迫切需要解决的问题,也是文本数据存储发展的必经之路。从文本挖掘由美国学者H.P.Luhn教授在1957年第一次被提出来以来,现今文本挖掘已经成为数据挖掘领域非常重要的一个分支,它已经广泛的应用在搜索引擎等领域。文本挖掘中特征选择这一过程,可以理解为是一个通过降低了特征空间的维数,从而来实现提高分类算法精度的重要的过程.因此寻找优秀的特征选择方法来对特征空间进行降维,现如今已是一个非常有实际价值的研究课题。  本文首先对文本挖掘的相关技术,文本挖掘的定义和过程,文本挖掘预处理,常用的文本分类器进行了介绍分析,也介绍了分类结果的评判标准和常用的语料数据集,在后续试验中应用这些技术将文本数据转换成计算机可处理的数据结果.并且介绍了深度学习的产生发展经历及其常用的深度学习算法。其次,提出了基于多个自动编码器(Autoencoder)的文本分类方案,并与单个AE进行分类的方案进行了理论分析,进行了相应范围内的实验,给出了对比分析.最后,提出了基于RBM的文本分类方法,进行了相应范围内的实验,给出了基于RBM算法的文本分类方法精确度与基于KNN算法的文本分类方法精确度的对比分析结果和结论。
其他文献
随着社会生产力的发展和社会分工的扩大,国际间的相互协作,相互交往也越来越频繁,国际贸易作为一个国家或地区对另一个国家或某一地区的商品交换的形式(同时还包括劳务、技术
图论的研究始于200多年前.关于图论的第一篇论文是1736年Euler发表的.他用图的方法解决了哥尼斯堡七桥问题.二十世纪三十年代以来.图论在科学界异军突起,活跃非凡.图论中有很多著名
矩阵重建问题是近几年的科研热点,其主要分为矩阵填充和矩阵恢复两个部分.对于普通矩阵的矩阵重建问题,无论是在理论研究,算法设计,还是在实际应用方面都有了丰富的科研成果.然而
Hamilton-Jacobi-Bellman方程(以下简称HJB方程)广泛应用于工程和经济中,其理论和数值解深受人们关注,本文主要讨论一类HJB方程离散问题的数值解中的区域分解法。 我们首先
有限元在节点处的值的收敛阶远远超过其可能的整体收敛阶。我们可以运用有限元后处理技术对有限元解进行处理,获得比一般解更高的收敛阶。本文针对两点边值问题,在一些超收敛估
龙煤矿业集团股份有限公司鹤岗分公司兴安煤矿副井采用的上挂式推车机主要由电动机、减速器、摇臂、自制气动控制安全杆和手动YC型承接装置等组成,设备分散,不能实现集中控制
通过对我国建国后供销合作社所有制性质认识过程的考察和对当前某些认识的澄清,论述坚持供销合作社集体所有制性质对供销合作社健康发展的重要性及其发展的路向。 Through t
随着社会经济的发展,新课改不断深入,高中物理教学越来越被人们所重视。在新时代下,学习迁移在高中物理学习中被广泛地应用,但是在实际的教学过程中,会存在一定的问题,基于此
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.