基于深度学习的汽车评论挖掘及应用

来源 :天津大学 | 被引量 : 0次 | 上传用户:ssjspace
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网随着科技和经济的发展越来越普及,人们随时随地可以轻松的进行网络访问,这就产生了规模巨大内容丰富的互联网数据资源,这些数据中很大的一部分包含了人类的想法、观念、情感和评价等等主观信息,对于这些信息的挖掘对社会发展和经济发展有着十分重要的作用,可是由于这些数据的非结构化和数据量,对于这些数据的分析和挖掘有着很大的困难,本课题基于深度学习的方法,结合爬虫爬取数据,利用自然语言处理和深度学习网络进行了信息的自动学习和统计,并将其落实到工程应用中。本文在开始先对本课题研究内容的由来起源意义进行了阐释,然后介绍课题内容,本课题进行的是算法研究和工程落实相结合的研究方式,于是首先对工程的体系结构和建立过程进行了解释,并对相关的需求分析和应用的技术阐述说明。然后描述了算法研究中,对爬虫技术结合深度学习CNN,数据预处理的Word2Vec技术的原理,和深度学习所使用的网络结构简要说明。接下来对本课题的主要算法工作进行介绍,包括提出的中文验证码验证模型,然后对数据的预处理方式通进行了双向的链接。对于文本数据的挖掘,本课题提出了基于LSTM改进的分类网络,提出了加入对各层隐藏状态加权平均的处理层的LSTM模型。最后进行实验,在自己有效人工标注的数据集、自主生成的数据集和网上公开的数据集进行了实验结果验证,还与传统的流行方法进行了对比试验,多组结果对比验证了本课题提出的方法的价值和效果,并从正确率、召回率等多个方面进行评价。
其他文献
上世纪二十年代,数学家Rolf Nevanlinna引进了亚纯函数特征函数的概念并创建了著名的Nevanlinna理论,该理论推动了亚纯函数值分布论的蓬勃发展Nevan-linna理论在自身不断完善
伪随机序列在编码、密码、码分多址(CDMA)通信系统、雷达、声纳等领域中都有广泛的应用.因此设计具有良好随机性质(如高线性复杂度、低相关性等)的序列是一个很有意义的研究
分数阶微积分理论是在整数阶微积分理论基础上推广发展而来,从提出至今已有三百多年的历史。尤其是近几十年来得到了众多学者的研究,许多重要的成果在物理学、工程学、机械、
研究代数结构的一个很重要的手段是通过它上面的线性变换来刻画其内部元素之间的关系.这些线性变换常见的有自同构和导子.近年来,交换映射也是研究结合代数及李代数的一个很
伪随机序列在测距系统、扩频通信系统、码分多址通信系统、全球定位系统、软件测试和流密码等众多领域中被广泛应用.对一个周期序列,把生成该序列的最短的线性移位寄存器(LFS
蛋白质及其相互作用在各种生命活动中起着至关重要的作用。复杂的蛋白质相互作用网络中包含着许多具有研究价值的信息,亟待有效的方法对其进行深入分析与挖掘。结构域作为蛋
学位
非线性偏微分方程有着广泛的背景,通常产生于自然科学与工程领域,因为它能很好地描述自然界中的重要现象,所以一直以来受到大量科研工作者的广泛关注.本文主要利用限制变分方
中美关系中的一个重大麻烦是台湾问题。美台关系至今仍是牵制和干扰中美关系正常发展的一个主要因素。冷战中的1960年代初期,肯尼迪政府酝酿着对华政策的调整,但在对台关系和
会议
偏微分方程的精确能控是控制理论中的一个重要研究课题,有重要的理论意义和应用价值.本文主要研究非柱状区域上波动方程的精确能控性.本篇论文共分为三章.第一章是绪论,主要