基于双层卷积神经网络和扩展特征矩阵的中文微博情感分析研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:jixiong520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的发展,微博逐渐成为中国网民日常沟通交流的重要平台之一。作为中文社交网络的重要组成部分,微博平台所同时具备的社交及媒体属性,使得用户可以实时了解社会热点事件,并发表自己的观点和看法。无论是对于社会事件,还是商品评论,微博的舆论往往可以影响甚至改变事件走向。因此,如何快速地挖掘出单个微博话题下微博用户的舆论倾向,为政府和企业提供决策参考,有效的引导社会舆论,成为目前自然语言处理领域的研究热点之一,具有较强的现实和经济意义。传统的情感分析模型,主要方法是基于语言学建立情感词典。但是,语言词典的建立和维护往往需要耗费大量的时间。为了适应中文微博情感分析任务中存在的数据稀疏、忽略微博文本中的表情和词语特征等特点,近年来,关于基于机器学习方法的文本分析算法的研究越来越深入。在微博文本情感的二元分析任务上,本文首先对比了不同的浅层学习模型。然后在卷积神经网络(Convolutional Neural Networks,CNN)基础上,采用了一种融合双层卷积神经网络和扩展特征矩阵的微博情感分析算法Extended-Dual-CNN,尝试在深度学习领域解决微博情感分析问题。本文分别对浅层学习网络在不同生成词向量模型下,在微博情感分析任务上的效果进行了对比。并在此研究的基础之上,讨论了一种融合双层卷积神经网络和扩展特征矩阵的微博情感分析算法。具体而言,首先,通过One-Hot Encoding和Word2Vec模型,将微博语句生成词向量,并作为特征向量输入到朴素贝叶斯、最大熵模型和支持向量机等浅层学习模型中,对比浅层学习模型之间的优缺点,以及词向量模型对浅层学习模型情感分析效果的影响,得到了微博情感分析任务实验上的最佳模型。然后,设计了Extended-Dual-CNN算法,针对微博用户常用的微博表情、肯定或否定词、表达情感的标点符号等多种词语特征,建立扩展特征矩阵。然后将词向量与扩展特征矩阵拼接后的特征,分别使用static和non-static文本编码输入卷积神经网络的两层,最后得到情感分析结果。通过在COAE2014任务4上的对比实验证明,Extended-Dual-CNN算法取得了93.35%的分析准确率。相比于单层卷积神经网络算法和SVM等传统机器学习算法,Extended-Dual-CNN算法具有明显的优势。
其他文献
云贵高原位于青藏高原东翼斜坡,受印度洋西南季风、北非大陆西南季风以及太平洋东南季风的交汇影响,对于研究全球气候变迁有着重要的意义。星云湖位于云贵高原滇中地区江川盆
反讽在现代叙事理论中占据着非常重要的地位,它在叙述事件、塑造人物形象、表达作者情感态度等方面表现出的含蓄、生动、深刻的特点与优势,使中外许多作家在作品中加以运用。
目的医疗机构卫生监督执法力度是卫生监督体系建设的重要组成部分,是反映卫生行政执法能力的重要指标,为掌握朝阳区卫生局卫生监督所医疗机构卫生执法力度情况。方法通过几年
本论文以亚热带常绿阔叶林演替序列上不同地位的物种为研究对象,选择3种自然环境(旷地、常绿阔叶林林窗和常绿阔叶林林下)并比较3种环境的主要环境因子,从生长特征、光合特征、解
不同位置的通风口导致体育馆内部空间效果不同的气流分布,通过建筑设计调度,可达到在相应季节中最大限度地利用自然通风通风口的位置,调节与改善体育馆室内热环境的目的。利
近年来随着中国经济的不断发展,国际地位日益提升,尤其是在“一带一路”政策的引导下,汉语受到越来越多人的关注和青睐。为推动海外汉语教育事业的蓬勃发展,中国国家汉办不遗
战略性新兴产业是引领中国未来经济可持续增长的重要引擎。"十二五"规划以来,金融支持对战略性新兴产业的高成长起到决定性的支撑作用。但由于历史和体制的原因,战略性新兴产
铸件质量取决于其冷却速度,因而研究铸件冷却控制具有重要的意义。控制铸件冷却有一些传统方法,然而目前鲜有在铸造领域应用空腔结构的研究。空腔结构具有保温作用,同时又可
随着世界科学技术水平和经济实力的不断提高,终端能源中电能的比例越来越大,已经成为人们不可或缺的重要元素。而由于全球变暖和能源短缺已成为现代社会的两大问题。一些研究表明,人类生产活动是导致这两大问题出现的主要驱动力。长期以来,政府和公共机构一直在大力推进节能减排。因此,有效利用电能将带来显著的节能效果。研究表明,提供有关用电设备功率消耗的综合信息可以促进潜在的节能20%以上。功率消耗信息的可用性为电
随着云计算的发展,云端的数据处理数成为当今趋势。在云环境下使用数据共享等功能时,由于网络环境的复杂性与不安全因素,需要对数据进行安全保护和访问控制,这就要求使用加密机制。基于密文策略属性的加密(CP-ABE)是当前广泛使用的加密机制,它可以根据用户的属性来设置访问权限,并且保证数据安全。然而,传统属性加密方案在云环境下应用时计算量大,耗能高,访问控制存在瓶颈。针对以上问题,提出以下三点改进方案,主