基于标签传播的网络评论情感分析

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:jorby289702834
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“web3.0”时代以及新媒体时代的到来,以社交平台为载体获取最新资讯、传递个人观点、表达群体诉求成为社会发展的重要趋势。而情感分析的目的是为了找出表达群体在某些话题上或者针对一个文本观点的态度以挖掘出有价值的信息,这些有价值的信息可以服务方方面面。因此,情感分析起着举足轻重的作用。然而数据量的暴增,导致了情感分析过程中人力物力的大量损耗。在此基础上,计算机自动完成情感分析的技术应运而生。情感词典作为情感分析任务中极为重要的工具,其构建问题也逐步成为自然语言处理领域的热门研究方向。但现有的情感词典存在覆盖率有限、领域适应能力较差等问题。因此,构建覆盖率较广,领域适应能力较强的情感词典成为了此领域的核心挑战。本文将半监督学习方法-标签传播运用到情感词典的构建中,通过构建覆盖率广,领域适应能力较强的情感词典来提升对网络评论进行情感分析的准确率。基于上述的研究背景,本文针对网络评论情感分析所做的工作如下:1.为了处理情感词典覆盖率有限、领域适应能力较差等问题,本文提出了一种新的种子词选取方法。先基于通用词典人工选取种子词,再利用人工选取的种子词在语料上进行词向量训练,进一步选择从而得到扩展后的种子词。最后通过计算种子词与候选情感词的相似度构建传播图和传播矩阵,进一步使用标签传播算法获取情感词的极性以构建对应的情感词典。2.为了解决网络词语的涌现以及Word2Vec将不同极性的词语归为一类的问题,本文提出了基于Word2Vec和改进互信息的多分类情感分析。通过人工选择部分网络热词,基于语料进行词向量训练,然而Word2Vec存在将不同极性的词语归为一类的问题,所以在标签传播的过程中采用改进的点互信息PMI来计算词语间的相似度,一定程度提升了词语标注准确率以提升情感分析的准确率。本文分别在公开的电影评论数据集和亚马逊购物数据集上实验验证了提出方法的有效性。
其他文献
香科科属植物资源丰富,药用历史悠久。近年来其化学成分及药理作用的研究引起了国内外研究学者的密切关注。该属植物中主要含有萜类、黄酮类、苯丙素类等多种成分,药理研究证
聚四氟乙烯(PTFE)具有良好的耐化学腐蚀性能、耐热性能、耐老化性能等一系列优异的特性,是一种极具发展潜力的防腐和减摩材料。但是,PTFE的耐磨性能很差,不能满足严苛工况下
在前期研究的基础上,对紫斑牡丹叶片的抗寒性指标在自然降温过程中的变化进行观察和比较分析。结果表明:紫斑牡丹叶片的表皮厚度、角质膜厚度、叶脉突起度、叶片组织结构紧密
现代社会的实质在于社会繁荣与其成员的成长并行不悖,它强调如何依人的不同特点而自由发展。法律正义一方面需要保障多元发展之"义"的实现,另一方面需要在这种多元之"义"的基
产业新城作为我国新型城镇化建设的代表性区域发展样本,承载着国家区域经济社会稳定发展的重要使命。金融集聚作为一种特殊的产业集聚,不仅可以对传统金融业功能效用强化升级
从全球板块构造环境来看,与洋脊俯冲有关的板片窗占据绝大部分比例,俯冲洋脊板片正处于新生过程,热量大,具有正浮力(〈10 Ma),在俯冲过程中容易撕裂形成板片窗。南海古扩张脊沿
由于企业本身知识的局限性,为了获得创新性成果,企业会寻求合作来增加创新,而与高校的合作的成本优势、知识优势很好的弥补了企业自身的不足,使得企业与高校合作(产学合作)成
为了将新型吸附材料用于处理染料等有色污染物,选用了实验室自制新型活性炭-二氧化硅吸附材和市售活性炭用UV光谱法研究了它们对茜素红溶液脱色效果。结果表明,新型吸附材料较
目的:通过鉴定小鼠睾丸、附睾和前列腺组织细胞外囊泡(extracellular vesicles,EVs)的蛋白,明确睾丸、附睾和前列腺来源的细胞外囊泡的蛋白组分在精子发育成熟及功能维持方面所发挥的不同作用。方法:使用TEI(Total Exosome Isolation)方法分别富集小鼠睾丸、附睾和前列腺组织的EVs,用免疫印迹分析EVs标记蛋白的表达,在透射电镜下观察EVs形态,用动态光散射粒
培养学生的创新思维是实施以创新为核心的素质教育的一个重要方面.而课堂教学正是培养创新思维能力的基本途径和主要场所,它所面临的任务就是开展创新教育,开发学生的创造力,