情感文本的识别与分类算法的研究与实现

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:sherpa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网中的社交媒体信息迅速增长,利用好这些网络文本数据,并挖掘和分析其中有价值的情感信息,是非常有意义的。所以情感倾向性分析任务已经成为了自然语言处理领域的研究热点。海量的网络文本中,包含观点句和非观点句,其中的观点句也就是主观性文本才是情感分析研究的对象。因此本文首先实现了对主观性文本的分析和提取,再对主观文本进行了进一步的情感分析,研究其是否能够辅助情感倾向性的计算。论文的主要工作包括:(1)在进行情感文本的识别过程中,本文将词语的词性特征作为主客观分类的重要线索。根据词性标注的结果总结了九类主观特征的词性种类。将词性特征与词向量拼接,结合卷积神经网络,并通过实验确定了词性向量的合理维度和卷积核的大小,设计了基于词性特征和卷积神经网络的主客观分类模型。根据实验结果统计加入词性特征使得模型准确率提高了 2%,并比传统的基于N-POS和支持向量机的主客观分类模型准确率提高了将近4%。(2)在进行主观文本的情感倾向性计算时,文本中的转折句和总结句影响着整个句子的整体倾向性。因此本文提出了基于主干分析的情感分析计算方法。本文总结了包含23个转折性连词和总结性连词的连词词典,通过与连词词典匹配识别出整个句子的主干成分。实验结果表明,加入句子的主干分析的情感分析方法比原情感分析模型的准确率提高了 1%。(3)在文本的各个分句中,不同的程度副词对情感词的修饰表达出的情感强弱不同。据此,本文提出了情感权重词向量的情感分析方法。根据不同的程度副词,结合程度副词词典,赋给词向量相应的情感权重。实验结果表明,情感权重词向量的方法比原情感分析模型的准确率提高了 1.6%。(4)本文最后设置了六组情感分析模型的对比实验,使用LSTM神经网络模型,基于情感权重词向量和主干分析的情感倾向性计算方法与基模型比准确率总体提高了大约2.6%。基于主干分析和情感权重词向量的情感分类模型比传统的基于情感词典和支持向量机的情感分析方法准确率高出8%。实验结果表明,加入情感权重词向量和句子主干分析方法对于情感分析是合理有效的,准确率得到了提升。本文对未进行主客观分类的文本数据进行了情感分析实验,结果表明主客观分类后的文本减少了客观文本对情感分析带来的噪声,有助于情感分析的准确性提升。
其他文献
受天主教贞洁观念的影响,《益世报》对节烈事件尤为关注并将其看作是挽救人心风俗的舆论工具。但基督宗教的男女平等理念又是对中国"男尊女卑"的节烈观的否定。《益世报》对
银屑病性关节炎是一种与银屑病相关的炎症关节病,该疾病病程持续时间长,不易根治,终末期可导致受损部位骨骼的僵直、变形,使生活质量大大降低。该病的发病机制尚不清楚,诊断
<正>歌剧作为戏剧艺术,只有具备完整而严谨的结构,才能表现深刻的思想内涵。每一部歌剧中,都会有若干个主要人物,他们大都具有自身所独有的性格、情感、文化背景等特征,彼此
<正>2001年中国加入WTO之后,嘉士伯、百威等外资啤酒企业瞄向中国新市场,发起中国啤酒业长达十年的惨烈的跑马圈地。据苏赛特商业数据显示,2001年以来,中国啤酒市场发生超过8
2015年6月,中国股市遭遇断崖式下跌,恶意卖空的股指期货投机者被舆论称为罪魁祸首。为稳定股票市场,中金所颁布了一系列严格的股指期货管控措施,股指期货“名存实亡”。此后股市逐渐走稳,但由于缺乏股指期货进行风险对冲,系统性风险难以释放,市场流动性逐渐枯竭。为引导中长期资金入市,满足投资者风险管理需求并促进期货市场功能发挥,中金所又于2017年2月至2019年4月连续四次放宽股指期货交易限制。在此背景
当前,网络信息科技在我国发展迅速,城乡居民利用网络媒体参与各类政治、经济、文化等社会活动已经成为一种潮流趋势。随着网民数量的急剧膨胀,以及互联网在政治领域应用的深入,公民政治参与的格局已经发生了深刻的变革,一股急剧增长的政治参与洪流汹涌而来,网络俨然已经成为了解放城乡居民政治参与诉求的一种新型途径。随着经济水平的不断提高和政治现代化程度的不断加深,公民政治参与的广度和深度的扩展是一种必然趋势。但值
随着工业发展对定制零部件的需求日益增长,增材制造技术受到广泛关注。选区激光熔化(Selective Laser Melting,SLM)工艺以其生产周期短、无需模具和夹具、零污染零排放等优势已
目的观察刺参酸性黏多糖(SJAMP)体外诱导人肝癌细胞HepG2凋亡的情况,探讨SJAMP对HepG2细胞线粒体凋亡途径相关膜电位作用机制。方法体外培养人肝癌细胞HepG2,用不同浓度的SJA
本论文针对高采样率、高分辨率的示波器采集系统下,高速高精度采样数据大容量存储与处理系统进行研究与设计。在本项目中,示波器设计指标为:双通道20GSPS或四通道10GSPS实时
[目的]探讨使用高能体外震波(ESWT)治疗长骨骨不连的效果。[方法]本组20例长骨骨折切开复位内固定或石膏外固定治疗后骨不连,2例萎缩型,18例增生型。采用C臂机结合OssatronES