论文部分内容阅读
随着网络自媒体时代的到来,越来越多的人选择通过互联网来表达自己对事物的观点和看法。情感分析,就是对含有情感倾向的文本进行分析和处理,自动化地归纳其中所包含情感信息的过程。情感分析技术在舆情监控、市场调查、事件走势预测等领域都有着重要的作用。论文的研究源于舆情监控系统的需求,使用情感分析技术为舆情监控提供判决依据。中文情感分析的研究由于起步较晚,目前大多停留在篇章级的情感分析阶段,不能深入挖掘文本中情感所表达的具体含义。针对上述问题,论文在优化传统情感分析方法的基础上,深入研究语句级的情感分析技术,提出使用依存句法分析的方法,对文本中情感词的上下文进行语法分析,提取情感表达的详细信息。设计并实现了一个多层级网络文本情感分析系统,系统不但能提供快速实时的篇章级情感分析,还提供语句级的情感分析,提取情感持有者和情感对象。本文的主要内容包括:1.研究基于文本分类的情感分析方法,实验了不同文本分类方法用于情感分析任务时的性能。结合情感分析任务的具体特点,对分类算法进行优化和改进,提出了一种粗粒度的实时情感分析方法。2.研究依存句法分析的原理和实现,发现中文中能够表达情感的句法结构。通过分析句子中情感词与其上下文的依存关系对情感表达的影响,提出一种细粒度的情感分析方法。该方法为语句级的情感分析,在给出句子情感倾向的同时,提取情感的持有者和情感对象。3.在上述工作的基础上,结合网页抓取技术和Web前端技术,设计并实现了一个多层级网络文本情感分析系统。此系统提供篇章级的粗粒度情感分析和语句级的细粒度情感分析,并综合大量文本的分析结果提供情感走势分析的功能。最后对系统的功能、性能和速度等指标进行了测试。测试表明,使用本系统进行粗粒度情感分析,将文本分为正向、负向、中性的宏平均F度量为77.2%。细粒度情感分析中,句子情感倾向分析的宏平均F度量为70.4%,在情感倾向分析正确的基础上对情感持有者和情感对象识别的正确率分别为81.6%和72.2%。本系统能够满足不同层次的情感分析需求。