面向互联网新闻及评论的文本情感分析技术

来源 :北京大学 | 被引量 : 0次 | 上传用户:zz1976aa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的快速发展,互联网已经逐渐成为当今社会信息产生和传播的重要场所。面对每天产生的大量网络信息,如何对这些信息进行观点判断、情感分析等已经成为了当前互联网信息挖掘的重要需求之一。针对这类需求,文本情感分析成为当前研究的热点,一些实用性系统已经在尝试性应用。但是这些技术还不太成熟,有些技术利用了某些领域的特殊信息,如特定产品属性等,具有一定的领域局限性。而针对新闻评论的情感分析工作,目前还很少有人研究。   本文分析了现有的相关工作,发现这些技术中有些重视使用语义资源,有些重视特征抽取的策略,而有些则提出了比较新颖的模型,但他们并没有把这些方面有机地结合在一起。本文以互联网新闻以及新闻评论为研究对象,提出了基于无向图多层次结构模型的情感分析算法和结合质量评定的情感分析算法框架。前者解决了在情感分析过程中,对句子与句子之间、句子与文档之间关系的利用问题,而后者则从网络评论的特点出发,解决了网络评论质量不一,影响分析结果的问题。此外,在语义资源方面,本文通过对已标注语料和一些现有资源的优化整理,得到了多个可用的情感语义资源。   实验表明,基于无向图模型的方法在文档级别上,F值达到了0.907。在自行标注的新闻评论语料中,本文提出的质量评定方法的AUC值达到了0.906的好结果。结合该质量评定工作,新闻评论的情感分析效果获得明显的改善。我们参加了NTCIR第八届情感分析评测,在主客观分类任务中取得了准确率和F值分别排名第一的好成绩。  
其他文献
子午工程由中国科学院牵头,教育部、信息产业部、中国地震局、国家海洋局、中国气象局等共同建设。子午工程包括空间环境监测系统、数据与通信系统、研究与预报系统,有数目众多
脑机接口(BCI)系统的目标是在人与计算机之间建立一个不依赖于人体任何外围的神经系统或肌肉组织的一个信息交互渠道。一方面在临床护理中BCI系统有着重要的应用价值,对于脑瘫
软件复用是实现高效高质的软件开发的切实可行的途径之一。软件资源库是对可复用软件资源进行管理的基础设施,提供了软件资源发布、搜集、检索等功能,为用户复用以往的软件资源
非真实感绘制(Non-Photorealistic Rendering, NPR)是近些年来快速发展的一种绘制技术。不同于传统的真实感绘制方法,它主要采用某种艺术风格(素描、水彩、油画等)对物体进行
随着我国对外经济和文化交流与合作的迅猛发展,“汉语热”在全球范围内也日渐升温。在国际交流大发展的时代背景下,国际汉语教学迎来了难得的发展机遇。而汉语的推广和普及也成
无人艇在海洋环境侦察、扫雷、港口保护、海洋科考等领域具有广阔的应用前景,越来越受到大家的关注。无人艇上通常搭载有摄像机、热像仪等光电传感器,由于受到无人艇在海洋中
学位
在以信息数字化和网络化为主要特征的时代,信息传播的深度和广度都有极大的发展,信息表达的效率与准确性也得到了很大的提高。但同时随之而来的也有一些负面影响,比如数字产
阿尔茨海默型老年痴呆症(Alzheimer’s Disease,AD)是一种神经系统退行性疾病。患者表现为近事记忆障碍,渐渐出现语言、情绪、认知等障碍,最终不能独立生活以致死亡[1]。目前
信息时代的到来,使得人类社会每日产生的数据量呈现出指数性增长的态势。随着数据规模的日渐庞大,数据中蕴含的价值信息的时效性却往往越来越短,因此在不改变传统的流式数据处理
软件复用可以提高软件生产效率、提高软件质量。软件复用中,资源的存储和利用是关键过程。在传统的构件库管理中,资源打包存储后的资源包中仅有资源分类描述。在复用者使用时,在