中文词语情感倾向研究

被引量 : 0次 | 上传用户:tzxyqzch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的发展和网络的普及,以文本形式出现的信息越来越多,逐渐成为我们最容易获取也是最为丰富的一种交互资源,因此情感倾向分析也逐渐成为自然语言处理领域中一个新的热点。情感倾向分析的研究大致可以分成词语情感倾向性分析、句子情感倾向性分析、篇章情感倾向性研究、海量信息的整体倾向性预测四个研究层次。文本情感倾向性分析,就是对说话人的态度(或称观点、情感)进行分析,也就是对文本中的主观性信息进行分析。而词语情感倾向分析是对单独的词语或者实体的极性、强度和上下文模式进行分析。因此词语情感倾向分析是文本情感倾向分析的前提和基础。目前,在国内情感分析方面的研究还比较少,因此本文在这方面的研究具有重要深远的意义。针对目前情感倾向分析用资源的状况,本文具体分析了情感词典的构建方法,通过对比说明词语的情感倾向分析的难点与限制;此外,本文具体介绍了程度副词、否定副词、连词等在情感分析过程中的作用与收集方法;最后介绍了情感语料库的建设现状。针对词语的情感倾向分析问题,本文在情感词典的基础上,引入了X~2统计和朴素贝叶斯分类相结合的词语情感倾向分析方法,实验结果显示它能很好地发掘文本中新出现的情感词;此外,本文提出了利用情感短语模板识别文本中的情感短语,实验结果显示在结合情感词和情感短语后,判断的各项评价指标都有明显的提升。针对文本的情感倾向分析问题,本文对比了传统的文本情感计算方法和文本情感分类方法,突出了后者在文本情感分析任务中的重要角色;针对文本情感分类方法,本文在以情感词和情感短语为目标特征,以信息增益和X~2统计值为特征选择策略,选用了朴素贝叶斯和支持向量机为分类算法,通过对比选用最好的方法,实现了一个基于情感词典的文本情感倾向分析系统,实验结果表明该系统在中文倾向性分析评测语料上可以达到86%的准确率。
其他文献
始于2007年3月的美国次级抵押贷款危机,在历经两年的时间之后,已经蔓延到全世界。无论是美国、欧洲、中国还是其它国家都在为拯救这次世界金融危机使出各种手段,注入数万亿资
目的比较某品牌国产与进口胎牛血清用于培养MDCK细胞及分离流感病毒的效果。方法除胎牛血清外,在其它条件相同的情况下培养同批MDCK细胞,比较贴壁情况和细胞形态。选择在两种
通过介绍广钢工人体育馆钢网架工程滑移脚手架现场安装过程,说明滑移脚手架安装法在平板网架安装中应用的技术先进性,可取得明显的综合经济效益。
目的通过收集并分析昆明市社区卫生服务机构工作和资源配置状况,评价其所处建设水平,探索对"六位一体"服务的评估方法,为社区卫生服务的发展和建设提供参考。方法以2005年昆
目的探讨贲门周围血管离断术加胃底血管横断术应用于晚期血吸虫病(晚血)门静脉高压症患者的效果。方法选择阳新县第三人民医院自2006年以来实施贲门周围血管离断加胃底血管横
在分析陕西省现代服务业内部结构特征和变化趋势的基础上,运用偏离-份额分析法,以全国为参照系分析了陕西省现代服务业的内部结构,对陕西省现代服务业发展的合理方向和结构调
近年来,随着经济全球化步伐的加快,世界上各城市之间对资金、人才、游客甚至注意力的争夺日趋激烈。每个城市都在为提升自己的城市竞争力和吸引力采用各种各样的措施。城市营
朱熹山水游记是朱熹散文乃至朱熹所有文学作品最重要、最具文学性的一类。由于各种原因,迄今研究者尚未给予其应有的足够重视。本文在初步考察朱熹山水文学的整体创作状况及
古人自然方位尊卑的主要特征是崇阳。在君位之下,现实世界的朝堂礼仪场景以东为尊;神灵世界和室内场景以西为尊;在面位过滤的作用下,自然方位的阴阳因素投射是形成左右尊卑的
<正>场景化的传播趋势,可能给户外传播与活动传播以新的机遇。近年来,传统户外广告市场由于中国持续进行的城市改造与整治,受到了相当大的发展制约;同时,传统的户外传播方式