基于组块分析的中文短语情感倾向研究

被引量 : 0次 | 上传用户:gudujian123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,特别是论坛和blog等大量的主观性媒体的出现,打破了信息发布者与接收者之间森严的界限,这使文本正在成为最重要的交互方式之一,其中包含的观点信息越来越引起公司和政府的注意。但是这种改变也使网络上的文本信息数量呈爆炸式增长,文本情感倾向性分析作为自动获取其中观点信息的一种手段,成为自然语言处理的一个热点问题。文本情感倾向性分析,就是对说话人的态度(或称观点、情感)进行分析,也就是对文本中的主观性信息进行分析。词汇情感倾向性分析作为文本倾向性分析的基础,有着举足轻重的作用。短语作为词汇和句子之间过渡的桥梁,可以增大情感分析粒度,对提高句子乃至篇章情感倾向性分析系统性能有重要意义。本文针对基于词典的词汇情感倾向性分析方法中对情感词倾向绝对化标注问题,提出了一种获取上下文相关的词汇情感倾向方法。同时针对目前缺少包含上下文相关情感词标注资源的问题,使用最大熵交叉验证和手工校正结合的方法加以构造,并在此基础上构造了上下文相关的特征集合用来预测情感词在上下文中的情感倾向。实验表明,此种方法与基于词典的词语情感倾向性分析方法相比,F值提高了4.9%。针对二词短语情感倾向分析问题,使用了基于规则的分析方法。在此方法中构造了特征模板,使用互信息对组块情感倾向进行计算。并说明了程度副词和否定副词对于组块情感倾向的影响以及收集方法。针对更加普遍的组块情感倾向分析问题,使用了情感分类方法进行分析,本文以短语包含的词的情感倾向以及短语类型等为特征,分别应用了最大熵模型和支持向量机模型对组块情感倾向进行分类,并将结果与传统的基于累加的方法进行比较,最后支持向量机模型取得最好的效果。最后,分别使用词汇和短语对句子的情感倾向进行分析,结果表明使用短语增大了情感分析的粒度,对于句子的情感倾向性分析性能有很大提高。本文使用上述方法,将短语情感倾向性分析分为两个层次进行了研究,分别是词汇情感倾向消歧以及短语情感倾向性分析,句子级别情感倾向性分析结果表明,本文中系统对于文本情感倾向性分析有积极作用。
其他文献
目的通过对骨性和轻度牙性安氏Ⅱ类1分类错患者拔除上4下8,探索这种拔牙方式与常见的拔牙式:上4下4,上4下5对于患者正侧貌美观和咀嚼功能影响的差异,以及在下前牙前部矫治
在一定时期内顺利完成学业、获得稳定工作和经济独立、结婚成家并为人父母,是美国青年工人实现成年转型的传统模式。但过去数十年美国社会不平等的持续扩大,使青年工人的成年
特高压输变电工程工期长,规模大,新工艺应用多,形成了数量庞大的各类档案,因而档案管理工作非常重要.当前,档案管理仍然不够规范,文章探讨了其档案标准化与规范化管理的必要
地下水位的准确监测是掌握地下水资源概况的基础依据和重要手段。晋城市水资办自1985年起即对地下水位开展监测工作,为水资源管理提供了大量详实的基础资料。通过分析晋城市
目的观察多巴胺、去甲肾上腺素、去甲肾上腺素联合多巴酚丁胺对感染性休克病人肾功能的影响.方法符合感染性休克诊断标准的15例病人经过积极的液体复苏后,随机应用血管活性药
随着信息化的迅猛发展,企业面临的IT环境越来越复杂,迫切需要一个松散耦合的、与平台无关的系统来应对外界快速的变化。为此,企业越来越关注面向服务的架构(Service-Oriented
探讨了龙门吊钢丝绳存在的故障问题,并提出了有针对性的解决措施,希望能为相关人员提供参考。
泥石流作为一种自然灾害现象已经在世界范围内引起了广泛的重视。山区暴雨引发的泥石流在一些山区地质构造松散地区是一种频发的地质灾害,有效的预报和降低山区暴雨泥石流的
背景AML1/ETO融合基因阳性白血病是急性髓系白血病的一种亚型,其特点是存在t(8;21)(q22;q22)染色体异位,及异位后形成的融合基因AML1/ETO,该融合基因通过多种途径导致白血病的
文章采用文献资料、问卷调查、数理统计、访谈和逻辑分析等方法,以六安市5县3区中的舒城县为个案,对农村初级中学的体育教师队伍、体育经费投入、体育场地器材设施、体育教学