基于文本的情绪自动归因方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bjiyguang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情绪作为人类与生俱来的特征,在自然语言处理和人工智能研究中扮演着越来越重要的作用,所以情绪计算在认知科学研究中具有积极的应用意义。同时,随着互联网技术的发展,海量的个人情绪观点都融入到了互联网这个大环境里,因此情绪计算和研究也具有紧迫的现实意义。目前,情绪方面的研究主要集中在文本情绪分析和文本情绪预测方向,但对于深层次的文本情绪归因则相对较少。文本情绪归因研究从文本中自动识别导致个体情绪产生和迁移的原因的方法。现有的主要工作可以分为文本情绪归因语料库构建和从文本中提取触发情绪产生原因的方法研究。由于文本情绪归因语料库在标注的过程中需要大量的人工参与,所以缺乏标准的、公开的语料库,这也导致了文本情绪归因的规则提取和模型构建研究的不成熟;并且,由于该研究处于刚刚起步阶段,所以文本情绪归因模型和特征的研究也尚处于起步阶段。本课题研究分为主要分为三个方面:第一,作为文本情绪归因的基础,首先构建基于微博文本的情绪归因语料库,并通过对语料库进行分析,发现文本情绪原因的统计规律。第二,在对语料库的统计分析基础上,结合微博文本的特点,提取了八个微博语义情绪归因规则。增加这些规则后,采用规则优先级算法,系统的宽松准确率提高了26.73%;同时,为了解决规则优先级算法带来的规则冲突,提出使用基于转换的错误驱动学习算法,使得系统的宽松准确率提高了3.16%;第三,进一步利用统计模型结合语言学特征和距离、语法等特征进行自动文本情绪归因,与基于规则的系统相比,系统的宽松准确率进一步提高了7.92%;该研究还利用主题模型提取了情绪认知知识和情绪语义知识特征,相较于基于语言学特征,距离、语法特征的系统,宽松正确率提高了3.05%;本研究主要的贡献为:第一,构建了基于微博文本的情绪归因语料库,其为世界上面向微博领域内规模最大的文本情绪归因语料库,为后期的模型构建提供数据基础和数据统计依据;第二,设计了微博文本情绪归因规则,该规则能够有效的提高系统的正确率,并使用基于规则优先级算法和基于错误驱动学习算法进行文本情绪归因;第三,将文本情绪归因分别看作是分类和序列标注问题,并且结合主题模型提取的情绪语义和认知特征进行文本情绪归因,该部分研究为以后基于情绪认知知识的深入研究提供了参考。
其他文献
析晶源于成核,成核对晶体结构和尺寸分布起决定性的作用。因此,理解成核的基本原理对控制其性质至关重要。经典成核理论已广泛应用于溶液析晶。近年来一些研究者发现理论预测
目的探讨静脉治疗过程中影响药物剂量的护理因素及对策。方法 80例输注哌拉西林钠他唑巴坦钠患者随机分为对照组和实验组,并采用双盲研究,收集原药瓶和输液器中的残留液计算
目的观察0.5%罗哌卡因等比重腰麻用于前列腺等离子电切术的麻醉效果。方法选择100例ASAⅠ~Ⅱ级,择期行前列腺等离子电切术的老年患者,随机分为两组,罗哌卡因组(R组)布比卡因组(B
目的观察瑞舒伐他汀对原发性高血压合并高脂血症血脂和动脉粥样硬化的影响。方法2009年9月-2010年9月,98例原发性高血压合并高脂血症患者随机分为两组,对照组49例采用常规治疗,
以‘辽园多丽’番茄为试材,在长期定位施肥条件下研究氮磷钾与有机肥配施对产量、品质及土壤酶活性的影响。研究结果表明:氮磷钾肥配施有机肥能够提高番茄维生素C、可溶性固
<正> 一、均匀成核在一定条件下,过冷的蒸气要凝结成液体,过冷的溶体要凝固成固体,过饱和的溶液要结晶出溶质晶体。总之,亚稳的系统趋向于变成稳定的状态。这些物理化学变化
随着我国经济水平的不断提升,我国公路交通业的发展也十分迅速。预应力技术是当前公路桥梁施工中的一项重要技术,其对于工程的施工质量意义重大。本文对预应力在公路桥梁施工中
混凝土工程的施工质量至关重要,因此,要从材料、工艺等环节抓好施工工作,同时要想保证混凝土质量,人的质量意识也是很重要的;同时设计单位、监理单位、施工单住共同努力才能保证混