融合知识的情感分析研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:frergreghrtgtrgt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是自然语言处理领域重要的研究方向之一,主要挖掘互联网用户对于事件、产品或者服务等所表达的情感倾向,其在舆情监控、市场决策等方面具有重要的应用价值。对情感分析的问题来说,人或多或少有一些常识性的知识。例如,我们知道“口味-不错”在餐馆的评论中频繁出现;“价格”和“性价比”在语义上都和价格相关等。如何在情感分析中引入这些显然的、易于获取的知识,从而促进和提高情感分析的性能至关重要。引入知识能够简化模型构建,一定程度上减少对标注数据的依赖,从而使得模型的泛化能力更强。因此,本文从融合知识的角度,对情感分析的若干问题深入分析研究,论文研究的主要内容有:?情感抽取,主要指评价词和评价对象的抽取。本文基于大量的评论数据,通过少量的“评价词-评价对象”搭配引入语法知识来实现情感抽取。其中,语法知识为有效的“评价词-评价对象”间频率较高的语法关系,这些语法关系是在大量数据中的统计得来,而不需要人工定义或标注数据。本文提出的方法充分利用了海量评论数据中丰富的语法关系,相比于现有的情感抽取方法具有明显的优势。?情感和维度分类,主要指评论篇章的情感倾向分类和评论中句子的维度分类。本文将句子级别维度的分类和篇章级别的情感分类形式化成一个有结构学习的问题,并且在模型的结构中引入少量的维度指示词。正是因为引入维度词汇知识,使得句子的维度分类不需要人工标注数据。而且,通过对句子维度和篇章情感同时建模,使得情感和维度分类的性能得到显著提高。?针对单篇评论的情感摘要,本文研究了单篇评论中句子内容重要性排序问题。由于评论中的每句话并不具有相同的重要性,本文提出从句子的文本内容和情感倾向两个方面对其重要性进行排序。其中,句子文本内容排序通过引入若干人工准则作为知识训练排序模型,不需要对句子重要性进行标注。?针对多篇评论的情感摘要,本文从用户需求和兴趣角度,研究个性化、定制化的评论摘要生成。本文提出在话题模型中引入情感和维度等语义知识,使得在不增加模型复杂度的同时对评论的情感和维度建模。本文的方法简单有效,并且在评论摘要生成时考虑用户的需求和兴趣,具有一定的应用前景。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的探讨乳腺癌合并糖尿病患者围手术期血糖监测方法和护理效果。方法选取该院2012年4月—2013年4月收治的乳腺癌合并糖尿病患者80例,在其围手术期的护理中,加强血糖监测,同
要闻版是报纸的脸面,而“头条”新闻尤为重要。它应充分体现党的路线、方针、政策,具有权威性和指导性,它应是受众普遍关心的热点、难点、焦点问题,具有广泛的社会性;它应鲜活、生
也许是因为某种原因她无法与他亲近,也许他仅仅是她暗恋着的意中人,也许他仅仅是她朦胧中的向往,是虚幻中的偶像,总之,眼下她只能一个人咀嚼着孤独,只能让自己来拥抱自己,权当这是他
本文阐述了斜面构成的定义与特征,研究了其作为几何构成要素与现代景观设计之间关系在时代发展中的演变。从体现斜面构成形式的主要景观元素,分析并研究了其表达的性格特征。通
精浆果糖是精液中唯一的糖类来源,为精囊的特征性产物,直接参与精子获能和受精。因此,精浆果糖的测定,对判断男性生育力具有重要的意义。精浆果糖测定是目前的研究热点,本文
髓芯减压术是早中期股骨头缺血坏死"保髋"治疗的主要微创手术方式。本文分析了目前常见的以髓芯减压术为基础的"保髋"手术方案,讨论了单纯髓芯减压以及多通道减压、联合植骨
为了加深对班公湖-怒江缝合带构造演化过程的认识,选择聂荣微陆块内的花岗质片麻岩和花岗闪长质片麻岩中的锆石进行LA-ICP-MS U-Pb定年,结果主要显示两组206 Pb/238 U的加权
本文采用随机抽样的方法,选取上高县新界埠乡10所小学和5所幼儿园627名儿童(含129名留守儿童)为调查研究对象,采用自编调查问卷、访谈(含留守儿童、监护人、学校老师、学校领