评价要素的缺省识别与恢复方法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:ly19900611
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络平台的日益开放,越来越多的评论文本数据呈现出半结构、口语化、不规则等特点,随之语言的缺省现象也越来越普遍。在观点句中,评价对象与属性的缺省可使语言表达简洁,与此同时也给基于自然语言处理技术的观点挖掘带来诸多不确定性问题。随着细粒度观点挖掘相关研究的不断深入,评价要素缺省问题也引起了研究者的关注。为了解决评价对象与属性的缺省问题,本文围绕评价对象与属性缺省的识别与恢复两个任务开展研究,系统性地提出了一套完整的缺省识别和恢复的方案。主要研究工作如下:(1)评价对象和属性缺省项识别方法从句法成分角度,利用关联规则构造缺省项识别规则集,用于获取缺省项待识别的候选集。在此基础上,将缺省项识别问题看作二分类问题,引入词性特征和依存句法特征,利用决策树C4.5分类算法训练分类器模型。在测试集上对待识别的缺省项进行识别,实验结果显示,词法特征与依存句法特征融合后,缺省项识别的精确率达到了66.3%,优于任一单类特征。(2)评价对象和属性缺省项类型判定为了准确地对评价对象和属性缺省项实现恢复,需要评价对象和属性缺省项类型判定为缺省项恢复提供指引线索。本文根据语料中评价对象和属性缺省项的分布特点,分别提出了基于规则匹配和构造动态属性-指示词集(A-I)的方法。通过在汽车评论和手机微博两个数据集上进行的实验,实验结果表明,评价对象缺省类型判定方法在汽车和手机的召回率分别达到了92.1%和67.8%,评价属性缺省类型判定方法的召回率分别达到了91.8%和78.0%,说明本文提出的方法适合于汽车评论数据,同时,也进一步说明微博较论坛评论数据更加不规范。(3)评价对象和属性缺省项恢复针对评价对象和属性缺省项恢复问题,在缺省项类型判断的基础上,对于评价对象缺省项恢复,设计了3种缺省恢复策略,采用最近邻匹配方式用于获取缺省的评价对象。对于评价属性缺省项恢复,利用A-I方法用于获取缺省的评价属性。通过汽车评论和手机微博两个数据集上的实验,评价对象缺省项恢复的精确率分别为61.2%和90.1%,评价属性缺省项恢复的精确率分别为46.4%和45.5%,说明本文给出的评价对象缺省项恢复方法对于评价对象较少的情况效果较好。评价属性缺省项恢复方法在汽车数据集上的整体效果略优于手机,说明语料规模越大,获取A-I的信息越多,对评价属性缺省项恢复的效果越好。
其他文献
竹材建筑的研究是“绿色建筑”理念的重要组成部分。文章从空间形态、表皮肌理和结构营造三个角度研究了竹建筑的设计手法,对著名的竹建筑案例进行建筑学、构造学、社会学及
北京教育学院丰台分院物理教研员曾拥军在2012年第6期《基础教育课程》上撰文认为,高中新课程给物理教学带来了五个变化:一是课程性质、价值和理念的变化——深化科学性。二是
化学概念是整个化学知识体系中的基本单位。如果把化学知识体系比作一座大厦,那么,化学概念就是组成这座大厦的基石。因此,如果学生对化学概念掌握不好,他们是不可能学好化学
如果说英文中有那么一个词让我由衷憎恨的话,那肯定是“再见”这个词了。
男:一、二、三、四女:如果我找到他如果我就是跟着他
会计专业的课程具有政策性强、知识点多、理论与操作并重等特点,针对传统的教学手段局限性较大的问题,运用多媒体技术优化课堂教学,运用多媒体技术进行专业技能训练,努力提升学生
在女性作家文本《简·爱》中,罗切斯特常被女性主义批判者看做万恶父权的代表和简·爱女性意识构建过程中不断解构的权力对象。打倒男性绝不是女性主义者的目的,构建和
文章从现代绿色医院建筑的设计理念、空间形态和多元化发展趋势入手,分析其在人文及技术方面的绿色设计策略。指出现代绿色医院建筑应遵循以人为本与自然性原则,体现本源设计
<正> 改革就是对既有的社会结构和社会功能进行调适和重建的过程,它是一项复杂的社会系统工程。把改革作为特定的对象进行系统的研究就构成了改革学。我们认为,这门学科应当
<正> 亚硫酸盐是一种常用的食品护色剂和防腐剂,最早始于罗马时代,SO2用于制葡萄酒、葡萄汁及制酒用具的杀菌,以后扩大到其它食品。本文就亚硫酸盐在食品中的功能、使用方法