观点挖掘中评价对象抽取方法的研究

来源 :东南大学 | 被引量 : 16次 | 上传用户:rundahe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
观点挖掘,又称情感分析,是指通过自动分析用户评论的文本内容,得到用户对产品、服务、人物、事件和话题等的情感、态度和观点等,具有重要的理论价值和应用价值。观点挖掘分为粗粒度和细粒度两种,虽然粗粒度观点挖掘已经比较成熟,但是细粒度观点挖掘仍然存在很多问题。评价对象抽取是细粒度观点挖掘中一个重要的子任务,目的是从观点文本中抽取细粒度的评价对象,例如产品本身及其组成部分、属性和特征等。目前,评价对象抽取方法主要分为两类:有监督的和无监督的。前者主要基于隐马尔科夫模型和条件随机场,后者主要基于主题模型和句法规则。近年来,有研究表明基于无监督的句法规则的方法表现出很好的性能,但同时面临一些挑战。第一个挑战是如何快速实现评价对象抽取规则。第二个挑战是如何从质量参差不齐的评价对象抽取规则中自动选择高质量的规则。第三个挑战是如何利用大量无标注的评论文本帮助评价对象抽取。针对这些挑战,本文提出以下解决方案。据我们所知,这些解决方案都是本文首次提出。(1)提出一种基于逻辑编程的评价对象抽取框架,以快速实现评价对象抽取规则。本文采用的逻辑编程语言是回答集编程语言(ASP)。首先将评论句子中单词的词性和句法依存关系等信息表示成ASP事实。然后将已知的评价对象抽取规则转化成ASP规则。最后利用现有的ASP回答集求解器自动实现规则。实验结果表明,该方法不仅高效而且简洁。(2)提出两种自动选择规则的方法,以从质量参差不齐的评价对象抽取规则中自动选择高质量的规则用于评价对象抽取。第一种基于贪心算法,第二种基于局部搜索算法(模拟退火算法)。实验结果表明,两种方法都能够有效地从质量参差不齐的初始规则集中选择高质量的规则子集,从而获得比初始规则集更好的抽取结果。(3)提出一种基于语义相似性和相关性的评价对象推荐方法,以利用大量无标注的评论文本帮助评价对象抽取。首先利用互联网上大量无标注的评论文本学习词汇间的语义相似性和相关性知识。然后利用这些知识和少量种子评价对象向新的领域推荐评价对象。实验结果表明,该方法能够有效利用从其它领域学习的知识向新的领域推荐高质量的评价对象。
其他文献
水下氧弧切割技术是一种传统的水下金属切割方法,由于这种切割方法设备简单,使用方法灵活,适应性广,工效快,技术易于掌握,安全可靠,在国内外仍被广泛采用。水下氧弧切割在工
随着我国反腐力度的加大,惩治贪污贿赂犯罪的相关法律法规在不断完善,对非国家工作人员职务行为不可侵犯性的保护也应受到重视。本文旨在通过实证分析的研究方法,对793个样本进行量刑基准(平均刑量)测试、相关性分析和多元回归分析,根据统计分析的结果来讨论非国家工作人员受贿罪在刑罚裁量中可能存在的问题及原因,最后提出完善建议。量刑基准测试即对从重情节组、从轻情节组、情节竞合组、无任何情节组的平均刑量进行比较
【正】 江泽民同志在十六大报告中指出:大力发展教育和科学事业,坚持教育创新,深化教育改革,优化教育结构,合理配置教育资源,提高教育质量和管理水平,全面推进素质教育,造就
智慧城市近年在中国得到了大力推广和广泛关注,然而长期参与城市和城区建设的规划和设计人员在其中扮演的角色并不显著。本文旨在通过《智慧社区规划研究——以武汉归元寺片
本文对角锥过模变换器在球座标系统进行了讨论,导出设计公式并对变换器试验件进行了测试,其结果与理论分析一致。在毫米波段具有实用价值。
目的采用SF-36量表评价HBeAg阳性慢性乙型肝炎患者规范抗病毒治疗后,其生活质量改善情况及其相关影响因素分析。方法收集该院2010年9月至2016年9月门诊及住院的220例HBeAg阳
2004年,北京市西城区小学1-4年级、初中1年级进入基础教育课程改革。课改初期,与课标教材配套的教学资源奇缺,教师在对教材加工处理中遇到了很多困难,在教学实践中遇到的问题
多视图三维重建直接从多幅二维图像中恢复场景的三维结构,是计算机视觉一个研究热点,在工业检测、逆向工程、城市规划、文物与遗迹保护和展示等众多领域有重要的应用价值。随
塔里木东南区块碳酸盐岩储层岩石组分复杂,石灰岩、白云岩、硅化岩并存,含量变化大,且呈非均匀状态分布。由于不同组分具有不同的测井响应骨架值,岩石组分的变化导致岩石骨架参数
<正>经外周静脉置入中心静脉导管(peripherally inserted central catheter,PICC)相关性上肢深静脉血栓是指PICC导管外壁或血管内膜血凝块的形成,作为血管内异物,直接引起血