商品评论的摘要提取研究

被引量 : 1次 | 上传用户:xinduolian1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几年来Web2.0的飞速发展,人们见证了互联网给社会生活各方面带来的深刻变革。电子商务是互联网发展的产物之一,它的繁荣也逐渐改变着人们的购物习惯。现如今,很多电商网站不仅仅是人们购物交易的平台,也是允许用户自由发表商品的评论的交流平台。用户的评论无论对潜在消费者还是生产厂商来说都蕴含着大量有用信息:潜在用户会根据以往用户的评论来对商品有一个更直观的了解和认识,以作为购买决策的参考,而生产厂商也可以通过分析用户评论追踪用户反馈,了解产品的市场反响和产品研发方向。然而,随着电子商务市场的欣欣向荣,在线商品评论数量也在爆炸式的增长。对某些热门商品来说,成百上千条的评论数量也非常常见。作为一个即将进行购物的用户,以人工分析的方式从大量先前评论中获取商品各个方面的综合评价变得十分困难。因此,自动化地对大量商品评论做出合理分析并提取符合特定规范的摘要具有一定的研究意义和应用价值。在这样的背景下,本文对商品评论摘要提取所涉及到的评论要素抽取、评论情感分析、摘要生成方法等方面做了详细研究。具体研究内容包括如下几个方面:(1)关于商品评论要素抽取,一方面针对传统的基于Apriori关联规则抽取商品属性词方法提出了改进:利用PMI算法对属性词抽取噪声进行过滤,提高了抽取准确率;另一方面,提出了基于机器翻译模型中的词对齐方法对已知属性词对应的评价词进行抽取,并提出了通过建立评价词与隐式商品属性词映射的方法对隐式属性进行抽取。(2)关于商品评论情感分析,本文提出了基于先验情感词典与句法依存关系分析相结合的情感分析方法对主观评论语句情感极性进行判断。(3)关于摘要生成方法,为了能够尽可能全面的将商品评论的重要内容进行提取,并高效的组织摘要,本文提出了一种基于商品属性词聚类、评论相关度排序及情感倾向分析统计的结构化摘要生成方法。为了检验本文提出的上述方法,分别对各项工作进行了实验验证。从实验结果可以看出,本文提出的方法达到了预期的效果。在文章的最后,对全文进行了总结,并展望了下一阶段的研究方向。
其他文献
针对新兴的视频卫星数据在道路监控中应用研究较少的问题,该文提出了一种基于特征的视频卫星数据运动车辆提取优化算法。以SkySat-1卫星获取的Las Vegas地区的视频数据为实验
获取营运车辆的时空大数据,识别车辆运行区间、车辆运营时长、车辆运行车速等关键参数,对于深入挖掘车辆位置的空间、时间分布特征具有重要意义。在分析卫星定位系统的数据特
函数的凹凸性是函数的一个重要性质,主要用于高等数学,在数学的各分支中都有着广泛的应用.在高中数学教材中,函数凹凸性并没有给出明确的定义和性质,但它的身影却在高考题和
[目的]对水产品中组胺含量的测定方法进行比较研究。[方法]利用液相色谱-DAD检测法及紫外可见分光光度法测定组胺含量。[结果]2种方法的标准曲线都呈现良好的线性关系(r>0.99
通过查阅文献和实验探究了苯酚的几种溴代产物在水、苯酚熔液和苯酚水溶液中的溶解性;从有机反应的理论角度探讨了苯酚溴代反应机理及产物的确证,指出苯酚与溴水反应的产物是
就转基因食品检测技术的研究进展进行综述,并对各种检测技术的特点进行分析,同时对其面临的问题及发展趋势进行研究。
在建国十七年的小说创作中,杨沫的《青春之歌》无疑算得上是一部具有广泛影响的“经典性”文本。从诞生之日起,到世纪末的今天它已走过了近半个世纪的风雨历程。跨越这可称得上
<正> 清武英殿刻书清代刻书始于顺治朝,沿用明朝遗留的经厂工匠,刻书十余种。康熙朝重视刻书:首先于武英殿设修书处,选词臣主办其事,对编校人员要求严正,并规定于各书前列编
城市高架桥柱绿化作为立体绿化的一种重要应用形式,应用越来越广泛。以上海延安路高架桥柱绿化为例,阐述了其实施原则、实施内容及相关应用技术。梳理了延安路高架桥柱绿化建
中西学术界普遍简化了伯林的积极自由理念,从而产生了各种各样的误解。实际上,伯林的积极自由蕴含着三种版本。积极自由的1.0版本指的是原初的积极自由,亦即我是我自己的主人