在线评论中的产品属性提取及有用性识别研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:lz251667032
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近些年,互联网向着网站与用户之间双向互动的Web2.0时代高速发展,在线评论这种非结构化文本数据迎来了爆发性的增长。这些数据中包含了大量的有用信息,是影响用户决策的重要影响因素之一,也是厂商家制定产品的研发和改进策略的主要依据。然而,由于在线评论数据量巨大,并且消费者往往具有不同的关注点与喜好,如何筛选出质量较高的在线评,并从在线评论中提取关于产品各方面属性的相关评价信息,就显得格外重要。为了可以从在线评论中找到用户关注的产品信息,本文提出了一种基于互自扩展模式的产品属性提取算法。算法的核心思想是通过计算机自我学习,增量迭代达到理想效果。同时结合FP-Growth算法对该模式进行改进,使其不但可以无需人工标注种子库,从而避免算法结果的不确定性,而且可以提高自扩展模式中增量迭代的速度,获得更好的扩展效果。为了降低自扩展模式下主题偏移的情况发生,又给出了一种提取词、提取模式置信度的求解方法。为了克服中文分词、词性标注中出现错误,提出了相似提取模式和复合提取词的概念并给出了其挖掘方法,该方法能够在牺牲较少准确率的情况下,较好的提高召回率。最后实验显示算法对中文在线评论中产品属性的提取效果,平均准确率为78.50%,平均召回率为79.81%,平均F-score为78.97%,取得了较好的提取效果。对英文评论中的产品属性提取效果,准确率为80.22%,召回率为72.28%,F-score为76.04%,相比较于文献中其它同类研究,在准确率上获得了较大的提升。基于上文所提到的产品属性提取算法而建立的产品属性数据库,考虑到通常用户在阅读在线评论时,都对评论内容所包含的属性存在一个心理预期,不同产品、甚至相同产品不同品牌之间,这些预期都是不同的。如果评论可以满足用户预期,将会对用户认为评论是否有用产生重要影响。基于以上考虑,通过将在线评论有用性判别问题转化为文本分类问题,采用SVM支持向量机方法,利用开元的LibSVM软件实现文本分类器,结合其他学者的研究成果,提出九种特征值,实现了对评论有用性的机器识别。实验表明,对评论有用性的识别准确率平均在90.67%,验证了算法的有效性,同时也证明了用户心理预期的产品属性描述对用户评判在线评论有用性存在着较大的影响。本文研究成果可以为用户在线购物提供决策支持,为厂商家改善产品及服务提供理论依据,还能够促进电子商务平台完善在线评论系统,极具理论与实践意义。
其他文献
德育范畴与智育和美育范畴既相互交叉又相互区别。德育主要解决“信”与“不信”和“行”与“不行”的矛盾 ,智育主要解决“知”与“不知”的矛盾。高校德育工作存在着以智育
以往我国飞机租赁市场长期受国外飞机租赁公司的控制,随着我国保税区,自贸区的设立、国内租赁公司崛起,国内飞机租赁公司的市场份额不断增加。结构性减税作为“十二五”期间
随着信息技术的发展和互联网的普及,电子商务成为了国民经济的新增长点,近几年甚至有了赶超实体商务的趋势,网络购物已经成为了时尚潮流,商家的竞争也变得异常激烈。为了帮助
21世纪初期以来,服务外包在全世界范围内迅速成长,在国际服务外包快速发展的背景下,我国也将促进服务外包产业发展提升到战略高度,各省市逐渐加入重点发展服务外包企业的大军
本文对1986年10月至2002年12月河南省出现的196个寒潮个例进行对照分析,利用寒潮发生前一天20点的500百帕实况资料,详细分析了河南省寒潮天气的基本特征和主要天气形势。通过
增值税分为三种类型:"生产型增值税"、"收入型增值税"和"消费型增值税"。三十年来,我国增值税经历了不平坦的改革历程:我国首先在1984年建立了具有中国特色的增值税;后来又在
APEC是亚太地区目前最大的区域经济一体化组织,拥有环绕太平洋的21个成员,人口占世界40%,贸易额占世界48%,在整个亚太地区甚至于国际上,占有举足轻重的地位。2014年,中国对AP
监测方案与检测技术的综合应用是今后动物疫病防治工作的重要内容与发展方向。本文在参阅相关资料与工作实践的基础上,首先对动物疫病监测方案与检测技术做初步的定义分析,再
随着互联网技术的发展,人们生活水平的日益提高,物流服务的不断升级以及网络安全环境的不断改善,越来越多的国民加入了网购的行列。自2009年淘宝网掀起第一次“双十一”购物
以硅胶为载体,采用溶胶凝胶-光还原法制备了掺Ag的TiO2薄膜催化剂(Ag-TiO2/SiO2),再以经厌氧处理后的酿酒废水为对象,考察催化剂的活性和酿酒废水的深度处理效果。实验结果表明:Ag-T