基于意图特征的评论质量分析与建模方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zhoulei1964
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
评论是一种评判事物价值的重要主观信息,其已被广泛应用于现有的商品属性抽取、偏好学习以及情感分析和挖掘。然而,评论自身也存在价值层次,能否精准高效地自动评估评论的价值(如“专家”级评论或“垃圾”评论),对基于评论信息的各类研究和应用都具有重要价值。针对这一全新问题,本文将其看作分类和排序问题,分类即将评论划分为“高质量”和“低质量”评论,而排序则是对同一个商品的评论按其质量从高到低排列。传统上,分类与排序都属于有监督学习方法,由此,本文在特征抽取和评论质量模型构建两个方面完成了一些研究工作。在特征提取方面,本文从用户意图角度出发,考察影响评论的因素。由于评论质量的高低直接来自用户的判定,因此从用户的角度考察评论的质量是从根源上探索反映评论质量的因素,同时此类特征具有较强的通用性。从用户意图角度,本文提出了三类反映评论质量的因素:评论的信息满足性、评论的情感与观点和评论的可信度。对于每一种因素,本文分别提出了相应的度量指标和挖掘算法。实验结果表明,本文提出的基于用户意图的特征在评论质量评估中有较好的效果,将本文特征与前人工作中采用的特征融合后取得了更好的性能。在评论质量模型构建方面,本研究从不同的角度构建了三个评论质量模型,分别为:时间质量模型、信息过载质量模型和话题质量模型。这三个模型分别考察了评论发表时间、商品内部评论相似度和商品间评论相似度对评论质量的影响。这三个模型相互独立,是对三类不同评论局部环境的描述,具有一定的自适应性。最后将这三个模型用于评论质量排序系统的调整,取得了较好的效果。
其他文献
随着网络和信息化建设的不断发展,局域网设备的数量越来越多,如何保证这些设备的正确运行,出现故障如何第一时间得到通知,准确定位问题所在,并迅速解决问题,这些方面都需要着重考虑
随着多媒体数字化技术的发展和推广、存储成本的降低、网络传输带宽的增长,各种多媒体数据如图像、视频等飞速膨胀逐渐成为信息的主流,并对人们的生活和社会发展产生重要的影响
中国已成为全球最大的汽车市场,由此产生的诸如交通阻塞、交通事故等社会问题正日趋严重。车联网是解决交通问题的有效途径,中国车联网将形成巨大的新兴产业。然而,车联网中驾乘
多相流作为自然界普遍存在的一种现象,不仅是由于被测介质的介电常数会随着温度等环境的变化而变化,而且还由于被测场域中存在其他介质,会使得测量时出现介质未知的情况,并且
RoboCup机器人世界杯赛是近年来规模最大并且参与人数最多的高智能机器人足球比赛,其中仿真2D组比赛更是RoboCup世界杯中最古老的比赛项目之一,其中的多agent智能系统协作问
关系数据库中的关键词搜索问题已经逐渐成为信息检索领域的研究热点。由于基于关系数据库的关键词搜索技术不需要用户具有任何SQL语法知识和数据库模式知识,只需要输入关键词,
粗糙集是一种处理不确定性知识的数学工具,能较好地分析和处理不精确、不协调和不完备信息,在知识获取、机器学习、智能控制、专家系统、粒度计算等领域得到了广泛的应用、取得
车载自组网(Vehicular ad hoc network-VANET)是由车辆和道路两旁的基站组成的无线自组织网络,是智能交通系统(Intelligent Transportation Systems-ITSs)的一个重要构成。通
伴随着因特网上电子文档信息的持续增长,人们迫切的需要一个工具去发现、过滤以及管理好这些资源,文本挖掘技术可以解决这个问题,它是以文本为对象进行的数据挖掘,可以应用于信息
随着计算机的快速发展,数字图像已经成为一种重要的信息载体。无论是在日常生活和工作中还是在科学研究中,无时无刻都会有大量的数字图像产生。另外,当今社会亦是一个网络高度发