产品评论网站垃圾评论检测研究与实践

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:cyc2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,网络购物已成为人民日常生活中一种非常重要的消费渠道,人们在网上购买相关产品前,一般都会先阅读产品的评论来对所要购买的产品从价格,性能等方面进行初步的认识。同样,商家为了解客户对产品的看法,也会查阅分析用户对产品的评论,以获取产品存在的不足,了解用户对产品的偏好,以此更好的改进产品。但是,在产品评论中充斥着大量的垃圾评论,而这些垃圾评论对用户的购买期望带来影响。因此,分析垃圾评论的特征,并对其进行有效的识别检测就成为一项非常必要的研究。本文针对产品评论领域中垃圾评论的识别问题,对垃圾评论的相关技术进行了阐述,分析了当前已有垃圾评论检测方法存在的一些不足,将垃圾评论分为内容型垃圾评论和虚假型垃圾评论两大类,并根据两者特点的不同,提出了相应的识别方法,主要贡献包括以下几个方面:(1)对垃圾评论的相关技术进行了阐述,分析了当前已有垃圾评论检测方法存在的一些不足,结合相关研究将垃圾评论分为内容型垃圾评论和虚假型垃圾评论两大类,并针对这两类垃圾评论设计不同的检测方法。(2)从产品评论内容角度出发,提出了基于模糊支持向量机的内容型垃圾评论检测方法。为解决由于大规模评论数据集向量维数灾难问题,进一步提出贝叶斯(LSA)方法与FSVM算法相结合的思想。在不影响FSVM对最优分类超平面的构建的前提下,采用LSA方法去除评论数据集中的噪声词和隐含语义相同或相似的词,以减少分类训练时的维数,并通过实验对提出的方法进行验证。(3)在对虚假型垃圾评论检测问题进行分析的基础上,从评论内容及评论用户行为两方面进行了建模,构建了六种在检测过程中可随时更新的特征,基于构建的六种特征设计了有监督和无监督的两种垃圾评论在线检测方法。文中最后的实验结果表明,提出的方法能够有效地检测产品评论中存在的内容型垃圾评论和虚假型垃圾评论。
其他文献
随着机器视觉的高速发展,指针式刻度仪表读数识别的智能化已经成为重要的研究课题,并将其广泛应用在工业及军事领域。传统的仪表盘数据采集主要靠人工手抄的方式,这种方法的效率低,而且错误率比较高。所以对指针式刻度仪表盘进行智能化的识别读数具有重要意义。本论文对人脸检测与人脸对齐算法中的多任务级联卷积网络(Multi-task Cascaded Convolutional Networks,MTCNN)和人
《尚书》作为中国最早的文献,主要是王朝各种文告以及君臣讨论朝政大事的记录。其在总结历史经验的同时,宣扬了王道之义。作为早期史官编纂的文集,《尚书》在记言的同时亦记
目的利用大鼠哮喘模型揭示降钙素基因相关肽(CGRP)及其受体拮抗剂CGRP(8-37)在哮喘发病机制中的作用。方法雄性SD大鼠给予腹腔注射致敏原后连续激发7天,其中干预组于激发前30
栅栏形符号("■")在巴蜀文化中的使用时间是在战国中期延至秦代,集中于战国晚期这一时段内;栅栏形符号主要发现于巴人的墓葬中,可能主要是巴人所使用的一种符号;"■"形成常见
研究目的:探讨农村中小学生亲子互动、应对方式与希望之间的相关关系,并进一步探索希望在亲子互动对应对方式影响中的中介作用。希望通过本研究使广大家长认识到亲子互动对青
伴随着经济发展的国际化、全球化的趋势,以及金融业自由化程度的提高,金融同业及市场之间的竞争也日趋激烈,传统商业银行的收入及利润构成较之以往也在朝着多元化的方向发展
语言素养是学生核心素养框架的重要组成部分。语文学科是包含着语言文字、语言文章、语言文学、语言文化等内容的循环递升的母语课程体系。我国学界对"语文素养"的内涵争论不
随着GIS在我国电网的广泛应用,GIS系统相对于传统户外AIS系统的优越性能得到实际的检验,但是近些年GIS在电力系统的使用过程中仍然曝露出一些问题,文章主要分析GIS与传统AIS
目的观察多瑞吉(芬太尼透皮贴剂)在晚期癌痛患者的临床疗效,不良反应及生活质量。方法选择中重度癌痛的晚期癌症患者67例,每24h评定疗效1次,至少观察15d,观察治疗前后疼痛的程
动植物废弃油酯经酯交换反应可转化为生物柴油。近些年来,生物柴油作为一种可再生能源,其产业发展十分迅速。由于生物柴油在生产过程中副产大量甘油,需要将其转化为高附加值的精细化学品(如1,2-丙二醇),以提高生物质资源的综合利用效率。因此,论文主要围绕甘油氢解制1,2-丙二醇展开研究,着重对以骨架铜(Raney Cu)作为活性组分的催化剂的制备及改性进行探索,采用SEM、XRD、H_2-TPR手段对所制