基于APP评论的观点挖掘和排序

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wzmuyelan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的广泛普及,人们越来越喜欢在网上发表自己的评论观点,而这也反过来成为人们生活处事中重要的参考。在移动APP领域也不例外,移动助手平台中的APP评论是影响人们评估和下载APP的重大因素,是移动互联网流量关卡的一个要点。如何从大量的APP评论数据中挖掘观点信息并进行评论有用性排序已经成为一个急需解决的问题。目前在学术界对于电商产品和网络商店分享的评论的挖掘已经有一定的研究,而在APP评论领域还没有任何发现。  本文以国内某大型APP下载平台的评论数据为研究对象,研究提出一种适合APP评论领域的观点挖掘和评论排序的评论挖掘算法。该算法基于现有的学术界关于电商购物和生活信息评论的研究算法,着重点在于方便用户更好更全面的获取APP评论的信息。  本文的主要贡献有三点:  1.分析了APP评论短而杂的情况,提出了APP评论所需要的数据清洗规范,其中尤其针对APP的垃圾评论识别提出了所需的指标。  2.提出基于语义聚类的观点挖掘算法,并基于此进行APP评论数据的观点挖掘,通过语义拓展识别更多的用户观点。实验证明对比传统的观点挖掘算法,该算法有效的改进了观点挖掘结果。  3.在观点挖掘的基础上,研究了评论质量和真实性的指标,继而提出一种结合评论质量和真实性的APP评论排序模型,对比传统的排序模型,能够更好的把握评论实际整体的观点情况。
其他文献
硬件发展模式从以前的提高CPU主频速度转变为现在的增加CPU内核数量,注定了软件开发技术的变革。软件的性能再也不可能因为硬件的简单升级而带来显著提高。想要发挥多核的威
基于无线传感器网络(WSN)的目标监测是无线传感器网络最广泛和最重要的应用之一,也是当前研究热点之一。由于具有自适应性、灵活性和低能耗性等特点,基于无线传感器网络的目
随着互联网技术的高速发展,网络上的文本种类越来越多并且日益高速增长,人工筛选适合的文本种类是不切实际的,对互联网上的各类文本进行信息采集就不可避免的使用到智能化的
随着网络信息技术的不断发展,全球使用互联网的人数在持续的增加,互联网已经在很多行业进行实践和应用,带来了互联网数据的批量式增加,分析处理这些海量的互联网数据是一个至关重
随着我国市场经济的发展,以及加入WTO后市场竞争的加剧,商品销售企业面临前所未有的挑战。在客户市场趋子饱和的前提下,如何保持和完善客户关系、提升客户价值成为企业关注的焦
数据挖掘,作为一种能够帮助人们从大量数据中提取或“挖掘”有用信息的强有力的技术,已经被应用到众多的领域,如金融、电信、零售业、科技,甚至国家安全领域等。然而,在得益于数据
基于虚拟现实的建筑物建模技术一直是计算机视觉领域最热门的研究方向之一,快速建立地域特色鲜明、文化内涵丰富的古建筑群在建筑设计、3D游戏、旅游宣传、城市规划等领域存
学位
随着Internet技术的发展,计算机软件的应用逐步由静态封闭转变为动态开放。Web服务技术和面向服务体系结构的发展为软件和应用的开发提供了一种新型模式,使开发不必从零开始,
在当今大数据时代,我们可以采集到很多以流的形式产生的数据,比如传感设备产生的数据,购物网站不断产生的用户浏览和购买记录,还有社交网站用户构成的不断变化的社会网络等。