论文部分内容阅读
随着互联网的广泛普及,人们越来越喜欢在网上发表自己的评论观点,而这也反过来成为人们生活处事中重要的参考。在移动APP领域也不例外,移动助手平台中的APP评论是影响人们评估和下载APP的重大因素,是移动互联网流量关卡的一个要点。如何从大量的APP评论数据中挖掘观点信息并进行评论有用性排序已经成为一个急需解决的问题。目前在学术界对于电商产品和网络商店分享的评论的挖掘已经有一定的研究,而在APP评论领域还没有任何发现。 本文以国内某大型APP下载平台的评论数据为研究对象,研究提出一种适合APP评论领域的观点挖掘和评论排序的评论挖掘算法。该算法基于现有的学术界关于电商购物和生活信息评论的研究算法,着重点在于方便用户更好更全面的获取APP评论的信息。 本文的主要贡献有三点: 1.分析了APP评论短而杂的情况,提出了APP评论所需要的数据清洗规范,其中尤其针对APP的垃圾评论识别提出了所需的指标。 2.提出基于语义聚类的观点挖掘算法,并基于此进行APP评论数据的观点挖掘,通过语义拓展识别更多的用户观点。实验证明对比传统的观点挖掘算法,该算法有效的改进了观点挖掘结果。 3.在观点挖掘的基础上,研究了评论质量和真实性的指标,继而提出一种结合评论质量和真实性的APP评论排序模型,对比传统的排序模型,能够更好的把握评论实际整体的观点情况。