论文部分内容阅读
近年来,随着移动终端定位技术和移动互联网技术的快速发展,基于位置的社交网络(LBSN,Location-Based Social Networks)平台取得了巨大的成功。LBSN通过位置特征将虚拟社交空间和现实行为空间连接起来,融合了线上关系与线下行为,用户可以依赖线上网络针对空间地点发布评论,线下依靠这些评论来探索发现新的地点,并对这些地点进行选择性访问、消费或服务。然而,LBSN平台上海量的信息中存在各种虚假评论,其发布者多为专业的虚假评论群体,这类群体通过发布多条虚假评论以改变地点的口碑,从而影响用户的访问决策,为地点商家攫取不法利益,同时破坏网络环境,严重影响用户体验与网络信誉。针对当前关于LBSN中虚假评论群体检测的研究不足以及虚假评论群体的特征挖掘不全面等问题,本文提出一种新的基于马尔科夫随机场的虚假评论群体检测模型,融合虚假评论群体在群体成员、目标地点、虚假评论、成员共谋及地点竞争五个方面表现出的异常特征,并结合LBSN拓扑关系,设计虚假评论群体检测算法,目的是更准确、全面的检测LBSN中实际存在的虚假评论群体及其目标地点。本文首先基于LBSN的多维属性分析提取虚假评论群体在群体成员个体、目标地点整体、群体的评论、目标地点之间的竞争关系、群体成员之间的共谋关系多角度的异常特征;其次融合多角度的群体异常特征与LBSN拓扑结构,构建具有关联差异性的基于马尔科夫随机场的检测模型,将检测问题转化为节点类别标注问题;然后基于马尔科夫随机场检测模型设计共谋的虚假评论者检测算法,基于拓扑结构推断虚假评论群体中的个体虚假用户以及存在虚假评论行为的可疑地点;最后设计基于虚假评论群体成员共谋的异常特征的虚假评论群体聚类算法,发掘潜在的虚假评论群体以达到检测目的。为了验证本文提出算法的性能,并分析本文算法的各个特征的有效性,本文在LBSN类平台Yelp中Phoenix地区的数据集上对本文提出的两种算法分别进行了实验验证。通过对实验结果的对比和分析可以得出:(a)本文提出的共谋的虚假评论群体检测算法相较于其他算法能够更有效地识别虚假用户与可疑地点;(b)本文提取的特征对于虚假用户与可疑地点的检测均起到一定的作用;(c)本文提出的虚假评论群体检测算法能够有效的发掘潜在的虚假评论群体。因此,对于LBSN中虚假评论群体的检测,本文提出的算法整体效果最佳。