论文部分内容阅读
随着移动通信技术的发展,手机移动用户从3G通信时代进入4G互联时代。通信速度的提升,网络频谱的拓宽以及智能终端性能的不断提高,使得人们的日常通信质量得到逐步提升。多样的通信形式,稳定的移动网络,精确的定位技术和繁多的手机应用,丰富了人们的人际交往,点缀了移动用户的多彩生活。在日常的社交过程中,随着时间的推移,人们的社交圈会逐步趋于稳定。利用用户间社交行为的相关数据,可以推测用户间的社交亲近关系。用户间的亲近关系是其他诸多领域中应用研究的基础,例如好友推荐系统,相似兴趣爱好的社团发现,犯罪团伙预测,运营商营销策略的制定等等。本文利用移动手机用户的移动轨迹和用户间通信信息,挖掘移动手机用户间的亲近关系,主要工作和创新点如下:(1)提出了利用手机移动轨迹发现用户共现模式的算法。该算法强调规律性,从个体用户的生活规律角度出发,利用用户间运动模式的相似发现共现模式,推测用户间可能存在的亲近关系。实验结果表明该算法能有效地发现有意义的群体关系,并能发现用户生活模式的变化。(2)建立了利用移动手机用户通信数据的用户亲近关系模型,提出了亲近关系挖掘算法。在抽取用户通信行为特征时,除了通信的时长、次数因素外,还提取了分时段的数据属性特征,清晰地刻画了用户通信的时间行为。另外,算法量化了用户通信意愿的属性特征,表达了用户通信的主观行为。基于用户通信的时间行为和主观行为,模型在程度和类别上进一步划分了亲近关系。实验结果表明,该算法可以有效地展示用户间的亲近关系。(3)提出了用户共现模式挖掘的并行算法。为解决大数据环境下串行算法运算效率和数据存储的瓶颈问题,.本文利用MapReduce编程模型和大数据处理平台,实现用户共现模式的并行计算。实验结果表明,该并行算法可以较好地提高用户间共现模式发现的效率,并且随着数据量的不断增长,程序运行时间呈线性增长。