论文部分内容阅读
在电信网络中,电信用户的通话详情记录(CDR)构成了一个由电信用户和用户间通话构成的传统社交网络。在具有一定规模和社交属性的电信数据的情况下,探索电信社交网络中社交相关性是否存在自然成为一个需要验证的问题。如果社交相关性在电信社交网路中存在,基于社交网络对电信用户进行一系列推荐活动将会变得十分重要。这可以从另一个角度为电信运营商提供新的运营方式。针对电信社交网络中社交相关性是否存在的问题,本文从统计学角度出发,使用经典的假设检验方法对上述问题进行验证。通过t检验和u检验的单侧检验,在传统相似性方法和层次化相似性方法上都证实了有通话行为的用户对在网络访问兴趣上的相似性值高于无通话行为的用户对。在社交相关性得到验证的基础上,针对原有社交关系模型中对用户间通话模式信息的忽略,提出了包含用户通话周期因素的用户关系模型。通过基于社交网络的推荐系统的测试,得到了本文提出的社交关系模型可以更好的描述用户间关系的结论并且取得了更佳的推荐效果。针对传统单机推荐算法不能快速完成大数据量推荐任务的问题,实现了基于分布式系统的ALS-SoRec算法。通过对电信社交网络中用户兴趣偏好的预测,可以在百万用户的数量级下在一小时内完成推荐模型训练和模型评估任务。通过上述三部分工作,从多角度证实了电信社交网络中社交相关性的存在,同时基于电信社交网络对电信用户进行网络兴趣偏好推荐。基于这一系列工作电信运营商可以根据推荐结果对电信用户进行相关内容推荐。