论文部分内容阅读
目前,运营商正面临着更加复杂和激烈的竞争形势。首先随着移动互联网的蓬勃发展,传统的通信运营商渐渐地处于管道化和边缘化的不利地位。其次语音业务量的下滑以及流量快速增长带来的高额建设维护成本,也使运营商的利润增速放缓。为此,开展以用户为中心的数据分析和挖掘可以帮助运营商来应对上述的竞争形势。其中,识别用户的重要位置(频繁访问的位置)不仅可以为用户提供个性化的网络服务,也可以有助于城市规划者优化城市的各类资源配置,降低网络投资成本;基于用户消费的关联规则分析可以帮助运营商针对不同消费特征的用户开展精细化营销,提高用户的满意度及运营商的整体收入。本文主要利用运营商的用户日志数据对用户的行为进行研究,首先对不同类型的用户数据进行分析;然后对用户的住宅位置和工作位置进行识别;最后基于用户的消费进行关联规则的分析。具体的内容研究如下:(1)统计分析了运营商日志数据。分别对运营商日志数据中的用户通话日志记录数据、用户上网日志记录数据、小区和宫格关联数据、用户属性和消费数据进行统计分析。了解数据的整体分布情况,为用户的重要位置识别和基于用户消费特征的关联分析做准备工作。(2)提出一种联合使用时空维度的用户重要位置识别的方法。已有基于聚类分析进行重要位置识别的方法只考虑了时间维度,本文提出的方法增添基站所属区域标记这一空间维度,通过联合使用空间和时间维度对用户的重要位置进行识别。最后对本文识别方法的有效性进行了间接验证,结果表明,与原有的方法相比,该方法进一步提高了用户重要位置识别的准确性。(3)提出一种基于用户通信日志数据的用户消费特征关联分析。首先,从时间维度和空间维度挖掘用户日志数据,进行特征提取,具体包括:使用聚类的方法发现用户在不同时刻的上网/通话的行为模式,计算统计了用户累计移动距离、平均旋回半径、访问地点数和通勤距离;然后通过k-means挖掘用户消费记录数据,进行消费特征提取;最后利用FP-growth算法挖掘用户消费等级、时空行为特征和用户属性之间存在的潜在关系,共得到7条有效的强规则,并在规则的基础上为运营商提供参考营销建议。