论文部分内容阅读
移动互联网用户行为分析是当前的研究热点。近些年来,移动通信网络技术、智能设备和软件应用得到了迅猛发展,网络空间呈现出数据体量大、数据类型多、处理速度快和价值密度低等特征,引发了信息过载、维度灾难、数据分布不均匀及数据泛滥等问题。另一方面,移动互联网的崛起产生了大量时空和内容数据,提供了用户行为的细粒度描述,使得细粒度的用户偏好分析成为可能。手机记录不仅包含了海量用户的时空信息,而且详细记录了他们在互联网中的活动状态,成为人类行为动力学分析中的具代表性的数据集。用户是各种上网行为的主体,时间、空间以及内容维度是物理世界和网络空间中描述用户行为的基本维度,而数据是联系人类社会、物理世界和网络空间的重要纽带。移动互联网用户行为分析需要从海量的数据中发现用户在物理世界和网络空间中的行为规律,构建人、物理世界和网络空间的统一信息系统。因此,移动用户行为分析需要综合考虑时间、空间和内容维度的信息。具体而言,移动互联网用户行为分析需要发现用户行为在时间、空间和内容维度上的模式特征,以及挖掘时间、空间和内容维度之间的潜在关系。综上所述,本文基于手机记录数据,对用户上网行为进行深入研究。我们挖掘了用户上网行为在时间、空间和内容维度上的多维模式特征,并分别在个体和集体层面探索时间、空间维度与内容维度之间的关系。基于用户上网行为过程,本文研究了在移动大数据场景中如何发现用户需要的内容以及如何向用户提供所需的内容。具体而言,本文主要工作包括:研究了多维移动用户行为模式特征,通过多维模式挖掘框架,利用手机记录数据对两类典型用户群体的网络使用模式进行画像,研究不同类型的用户群体分别在时间、位置及内容空间上的模式特征,并分析其模式差异,为设备制造商、运营商和服务提供商在计价策略设计、商品推荐、市场策略制定等决策过程提供有效支持;·在个体层面研究了移动用户时空维度与访问内容的关系模型。利用用户行为的中心性,提出了一种特征变换方法,将用户记录投影到由少量热点、热时构建的向量空间中,并利用中心点相关的统计信息加强用户行为表达,通过经典分类算法构建用户时空属性与访问内容的关系。由于本文方法仅需要少量基本数据元素构成的数据集,方便应用在移动大数据场景中以应对信息过载的问题,发掘用户感兴趣的内容;·在群体层面研究了时间、空间和内容维度的关系,将多个维度下的用户之间的相似关系融合到统一的用户相似描述中。为此本文提出了一种灵活的数据融合方法,从数据融合的物理意义出发,通过约束最终融合矩阵距原始某个相似矩阵的距离来限制融合结果矩阵中某种数据类型的权重,在保留原始信息的同时降低计算的空间复杂度。并提出了一种基于多维度相似用户社区的基站侧内容缓存策略,利用在时间、空间和内容维度上的多维相似性用户社区,获得基站之间的协作关系,并通过最优化缓存命中率获得每个基站上的缓存文件列表,从而在提升缓存命中率的同时提升缓存效率。由于这种性能提升在时间上是平稳的,本文方法能够方便应用于移动大数据场景中;本课题从时间、空间以及内容三个基本维度出发,在个体和群体两个层面,利用多维角度对移动互联网用户行为进行深入研究,为人类行为动力学的相关研究提供了新的视角,对未来移动通信网络的设计和应用具有重要参考意义。