论文部分内容阅读
随着互联网技术的快速发展和广泛普及,互联网的服务模式正在从传统的被动模式向个性化服务等主动模式演变。企业要做好个性化服务就要求对用户上网的兴趣、习惯有充分的理解。用户行为分析能够在海量的原始数据中找出潜在的用户群体特征,从而为商业决策和科学研究提供数据支持。本文主要通过在多个维度下,对用户上网行为特征进行分析,并找出每个维度中潜在的用户群体以及该群体对应的上网习惯和规律。通过对多个维度的分析结果进行相关性讨论,分析出用户的综合上网行为模式及特征。文中实验所采用的数据,来自于北京理工大学所有用户的真实上网数据。原始数据覆盖了庞大的用户群体,因此分析结果在一定程度上能够真实的反应出当前大学校园宽带用户的上网特征和行为现状。本文的分析模型和方法同样适用于在其它城域网中进行用户行为分析。本文具体研究内容包括:(1)上网活跃维度分析。该维度对用户上网行为特征和用户上网行为模式进行了分析。采用Bcv-k-means聚类算法挖掘出用户活跃维度下的上网行为模式。(2)Web兴趣维度分析。在对用户Web兴趣模式的分析中,我们针对样本数据的特点,提出了一种基于熵的自动聚类算法,用于分析用户访问网站的兴趣模式。该算法与传统聚类算法相比,无需用户指定任何参数,并且能够发现任意形状和大小的不规则簇,并通过实验验证了算法的有效性。(3)网络业务维度分析。在该维度中,我们针对用户常用的网络业务进行分析,挖掘出用户常用的业务模式和业务使用特征。(4)维度间关联分析。本文对网活跃维度、网站访问兴趣维度的分析结果进行了相关性讨论,并对特殊的用户模式进行了补充分析。