校园网用户群体行为的研究与分析

来源 :江苏大学 | 被引量 : 13次 | 上传用户:cbir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络使用过程中,由于用户具有各自的兴趣爱好和访问习惯,因此其关注的内容不完全相同,使用网络的时间和服务也各不相同,并且不同的用户群体不可避免地带有各自的群体行为特征。了解网络用户的群体行为,能从更宏观的角度得到网络使用轮廓,一方面为用户使用网络提供一定的指导意义,帮助其更加充分合理的利用网络资源;另一方面也为网络管理者进行异常检测等网络管理工作提供理论依据。校园网作为互联网的一个组成部分,其用户的专业性和使用网络的目的性较强,决定了它可能比校外普通互联网用户具有更明显的特征。探究和了解校园网用户群体行为特征,可以为校园网的网络规划与建设等工作提供重要的理论基础,因此对校园网用户群体行为的研究显得日渐重要。本文提出一种从校园网用户群体角度出发,研究用户群体行为特征的分析方法。由于网络使用受到诸多因素的影响,变化多而快,很难用一套有效的机制对其进行概述,因此本文着重研究了用户群体行为分析的方法。首先采集校园网主干数据流,通过流聚合等手段获得分析的数据源;再经过数据预处理和数据选取从中得到能描述用户群体行为且相关性最大的属性集合;然后对群体进行分类和标识,分别以纵向和横向的角度从使用时间、使用服务、访问流量等方面提取出用户群体行为特征;最后采用数据挖掘中的聚类分析从群体访问地址倾向这一角度对地址属性进行分析,得出较为全面的用户群体行为特征。本文还对数据挖掘的聚类分析在地址属性上的应用进行了深入研究和讨论,针对以往聚类算法中没有考虑IP地址的特征属性,聚类结果分散不完整,且没有实现不同类间的最大相异度这几个问题,提出一种新的聚类算法。算法结合最长前缀匹配和最近邻规则聚类算法的概念,运用逐步优化的层次聚类的思想,自动并有意义地进行基于数据集中地址属性的无监督聚类,得到用户群体对网站的使用偏好。本文对用户群体行为特征的研究与分析为下一步识别异常行为、网络异常监测以及更好的进行校园网规划设计等做出了充分的理论准备。
其他文献
随着网格应用逐步开展,用户对于网格服务质量的要求越来越高,网格QoS成为网格技术研究中的热点之一。由于网格构成的复杂性,网格QoS也非常复杂,网格QoS可以按照虚拟组织层分类。
目前在企业级应用开发领域中主要存在J2EE和.Net两大技术标准,由于J2EE具有高可靠性,跨平台可移植性,开源代码库的可用性等优点,而在企业级应用的WEB应用开发中,占据了大部分
当前移动平台异军突起,迅速占领市场,同时计算机图形学各个方向都蓬勃发展,特别是照片级真实感场景渲染始终走在前列。二者之间的融合所展现出来的应用前景与研究价值,不仅得
随着通信技术和计算机技术,尤其是Internet的飞速发展,各种各样的信息成几何级数增长,作为传统的信息载体,文本信息更是如此。为了能在海量的文本中及时准确地获得有效的知识和信
信息化绩效评估是在传统资源的财务绩效评估的基础上针对信息资源开发利用效益效果的评价。对交通信息化进行绩效评估可以衡量交通行业在未来发展中建设和应用信息系统并持续
近年来,绿色、节能、环保成为交通工具发展的主题,电动车作为顺应这一主题的产品得到了大力的推广,市场需求迅速扩大,电动车产业也有了爆炸式发展,使得电动车厂家、电动车营销公司
组件技术已经成为软件工程研究的热点和大型软件系统开发的关键。为了提高软件系统的可靠性,利用软件系统架构,即软件系统内部组件和接口间的结构信息对系统的可靠性进行分析
多智能体系统的诞生和发展是分布式人工智能技术和网络技术发展的必然结果。多智能体系统的研究近几年来已经成为基于网络的分布式人工智能的研究热点。其研究的核心问题是一
软件工程是为解决软件危机而诞生的一门学科,基于构件的软件工程CBSE提高了软件生产效率和质量,日益成为软件开发的主流范型。构件具有黑盒性质,因此,构件通过接口提供服务,
汉字识别系统能将输入到计算机中的汉字图像,经过一系列处理后提取出汉字的基本特征,并同计算机标准汉字模板库中的模板进行比较进而识别出输入的汉字。汉字识别问题属于超多