基于聚类算法的上网行为分析

来源 :延安大学 | 被引量 : 0次 | 上传用户:wanshanshan1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展以及教育信息化建设的逐步推进,校园网作为给师生提供教学、科研、交流的重要平台,已成为衡量高校现代化和信息化建设的重要指标.但伴随校园网规模的扩大和用户数量的持续增长,校园网也带来一些负面影响.比如有些学生过于沉迷网络,耗费了大量的时间与精力,占用了大量的带宽.因此,分析校园网用户行为是很有意义的.对网络管理者而言,既可以了解校园网的整体运行情况,又可以对网络的合理规划提供更有力的依据;对学校管理者而言,可以了解学生的上网习惯和对网络的依赖程度,防止学生沉迷于网络而影响学业.本文以延安大学校园网认证计费服务器的数据库作为数据源,抽取了一个月的数据作为研究对象,并在Microsoft SQL Server 2012平台上完成了以下工作:(1)数据预处理:利用SSIS工具对数据进行了预处理;(2)建立上网行为分析模型:选取经典的K-means聚类算法,通过对比4次聚类结果确定了上网行为分析模型的参数(即K-means算法中K值的选取)、分析了聚类结果、利用上网行为分析模型的钻取功能对异常上网行为用户群进行了分析;(3)上网行为分析模型的验证应用:通过抽取另外一组数据对上网行为分析模型进行了验证.
其他文献
磁共振成像(Magnetic resonance imaging,MRI)具有无电离辐射、多角度成像、对人体组织无损伤等优点,因而成为临床医学和医学科研中非常重要的检测手段。但是MRI存在的不足之
<正>伴随着社会发展和市场经济的建立,人格要素的商业化和利益多元化促使了个人信息作为商业价值被逐渐开发,而信息技术的迅速普及又为个人信息的收集和处理提供了便利条件,
文字意识与早期阅读技能的获得与提升对幼儿语言领域的发展起到了推进作用,《纲要》对幼儿早期阅读提出的相关要求则进一步体现了阅读在语言教育中的重要性,由此,幼儿教育界
<正>选择题和填空题是高考数学试卷的两种基本题型,这两种题型的题目数量多,每道题目的分值轻,但是在改革创新方面却力度最大。特别是选择题和填空题的最后一题,作为客观题的
<正>2012年全国各地高考已经落下帷幕,今年的高考江苏卷(数学Ⅰ)由于多道解答题实行分部把关,导致许多考生都觉得试题比较难,特别是第19题的解析几何,由于运算量大,更是引起
<正>2015年3月1日,美国科学家联盟核信息项目主任汉斯·克里斯滕森和高级研究员罗伯特·诺瑞斯在《原子科学家公报》上联合署名发表了《2015年美国核力量》一文,详细介绍美国
<正>有些不法分子在利益的驱使下,制造假药,当消费者服用后威胁人的生命安全。结合现在社会看病难,医疗体系不健全等等社会问题,假药的制造与销售无疑是雪上加霜。而药品的防
<正>迪斯尼乐园标志着现代主题公园的诞生,本文将根据其在发展中的教训以及成功经验来阐述迪斯尼乐园带给中国主题公园的启示以及在这个过程中所需要注意的问题。
期刊
<正>随着二手车行业的发展和普及,买二手车的人越来越多,很多初次接触二手车的车主很容易被网上的众多言论所误导,从而给自己带来麻烦。那么买二手车的误区有哪些呢?如何选购