应用于校园网用户行为分析的K—means聚类算法研究

来源 :科学与财富 | 被引量 : 0次 | 上传用户:sbsb5503564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:校园网的用户行为指的是在使用网络的时候,用户所表现出来的一种规律,在这里,可以使用一些特别的定量表示出来,校园网用户行为有着比较特殊的特征,这是普通网络使用群众无法具备的。在现社会的校园网当中,有着越来越多的挖掘技术,利用这些技术来分析校园网的用户行为,对宽带进行合理的分配,有助于提升校园网用户的使用效率。本文就对应用于校园网用户行为分析的K-means聚类算法进行叙述,供参考。
  关键词:校园网用户行为;分析;K-means聚类算法
  引言:
  现社会,不少院校对于校园网的管理都比较欠缺,通常都会采用服务器来进行管理,比如在认证计费和流量监控等方面都会使用进服务器,服务器在服务的过程当中,会产生很多的数据,这些数据都会自动保存在后台数据库里面。全部的数据里面,有一些是和校园网有关的,有的数据是和校园网的使用、运行状态有关的,假如把这些数据进行分析和利用,就可能会对整个校园网起到很好的协助作用。使用K-means聚类算法能够有效的对整个用户行为进行分析,并且描述出校园网用户行为和网络的运行实时情况,K-means聚类算法在校园网用户行为特征和使用情况以及校园网的分布等诸多方面有着非常好的作用。
  1.K-means聚类算法的概括
  K-means聚类算法是一种相对来说比较重要有效的挖掘方式,将物理现象和抽象对象进行了分组的一个过程,相似的对象就分为一组,不同的对象再分为一类,可以把聚类算法分成很多个群体,各个群体内部的对象都有着比较强的相似度,但是,这种相似度在不同的群体之间却很低,这也是聚类算法的一大特征。可以把聚类算法分成几种类型:划分方法、层次方法、基于网格的方法等,每一種方法虽然表面上都没有多大的联系,但是却都有着自己的代表算法。K-means聚类算法就是诸多聚类算法中的一种,它属于划分方法的行列,K-means聚类算法有一个很显著的特点,就是它有着比较好的可伸度和效率,比较适合用在大文档案的处理过程当中。K-means聚类算法可以把物理对象或抽象对象进行分组,相似的对象分为一组,彼此相似的一组对象组成的集合和不同聚类当中的对象相比,相似度有着一定的差异,而给定的那个数据项之间会有一定的价值存在,这些价值都会导致聚类和同一聚类当中的对象相似度极高,相反,不同剧聚类当中的相似度反而很小。
  2.校园网用户行为分析的K-means聚类算法的数据准备
  2.1理解数据
  校园网用户行为产生的数据基本上都是来自认证计费数据库当中的,日常的数据都会保存在登录数据库里面。要想利用K-means聚类算法来分析出校园网的用户行为,就要先建立一个用户特征的反映系统,日志数据表当中所提供出来的二十三个字段就是校园网的基础,在确定了参数之后,还需要确定校园网用户的特征项。比如,用户登录日志的时候记录的都是第一次登录的数据,也可以理解成一个用户有着很多条登录的信息,这是不具有统一性的。因此,要想在真正意义上实现校园网用户行为的分析,就必须要根据登录表当中的IP地址来进行统计,并且,还要对每一个校园网用户的月使用流量进行分析和统计,从中将使用流量提取出来。
  2.2数据处理
  数据处理的这个过程需要使用到SQL2005的ETL工具,其能够有效的对校园网用户数据进行处理,比如,在日志数据库当中提取到某个月的数据,假如是2016年8月的数据,这个月校园网用户登录日志的量高达215681条。按照数据的生成需求,只需要用到3个字段就可以了。
  2.3数据处理过程
  专家可以先设计一个数据流,再利用SQLSever2005的SSIS工具将其生成为K-means聚类算法需要的数据,这也就逐渐形成了K-means聚类算法的初始输入文件,假如登录表显示的数量是3381行,那么就证明2016年8月的IP数值达到了3381条,在登录记录表当中,K-means聚类算法可以把IP地址当成是文件的关键字段。整个数据流的过程都需要采用ETL工具来对数据进行抽取,尽量抽取出一些符合要求或条件的校园网用户行为数据,在抽取完毕之后,才能通过数据做样本模型。
  3.调整算法参数
  3.11Clustering_Method参数
  Clustering-Method参数能够明确的指出哪一种算法决定聚类的组成部分,这种参数的算法总共可以分成四种,首先是可以伸缩的EM算法,其次是较为普通的EM算法,虽然表面上都是EM算法,但是后者是不具有伸缩性的。除此以外,还有可伸缩的K-means算法以及不可伸缩的K-means算法,通常情况下,使用最多的就是可伸缩的K-means算法。
  3.2Cluster_Count参数
  Cluster-Count参数是K-means聚类算法当中的k值,它能够算出需要多少个聚类,假如把Cluster-Count参数的值暂定为0,那么K-means聚类算法就会把数据当中的聚类个数估测出来,在经过了对比和调整以后最终选择K值为3,这种分类也是最具独立性的。
  结束语:
  在校园网用户行为的分析上,使用K-means聚类算法能够更加有效对数据、K值进行分析,从而更好的分析出用户行为,并且,这也是一种新的尝试,聚类结果给校园网管理人员提供了更多的用户行为,这样就可以制定出更多的网络策略。
  参考文献:
  [1]李旭.基于聚类技术的校园网络用户行为数据分析研究[D].山东师范大学,2016.
  [2]杨志忠.基于Hadoop的网络用户行为分析[D].兰州理工大学,2016.
  [3]马仕玉.聚类算法及其在校园网用户行为分析中的应用[D].重庆交通大学,2015.
  [4]黎慧娟.校园网用户行为的分析与研究[D].广西大学,2007.
其他文献
摘要:在建筑工程实际的管理当中,一定要加强对管理模式的创新,只有确保管理模式的创新,才能够很好的将建筑工程管理水平提升,才能够确保建筑工程的质量获得提升,从而将建筑行业的发展有效促进。本文根据笔者工作事假,对建筑工程管理中创新模式的应用及发展进行了分析和探讨。  关键词:建筑工程;管理;创新;模式;应用  近几年, 随着城市化建设进程的不断加快, 建筑行业得到了迅速的发展, 加上国家政策的支持,
期刊
摘要:随着电视播控系统的发展,整个系统的构造更加的复杂,为了保障系统的正常运行,对电视播控系统进行全面的监控十分重要,只有不断的更新播控系统的监控技术才可以使监控技术一直处于高安全性与高可靠性的状态,才能保证监控系统可以及时的发现电视播控中出现问题。监控系统需要在发现问题之后,对工作人员发出警报,帮助工作人员查找问题,缩短解决问题的时候,保障电视节目的正常播出。本文根据播控系统中监控技术的含义以及
期刊
摘要:在最近这几年中,我国的社会经济发展的势头是非常迅猛的,同时对矿产资源的需求量不断增加,在这种状况之下,我国矿产资源的开采工作也得到了一定的进步,但是仍然存在着一些问题,特别是在一些乡镇地区,管理力度较弱的矿产资源勘查开采的监督,不符合我国可持续发展的目标,因此,在本篇文章中,首先阐述了监督管理的主要内容,之后又提出了乡镇国土资源所矿产资源勘查开采监督管理的方法。  关键词:加强;乡镇国土资源
期刊
摘要:叶圣陶先生曾说“教是为了不教”。在教学的实践过程中,这也是每个教师在教学中不断探索改进教学方法的原因。教学方法有很多,好的教学方法是从学生的学情出发探索适合的课程及每个教学内容的教学方法。近年来信息化快速发展并运用于教学中,翻转课堂教学方法就是其中一种,本文阐述翻转课堂教学方法运用于钳工实训课程中的模式。  关键词:钳工实训;翻转课堂;教学  一、翻转课堂教学模式  翻转课堂译自“Flipp
期刊
摘要:当代教育不仅在于教授学生知识,更重要的是对学生进行思想教育和心理教育。现代社会环境在不断变化,容易对学生的观念和行为带来影响。而初中是学生发展个性的阶段,此时学生的政治、思想、心理呈现出了明显的差异。德育工作实效性的重要逐渐显现出来。班主任在学生的德育工作中起着决定性作用,其行为举止直接会影响到学生的价值观念取向,进而影响学生的是非判断。本文将对初中班主任德育工作的现状进行分析,并提出提高班
期刊
摘要:本文概述了在大学英语学习阶段,英语综合应用能力的训练方法。文中阐述了英语学习各个阶段的核心任务,以及大学英语阶段在听、说、读、写、译等方面的训练方法。  关键词:英语综合应用能力,以写促学训练策略  我国学生接受的英语教育大致分为三个阶段:小学英语教育阶段,中学英语教育阶段和大学英语教育阶段。三个阶段分别有各自的核心任务。小学英语教育阶段,英语教学的主要任务是培养学生对英语语言的感性认识,可
期刊
摘要:近些年来我国的高等教育中土木工程凭借自身就业率高、薪资待遇优越等方面的优势成为了高校热门专业,而CAD技术教学课程是学生进行绘图的主要学习途径,但是传统的教学模式不能在现今社会的CAD课程教学中发挥出关键性的作用,因此可以考虑将实例法应用到CAD教学过程中。本文将对CAD课程教学的目的和特点进行分析,探究了实例法教学在实际应用中的主要特点,并提出应用实例法对教学模式进行改进的具体方案。  关
期刊
摘要:随着空调的普及使用,人们对环境舒适性的要求越来越高,空气湿度的大小对人体舒适度有着显著的影响,相对湿度过低时人体会感觉到皮肤干燥、口唇开裂且易患感冒,故在现代空调的使用中,湿度是空气调节时所要考虑的重要因素之一。空调加湿技术自20世纪70年代问世以来,在室内环境中的运用愈来愈广泛。  关键词:空调;加湿;增湿;调湿;无水  一、空调加湿技术概述  湿度是表示大气干燥程度的物理量,在一定温度下
期刊
摘要:本文将系统功能语言学作为理论框架,探讨了在英语教学中名物化转化过程所带来的形式上的变化及概念意义变化,继而从词汇和句法两个层面讨论了名物化的转化手段及对日常教学的启示。  关键词:名物化;概念意义;转化手段  名物化是英语书面语的主要特征之一,历来都是是各语言学派进行研究的热点之一。最早将名物化研究列入其语法框架的学者是结构主义语言学家Jespersen。在此之后,转换生成语言学派中的Cho
期刊
摘要:自从进入市场经济时代以来,在推动社会快节奏的发展形势下,使得创新转型升级成为了社会改革发展建设中的核心动力,特别是在当前社会城市化建设发展进程日益加快,人民的物质生活水平逐步提升,使得对于建筑的整体效能和居住舒适度提出了更高的要求,这也就为建筑设计不断创新与发展带来了新的机遇,为此我们应当适应当下快节奏的社会变革趋势,进一步加快城市化建设步伐加强对建筑设计的转型升级,促使推动建筑行业在未来规
期刊