论文部分内容阅读
网络技术和信息技术飞速发展的当代,各类应用系统应运而生,使用网络的人群指数性增加。在网络和应用系统使用过程中,累积了大量的数据。通过对海量数据的分析挖掘能够为企业和个人带来一些用统计分析难以了解的信息。高校作为网络应用的高密人群,网络访问频繁,校园应用系统众多,保存了学生和教职员工上网记录、考勤、奖惩、学生成绩等多个数据,利用这些数据进行分析可以发现教职员工工作时间的工作状态,了解学生在校学习情况,对学生的综合评价给予数据上的直观支持,并能够发现学生不良行为,及时采取针对性的辅导。本文针对校园网用户日志数据提出基于用户校园行为属性分析的用户行为分析系统,以某独立院校校园网数据为实验数据进行分析,用以发现用户应用访问偏好、用户上网访问时长、访问流量的综合用户网络行为特征;了解校园网整体运行规律。(1)针对用户个体应用偏好分析提出基于兴趣度的用户个体应用偏好度模型。从用户网络访问应用类型、应用使用时长、应用使用频次以及应用使用流量多维度立体把握用户应用类别兴趣度,针对不同维度对分析数据的影响设定影响因子。并结合用户整体上网时间、上网流量数据综合描述用户个体网络行为特征;(2)基于用户基本属性、网络行为属性以及成绩数据综合构建用户画像标签,以比较全面的分析用户个体特点;(3)针对用户群体应用访问分析需求提出基于C4.5算法的用户整体行为模型构建,以应用类别作为分类关键字分析不同群体的校园网应用访问特性;以成绩绩点作为分类标签分析网络应用、网络访问时长等特征对于成绩的影响;结合统计分析的方法从上网时长、上网时段角度了解校园网运行规律。通过本文的分析研究最终通过可视化方式清楚地刻画用户个体的行为画像标签和群体用户表现,得出用户应用偏好度信息列表,发现校园网运行应用访问特点,并能够提供可靠的有效的分析结果给予校园管理者参考优化网络和个性化的网络服务,并能够为辅导员等学工管理人员提供学生用户网络行为查询分析和学生行为预警,以让校园网更好的服务于学生、服务于学校教学。