WEB服务器日志分析与可视化研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:gaoruizhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:健全的日志记录和分析是系统正常运行与优化以及安全事故响应的基础。日志数据庞大且往往以文本形式存在,不容易阅读和提取关键信息,因此必须对日志数据进行适当的分析,挖掘其中隐藏的有价值信息,还可以进行可视化表达,使信息一目了然。该文以常见WEB服务器日志为对象,研究了日志分析以及可视化的原理与过程。
  关键词:WEB服务器;日志分析;可视化
  中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)21-0096-02
  随着互联网的不断发展,几乎所有的企事业单位都有自己的网站,而B/S架构逐渐取代传统C/S架构又进一步促进了网站应用的增长,web管理问题日趋重要。管理一个网站不仅要保证内容的丰富度、程序的可靠性,还要不断提高用户的访问质量、保证网站的安全,而这后两项就依赖于WEB日志信息。
  WEB日志记录了服务器接收并处理请求以及运行时错误等各种原始信息。通过对日志进行统计、分析和综合,就能有效地掌握服务器的运行状况、发现和排除错误原因、了解客户访问分布、发现安全漏洞等,更好地加强系统的维护和管理[1]。
  1 WEB日志
  1.1 定义
  WEB日志消息就是WEB服务器在浏览器客户端访问WEB页面请求资源(页面、图片、文件等等)时所记录的一定格式的信息。
  1.2 原理
  WEB服务器是如何记录日志的,记录什么日志,首先要了解万维网(WWW)工作模式。万维网采用客户机/服务器模式,使用HTTP协议,具体工作流程如下:
  1) 建立连接:客户端的浏览器向服务端发出建立连接的请求,服务端给出响应就可以建立连接了。
  2) 发送请求:客户端按照协议的要求通过连接向服务端发送自己的请求。
  3) 给出应答:服务端按照客户端的要求给出应答,把结果(HTML文件)返回给客户端。
  4) 关闭连接:客户端接到应答后关闭连接。服务器端将相应的访问信息和错误信息写到日志文件。
  1.3 格式
  WEB服务器日志大多以具有一定格式的文本形式存放。本文以APACHE服务器日志为例。
  Apache WEB服务的日志主要有CommonLog和ErrorLog两种,分别记录访问日志和错误日志,其格式和含义如表1、表2所示:
  2 WEB日志分析
  分析日志必须知道日志的核心要素和分析策略。如表3、表4所示。根据日志要素和可用的策略可以得到日志分析的相关算法和程序[2-3]。
  3 WEB日志可视化
  可视化是这样一个过程,它将数据信息和知识转化为一种视觉形式,充分利用人们对可视模式快速识别的自然能力[4]。WEB日志是一种信息,日志分析结果是一种知识,为了更直观的理解它,可以利用可视化工具对其进行可视化展现。
  3.1 信息可视化参考模型[5]
  在图1的信息可视化参考模型中:
  1) “原始数据”经过“数据转换”映射为“数据表”(数据的相关性描述);
  2) 数据表经过“可视化映射”转换为“可视化结构”;
  3) 可视化结构经过“视图变换”成为“视图”;
  4) “用户的交互动作”用来控制这些变换的参数;
  5) 可视化和它们的控制最终服务于“任务”。
  3.2 WEB日志可视化探讨
  WEB日志可视化本质上是一种信息可视化,可以利用信息可视化的各种工具。原始数据是日志文件,其中包含了时间信息(访问日期)、空间信息(访问地址)、类型信息(访问页面分类、错误分类、来源分类等),按照日志要素,采用一定的策略,经过分析后可以转换为数据表,使用饼图、折线图、树图等对时间信息进行可视化转换,使用树图、地图、热力图等对空间信息进行可视化转换,最终得到各种视图。用户通过位置探查,即利用一个时间或空间位置动态地查看附加的数据信息,也可以采用移动、放大、缩小、裁剪等视点控制的交互动作来服务于他的任务。
  目前的信息可视化软件从入门级的(如EXCEL)到在线的(如FLOT、D3、Visual.ly),还有地图工具(如Modest Maps、Leaflet),以及科学计算所用的专家级软件(如R、Mathematica)均可以用来作为WEB日志可视化的工具。
  4 结束语
  WEB日志分布广、数据量大,天然地包含时空信息,对其进行分析与可视化,发掘其可用价值是必要的。本文研究了WEB日志生成的原理和格式,给出了对日志进行分析的相关策略,讨论了日志可视化的理论、方法和软件。
  参考文献:
  [1] Chuvakin A A,Schmidt K J, Philips C.日志管理与分析权威指南[M]. 姚军, 简于涵, 刘晖, 等,译. 北京: 机械工业出版社, 2014.
  [2] 田昌鹏. 基于Web 日志分析的Web QoS 研究[J]. 计算机科学, 2007, 34(6): 78-79.
  [3] 赵阳. 基于AWStats 的Web 服务日志分析[J]. 现代情报, 2006(10): 139-140.
  [4] Gershon N D, Eick S G. Information Visualization[J]. IEEE Computer Graphics and Applications,1997(7-8): 29-31.
  [5] Stuart Card, Jock Mackinlay, Ben Shneiderman. Readings in Information Visualization: Using Vision to Think[M]. Morgan Kaufmann, 1999.
其他文献
向日葵是巴彦淖尔市的主要经济作物,向日葵产业是全市农业的支柱产业,也是农民经济收入的主要来源。近年来,在加强标准化栽培、强化产业化生产、提高服务质量的背景下,全市向
通过课程建设的定义、内涵、外延及其相关联要素的研究,对我国课程建设实施过程进行了探讨,介绍了该校《C语言程序设计》课程建设的具体做法,明确了课程建设在人才培养方案实施过程中的地位和作用。
包头市是一个严重缺水城市,水资源短缺已成为制约全市经济社会发展的瓶颈,黄河水资源为客水资源,各地区限额分配,实施水权转换,高效利用水资源,是解决当前包头市水资源短缺最
评分数据稀疏性问题和新用户冷开始问题对推荐系统性能造成很大的影响,为了提高推荐精度本文提出了一种基于自适应组合协同过滤推荐方法ANCF。该算法首先通过推荐系统收集到
摘要:该文在结合传统的《文献检索》课程教学与网络教学平台的基础上,分析其平台的现有功能,拓展其功能的开发应用。以培养大学生检索技能为目的,加大检索工具的宣传推广,增强学生的实践操作能力,构建具有科艺学院特色、适合独立学院培养目标的《文献检索与利用》教学应用方案。  关键词:文献检索;教学平台;教学实践 ;C/S  中图分类号:G254 文献标识码:A 文章编号:1009-3044(2016)18-
随着沼气建设在农业生产中的推广应用,沼液作为一种优质的有机肥在生产中逐渐应用推广。通过对沼液在日光温室番茄和黄瓜栽培上的应用效果进行试验研究,结果表明,喷施60%液或根施
期刊
摘要:在当今的移动互联网时代,各种移动终端设备越来越普及了,玩手机的人日益增长,尤其是在校大学生已经习惯了使用手机查看各类信息。根据高校上课情况的调研及微课程本身的特点,在高校实施微课程教学模式改革是势在必得了。  关键词:微课程;课堂教学;探索  中图分类号:G424 文献标识码:A 文章编号:1009-3044(2016)01-0168-02  Exploration curriculum b
摘要:目前编程类课程实践教学考核评价存在着随意性、片面性和不真实性等问题,提出了一套实践教学考核考核方案。该方案强调过程化考核代替终结式考核,包括一套完整实践教学考核评价的指标体系以及与之配套的软件管理平台等内容。该方案有效地提高了实践教学效果。  关键词:编程类;考核;实践教学;评价指标  中图分类号:G642 文献标识码:A 文章编号:1009-3044(2016)27-0099-02  Ab
探讨小茴香种子最佳处理技术;以小茴香的茎段和叶片为外植体,诱导愈伤组织,为小茴香的细胞培养和再生体系建立奠定基础。将小茴香种子进行温水处理、GA处理等,比较发芽率。加