利用网络技术监控业务状态

来源 :网络与信息 | 被引量 : 0次 | 上传用户:xurizhaoyangdongshen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  1 引言
  
  经过若干年的IT建设,企业内部都存在多则几十个,少则十几个的大大小小应用系统。这些分散系统的运维对于IT要求很高,难度很大,所以各IT部门都计划对于这些系统进行整合。而在迫切需要大规模整合改造统一的同时,企业业务不断地清晰化和发展也要求IT部门领导不断审视业务与IT的融合,从战略SOA架构一直到应用整合再到应用运维,都需要关注IT的业务服务管理(BUSiness ServiceManagement)能力。所以,现阶段如何利用应用系统零改造的业务活动监控工具对现有应用的业务使用情况进行监控是一个重要的手段,一方面保障现阶段应用对业务的支撑,另一方面,获取的最终用户业务使用数据也将是下一阶段大规模应用整合改造的重要依据。
  本文利用成熟的网络交换机镜像端口技术和开放的HTTP协议,实现了真正的B/S业务状态监控,并且根据技术特点,实现了皮用无改造的快速部署以及各业务指标的精准监控,保证现阶段的业务应用系统监控,也提供了改造优化依据。
  
  2 技术原理
  
  2.1 网络交换机镜像端口设置
  本技术首先用到的就是网络交换机的镜像端口技术。通过交换机的配置,可以将原有的一个或者多个端口的所有流入流出数据都旁路到另外一个空闲的端口。在实际B/S应用系统中,客户与WEB服务集群之间数据交互可能会经过多个交换机和负载均衡器,在这种情况下,只需要挑选其中一个交换机,挑选的条件取决于以下内容:
  (1)交换机流量大小,一般核心交换机流量较大,WEB服务器接入的交换机流量较小。
  (2)负载均衡的位置,有时候负载均衡会修改最终用户的IP地址,需要打开X-Forward。
  


  
  2.2 业务数据包还原
  把所有用户访问的HTTP和HTTPS数据包全量复制到专用采集设备后,采用开放的协议标准,将采集设备获取的用户使用业务系统所产生的大量数据包,还原成以业务为视角的各类统计信息,从而在不改造现有应用系统的前提下,获取最终用户业务使用体验数据。整个业务还原的过程分以下几个过程:
  (1)多维度聚类定义
  业务构造的高准确度和高有效度的前提是能够把大量看上去杂乱无序的原始数据包进行准确有效的分类,这些原始数据综合了会话层(Session)、用户登录账号、客户端IP地址、业务URL参数化匹配、HTTP错误、应用错误和时间序列等维度。根据应用系统特点,要实现原始数据包聚类,部分或者全部进行以上维度的聚类定义,是业务还原的基础。
  ①会话层(Sesslon),一个用户在一次浏览周期内,所有的操作将在一个会话中完成,将HTTP头中包含相同Session信息的数据包汇总在一起,可以了解该会话过程中访问的所有URL序列。
  ②用户登录账号,对于大多数应用系统都有用户登录,通过对URL参数或者表单数据的解析,可以把所有URL操作归类到特定的用户账号下。一次用户账号登录必包含于一个会话中。
  ③客户端IP地址,通过TCP包中源地址的解析可以把网络数据包按客户端IP地址进行归类,对于负载均衡隐藏源lP地址的可以打开X-Forward功能保留源地址。
  ④业务URL参数化匹配,对某些配置了多域名和多种业务操作渠道的应用系统,可以利用通配符等方式将相关URL聚类。
  ⑤HTTP错误,根据HTTP响应头中状态代码的解析。获取非200的HTTP错误并归类。
  ⑥应用错误,根据返回页面的特定信息定义具体的应用错误归类,比如服务器端返回提示信息:登录密码错误。
  ⑦时间序列,将数据包的访问和到达时间对原始数据包进行排序。
  (2)海量数据处理
  在聚类定义以后,面对海量的原始网络包数据,BPB采用了多级处理的方式,借鉴于生产流水线的效果,创造一个大管道的数据流,接在管道上的每级处理都是分工明确的专业处理过程,保证了批量快速的处理效果。同时,多级处理可以应用于多台物理主机,连接采用专卡专线专用(没有IP、交换和路由),达到了物理级的架构弹性。处理过程主要包含了TCP/IP包处理、HTTP头处理、HTTP内容处理等。每一个处理都包含了过滤和归类等动作。
  ①过滤,从交换机镜像复制下来的全量数据可能包括了很多错包、非监控目标地址、非监控目标协议等,都可以在第一阶段过滤中去除。
  ②TCP/IP包处理,从交换机镜像复制下来的全量数据可能包括了很多不需要监控的内容,通过TCP/IP包获取源和目的地IP地址、协议等信息,将非监控目标地址、非监控目标协议的数据包直接过滤,将相同源地址归类。
  ③HTTP头处理,HTTP头相比较于内容小很多,但却包含了大部分的聚合信息,包括Session、URL、HTTP响应状态等,将一些与业务关联不大的资源类的URL比如图片、样式CSS文件过滤,将相同Session、URL、HTTP响应状态以及URL登录账号名的信息归类。
  ④HTTP内容处理,对于特定URL,需要获取具体的用户表单输入信息、服务器端返回信息等内容,就需要对HTTP内容进行处理。
  下图是处理的流程示意图:
  (3)业务处理全回放
  经过海量处理归类,最后通过对业务的操作页面流的顺序定义,把每个会话、每个用户、每个1P所对应的业务操作进行完全回放,业务操作量和结果的统计信息也能实时展示,方便运维人员了解全量用户的业务体验和单用户的实时回放及错误信息。
  ①业务定义:将多个URL按时间序列顺序出现的定义为一个业务,同时URL必须是在同1个Session、同一个用户登录账号和同一个客户端IP地址出现。这种定义方式可以以直观和准确业务统计方式代替URL方式,比如以充值代替http://xxx/pathl和http://×××/path2。同时也需要定义业务错误的信息,比如页面返回包含什么信息时表示业务错误。
  ②业务汇总统计:统计同一个业务的量、可用性、网络响应和服务器响应时间,单次业务可用表示未出现HTTP错误和应用错误的URL,响应时间则为所有URL响应时间之和。
  ③业务错误回放:对于出错业务,可以全程回放业务操作过程和具体表单数据,并且将提供服务器端的错误返回页面。
  
  3 功能特点
  
  实现真正的业务监控实际上还有多种手段,比如利用在线测试技术实现业务的模拟监控。通过应用改造实现代码级的业务详细状态监控,那利用网络技术实现业务状态监控的方法的特点是什么呢?
  (1)全再现
  传统在线测试技术虽然能够实现真正的端到端用户体验。也就是能够最真实地反映最终用户在使用业务时的体验,但由于是单点或者有限模拟点。只能“以点盖面”来了解总体业务状态,而利用网络技术的业务监控可以抓取到所有用户的所有业务操作数据,再利用业务状态还原,可以很好地进行全量用户监控。实现业务全再现。
  (2)全自动
  连续不间断的网络数据包的抓取和还原,可以实现7×244,时的 全自动业务还原能力,并且通过多维度的告警和展现,使得业务运维做到真正的全自动化。
  (3)零改造
  利用代码改造当然也可以实现业务的监控,但是对企业目前复杂的应用异构环境,大规模地改造无疑又给运维工作埋下了更多的定时炸弹。即使应用做了改造。实现了业务监控功能,当业务应用出现中断或者错误时,监控功能同样无法正常工作,最多实现一个心跳程序简单判断应用的可用状态。
  (4)零影响
  即使在应用系统正常运行时,记录更多的日志监控数据意味着更多的业务性能消耗,而通过交换机镜像端口的数据包采集,对于应用系统完全是一个旁路,没有丝毫影响,而对于现有常见交换机的镜像端口转发,即使超过IOOMBPS的流量包转发,对交换机也只是增加不到3%的CPU利用率。
  
  4 技术应用
  
  通过网络技术实现的业务监控数据可以用于实时的业务状态告警以及历史趋势分析,帮助使用者一方面提升实时业务系统的运维监控能力,另一方面也可以帮助系统长期优化,这两个方面的作用都需要通过监控对象和监控指标的多维度分析实现。
  (1)监控对象分维。对于整个在线业务系统,前端是包含各个地域的最终用户,后端是利用多台服务器组成的WEB集群,使用过程中则包含各种业务,而当发生错误时则包含了固定的HTTP错误代码和自定义的应用类错误。
  (2)监控指标分维。对于每一个监控对象,通过网络数据包还原的业务指标包括业务访问量、业务错误数、业务可用性(业务访问量一业务错误数)/业务访问量×100)、业务响应时长、业务响应网络时长以及业务响应后台处理时长。
  通过监控对象与监控指标的组合,在告警应用上可以利用以下内容来帮助日常运维工作:
  (1)针对某个业务在某台服务器可用性的告警;
  (2)针对某个业务在某个地区可用性的告警;
  (3)针对某个业务发生的某个错误数的告警;
  (4)针对某个业务的错误在某个服务器上发生的次数的告警;
  (5)针对某个地区的总体可用性告警;
  (6)针对某个地区发生的某个错误的次数的告警。
  而针对历史数据的分析,可以生成指定周期内的以下报表,用于故障的根本原因定位和系统优化参考:
  (1)指定业务按地区5分钟报表,显示各地区业务可用性、性能和业务量数据。
  (2)指定业务的量与可用性月报,显示该月每一天业务量和可用性数据。
  (3)总体服务器可用性排名报表,显示指定时间段内每一个后台服务器的可用性和访问流星。
  (4)指定业务的业务量与可用性按服务器排名报表,显示特定业务在每一台服务器上的负载和可用性情况。
  (5)服务器错误数分布报表。显示不同HTTP错误类型的比例。
  
  5 总结
  
  经过几十年的IT基础架构理论和建设实践,包含网络在内的各种技术都已经非常成熟,如何利用已有成熟技术来满足新的业务运维监控需要是值得挖掘推广的,本案例利用了成熟的网络交换机镜像端口技术和开放的网络协议实现了对于在线业务系统的监控,其监控结果和应用对实际的运维工作产生了很大的帮助,特别是其全自动、全在现、零影响、零改造的特点,真正符合了监控系统对于被监控业务系统的分离和影响原则,是一种理想的监控手段,也适合在不同企业不同应用内大范围推广。
  当然,以本文技术为基础,还可以对所有使用开放式网络协议的业务状态进行监控,这样就可以实现对于业务不同阶段的更深层监控。
其他文献
无线AP与无线路由器的区别  林 晓    很多朋友在选购无线产品的时候,经常会听到无线路由器和无线AP,两者看起来很相似,但实际上却存在差异,下面,小编带大家去看看这两者的区别所在。    从功能上区分  无线AP实际上就是无线网络和有线网络相互沟通的桥梁。无线AP覆盖范围是一个向外扩散的圆形区域,因此,我们在使用的时候,应该把无线AP放置在无线网络的中心位置。而且要注意各个无线客户端与无线AP
期刊
我们曾经多次介绍过恶意程序为了感染计算机,会采用各种欺骗手段。其中最常见的是伪装成其他文件,例如伪装成常见的安装程序或图片文件,诱使用户点击。但伪装成为常见文档文件的恶意程序似乎并不常见。  免费下载:卡巴斯基反病毒软件2010  http://xiazai.zol.com.cn/detail/16/156876.shtm;  卡巴斯基实验室近期检测到一种名为“飞贼”(Trojan-Spy,Win
期刊
清理注册表的6个理由  周圆圆    注册表是Windows操作系统的最重要的组件之一,因为它存储了PC中全部的软件和硬件配置。随着电脑变老,安装或卸载应用程序、浏览网页、创建新的文件和文件夹,以及在电脑上执行各种活动的过程中,注册表开始装满各种数据。  一段时间之后,注册表中搜集的大量不需要的、过时的、不正确的和恶意的数据引起注册表膨胀。一般来说,膨胀的注册表很容易崩溃和形成碎片,开始出现系统错
期刊
如何选择数据丢失防御工具  valen    数据丢失防御技术部署是非常耗费资金的,并且十分具有挑战性,特别是对于前期缺乏适当规划的部署。前期合理部署主要需要考虑以下几个问题:  虽然数据丢失防御听起来是个很不错的技术。但是如果没有合理规划部署,将会让企业耗费大量资金和时间。  在部署数据丢失防御解决方案时,企业需要考虑多个方面的问题,Securosis分析师Rich Mogull表示。首先企业需
期刊
六招防服务器数据意外丢失  张东升    服务器数据意外丢失了怎么办,已经丢失或尚未丢失的读者不妨看看以下六招,或许能让你远离丢失数据的窘境。    1 Raid磁盘阵列  服务器存储系统非常重要,大家都知道。硬盘作为服务器数据存储的主要设备,同时也是一种技术含量高、制造精密的设备,服务器硬盘的发展目前已达到每秒10000转或15000转,普通的SATA硬盘也非常接近这个转速,在运行当中,一点细小
期刊
彻底删除Windows 7操作中心小白旗图标  黑 云    大家在装完Windows 7系统后在任务栏中会发现一个小白旗的图标,鼠标放到这个小白旗的上面,就提示操作中心的提示信息。      轻松调整Windows 7任务栏预览窗口大小  郭泽亮    当我们把鼠标悬停在Windows 7任务栏中某个应用程序的图片上时,将会显示一个预览窗口,可以快速预览相应的窗口内容。也许你会觉得预览窗口太小了
期刊
将你的QQ好友放置到桌面  黑 云    由于工作的原因,小编的QQ已经达到800好友,在平时工作的时候,这让小编特别的头痛,经常因为寻找QQ好友而花费不少的时间。但是我们能不能找到一个比较好的方法解决这个问题呢?为此小编想了很多方法,最后想到了快捷方式。  原来QQ好友可以利用快捷方式将好友的图标放置到桌面,聊天时只要双击桌面的好友图标就可以快速打开聊天窗口进行聊天了,很方便很快捷,大家想不想试
期刊
在拍照时。常常会遇到照片色彩问题,偏暗偏色这已是常事了。我们可以使用一些傻瓜式的P图软件。接下来就看笔者是如何利用美图秀秀轻松解决这个问题吧。
期刊
工业和信息化部部长李毅中上个月做客中央人民广播电台“两会”报道栏目,畅谈工业和通信业发展,并对3G产业发展、通信资费等热点话题发表了看法。李毅中认为,2009年工业和信息化总体走出了一个“V”字型,得益于中央对金融危机的影响见识早、行动快,措施有利,靠政策的支撑和投资的拉动,使得年初工业大幅度下滑的状况比较快地出现了扭转。  李毅中认为,事实证明,3G牌照发放的决策是正确的。  首先,3G拉动了经
期刊
随着社会的发展和商业文明的进步,商业已经迈入电子2.0的时代,很多手工式的单据已经被淘汰,更多的是应用到打印。而说到打印,用户就会想到一个成本的问题,纸张是打印成本中比重较大的一部分。随着全球纸浆价格上升,纸张价格也在飙升。使得企业打印成本偏高。选择合适的纸张,降低打印过程中纸张的消耗,是提高效率节省开支的最好方法。今天,小编先从打印纸的分类开始,给大家分享选购经验。    打印纸的分类    1
期刊