论文部分内容阅读
传统的IT系统管理只是强调对IT基础设施的监控管理,而未考虑与这些设施关联的上层服务。基于服务的管理方式将上层服务与底层基础设施关联起来,确保在服务的关键流程被中断或用户生产率受到影响之前确定潜在的IT问题。
本文提到的管理系统以曙光刀片服务器作为主要基础设施,采用服务发现技术保存基础设施与高层服务的关联关系,并采用通用网络管理技术来搜集基础设施的监控数据。能够精确指出基础设施警报故障事件对较高层的服务可能带来的影响,进而根据服务的影响程度划分IT问题的处理优先级别,同时也能帮助管理者迅速定位造成上层服务性能下降的底层IT故障根源所在。系统的基础设施与服务依存关系对应完全由服务自动发现技术实现,保证管理者无须增加工作负担便能体会到基于服务系统管理的优越性。
本文的主要工作有:
1.研究了IT系统管理的方式和问题,服务发现技术以及网络管理技术,对它们的优缺点进行比较分析。
2.以曙光刀片服务器为应用背景,提出了基于服务的刀片服务器网络管理系统。该系统的突出特点是:支持管理者为不同的服务应用配置不同的监控方案;支持大规模集群下按服务类型对集群进行划分管理;精确指出监控对象警报故障事件对上层服务带来的潜在风险程度。
3.以曙光刀片服务器为基础,对系统进行设计和开发。主要包括刀片服务器管理模块中网络管理代理的设计与开发,管理模块中服务代理的设计与开发。
4.以曙光TC3600刀片服务器为基础,对系统进行了应用部署和验证。在集群环境下对系统进行了性能测试及评估。提出了系统在集群环境下应用的优化模型。