某中型企业数据中心日志分析系统的设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:irugi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着企业规模的不断壮大以及计算机技术的发展,不少企业建立了自己的数据中心来运行各种业务系统。这些业务系统和服务器、网络设备、存储等设备日常产生的日志是一个非常大的数字。如何快速有效的分析处理这些海量日志成为企业和院校的重要研究课题。国内外不少企业都研究出了适合自己企业的大数据日志分析系统并得到了很好的应用,开源日志分析系统比如Facebook的Scribe、Apache的Chukwa等,商业日志分析系统如Splunk公司的Splunk等。目前市场上的日志系统大都存在一些问题,如功能不全不适合公司的实际环境、对开发人员的技术水平要求高、不容易使用等。为了解决这些问题,本文设计和实现了一个基于Hadoop的日志大数据分析系统,该系统运行在分布式存储和计算框架上,具备了高效分析海量日志的能力,同时具有功能强大、配置简便、容易使用等特点。本文研究工作的关键点包括:1、设计并实现日志聚类分析算法,大大提高了日志处理效率。在系统记录的日志信息中,有价值的日志信息约占所有日志的20%不到。通过Logcluster日志聚类分析算法可以排除日志信息中的一般信息,减少不必要的计算。2、实现故障预测,较为准确的预测出系统可能会发生的故障。分析日志记录中的异常事件,提取成为日志序列,再对这些日志序列进行聚类,最后利用隐半马尔可夫模型计算日志序列属于非故障序列的概率和故障序列的概率,最后通过使用贝叶斯分类理论,预测出系统可能出现的故障。让系统管理员可以提前做出处理,从而保障系统正常运行。在系统部署完成之后从功能和性能两个方面进行了全面的测试,该日志分析系统在功能和性能上都可以满足公司分析运维日志的需求。功能方面,实现了对运维日志快速、自动化分析。性能方面,目前该系统完全满足现有的每天的日志处理需求。系统正式运行可以帮助系统管理员监控企业数据中心应用系统的运行状态、帮助运维人员及时发现、定位故障以便第一时间处理故障最大限度保障信息系统的正常运行,从而提高企业的生产效率。
其他文献
针对大规模、高维、稀疏的分类数据聚类,CLOPE算法相比于传统的聚类算法在聚类质量及运行速度上都有很大的提升。然而CLOPE算法存在聚类的质量不稳定、没有区分每维属性对聚类的贡献度、需要预先指定排斥因子r等问题。为此,提出基于随机顺序迭代和属性加权的分类数据聚类算法(RW-CLOPE)。该算法利用"洗牌"模型对原始数据进行随机排序以排除数据输入顺序对聚类质量的影响。同时,根据信息熵计算各个属性的权
基于三维地质建模技术,利用地震、钻井解释等资料,通过分析断层在空间的延伸及相互切割关系,建立了东濮凹陷马寨油田卫95块古近系沙三下亚段的构造模型,明确了研究区的构造特征,包
目的:以氨基甲酸乙酯二甲基丙烯酸酯(UDMA)作为氨酯基粘接体系基质,以丙酮为溶剂,研究丙酮添加比例对UDMA性质的影响。方法:用UDMA与除水丙酮按照质量分数为100∶0(对照组);80∶20(A
设计了一个测定同步发电机电抗的虚拟实验软件,包括三维模型、引导及讲解系统和打分系统三部分。提出了一些软件设计细节,并对实验流程作出了完整描述。由于本文所设计软件包
超宽带射频识别(UWB-RFID)是一种将超宽带应用在射频识别中的短距离通信技术,基于UWB-RFID系统提出了一种新的反碰撞算法AURAC(Adaptive Ultra-Radio Anti-Collision Algorithm),算法包括预约机制和自适应M-FSA算法两个内容,其核心思想是利用UWB特性解决大量标签识别问题。实验结果证明AURAC算法与现有的算法相比,优化了系统的识别效率,且
大数据是近些年新兴的互联网信息技术的一种,在各个领域的应用十分广泛,大数据主要是指对海量数据的分析和处理,对数据决策提供科学的依据和信息,各种数据的整合至关重要。大数据技术一般应用在比较智能化的系统中,应用在智慧城市建设和规划中可以体现出大数据的优势,数据逐渐成为一种资产和财富,为具体的决策提供科学的参数。智慧城市建设中需要大数据技术作为支撑技术,数据、算法、应用和平台相辅相成,发掘出大数据的价值
目的:探究大鼠腮腺萎缩再生过程的规律。方法:结扎198只Wistar大鼠保侧腮腺主导管7(A组)、14(B组)、21 d(C组)(n=66)后分别实现导管再通,采用HE染色、免疫组织化学染色和Tunel荧光检测
晚三叠世上扬子北缘沉积中心主要在川西地区,但在大巴山前缘的达县—万源之间开始出现一个次级沉积中心,反映晚三叠世大巴山前陆盆地初始沉降;早-中侏罗世早期,上扬子北缘沉
采用免疫组化法和免疫印迹法检测S100A8蛋白在30例正常口腔组织及35例口腔鳞癌组织中的表达。35例OSCC组织中S100A8蛋白阳性表达率为68.5%,在正常组织中的表达率为36.7%(P<0.
1882年开始出版的《格致须知》是中国近代史上第一套由专设教科书机构专为学堂学生教学而编撰的新式教科书。这套教科书作为中国近代新式教科书的先导,按照西方近代学科门类