基于数据挖掘的Tomcat访问日志分析系统的研究与实现

被引量 : 0次 | 上传用户:sdhok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现在中国互联网接入人数已位居世界首位,中国网站数量呈爆发式增长,网站拓扑结构和网络安全问题日益突出,因此网络日志分析已成为网站服务器管理者解决上述问题的决策依据。Tomcat是目前比较流行的一种WEB服务器,对其网络日志的分析逐渐成为了研究热点。Tomcat访问日志分析作为一种决策支持手段,应用于网络日志分析的过程中仍面临诸多挑战。本文在总结前人研究成果的基础上,从网站实时监控模式和用户访问行为分析两个方面展开了创新性研究:制定出了从Tomcat访问日志的分布式采集到统一存储再到最后日志数据整合分析的一整套解决方案,并基于此开发了一个Tomcat访问日志分析系统,而且将基于分类规则的数据挖掘技术融入到Tomcat访问日志分析中;同时对经典Apriori-All串行序列模式挖掘算法进行了改进,进而提出了一个用户访问行为挖掘的并行算法。本文采用原型法开发了一个基于分类规则的Tomcat访问日志分析系统,即采用分布式C/S架构对部署在不同地理位置的Tomcat服务器进行统一的实时监控,不仅提高了效率而且降低了管理成本。在入侵监控和预警的问题上,本系统采用分类规则技术得到入侵规则,然后通过一个工作线程不间断扫描访问日志进行实时匹配报警,这样做到了有问题早解决。在用户访问行为分析方面,本文将提出一个基于网格的前向投影Apriori-all串行算法(简称GFPA);并且在基于数据并行的序列模式挖掘算法(简称DPSP)的基础上提出了一种基于多处理机调度的并行序列模式挖掘算法(简称MDPSP)来进行用户访问行为模式挖掘。对三种典型的用户访问行为挖掘算法进行比较分析表明,基于MDPSP的用户访问行为挖掘算法的执行效率和加速比都比较高,而且达到了均衡负载的效果。
其他文献
国家主权的概念产生于近代,最初是作为西方政治学上的概念被提出的,用以指代一国之内的最高权力。经过长期的发展与不同时期的学者对主权概念的阐述,国家主权已经成为现代国
佛、道二教作为与儒学并立的中国传统文化三大主干,在两千年的历史进程中,对中国人的社会组织、生活方式、精神面貌等产生了重要影响。关中是中国佛道文化发展过程中的重要区域
从社会理论的独特视角出发解读法律,有助于建立对法律及其运行环境的深刻理解。法国社会学家布迪厄以其体系完备、颇具解释力的场域理论,运用场域、资本、惯习、符号权力等独特
目的:探讨阿魏酸钠对心肌缺血/再灌注损伤大鼠能量代谢的影响。方法:将SD大鼠随机分为:阿魏酸钠高剂量组(40 mg·kg-1)、阿魏酸钠低剂量组(20 mg·kg-1)、假手术组、模型组(n
智能电网的快速发展使微电网与传统大电网并网的分布式能源并网技术成为当前的一个研究热点。风能和太阳能都是“取之不尽,用之不竭”、环境友好型的可再生能源,受到越来越广
存在、出现和消失是事物呈现的三种方式,但不同的语言中表达这些方式的手段不完全相同。作为一种句式,存现句的界定要结合形式和意义两个方面来判定,存现句的形式特征是“时
发展特高压输电是解决我国经济发展与能源分布不均衡的有效手段,这也对特高压输电系统运行的安全性、可靠性提出了更高的要求。特高压断路器是保证系统安全可靠运行的重要设备
“知识建构”作为建构主义学习理论的一个核心概念,是近年来教育界研究的热点。它认为知识的获得不是学习者简单的接受或复制的过程,而是积极主动建构的过程。知识建构是学习
研究目的:现在老年人进行体育锻炼的人数日益增加,锻炼的形式也更加多样化,体育锻炼对老年人身体各个方面的改善作用已经是毋庸置疑的。力量练习在体育锻炼过程中一直是老年人
随着金融环境的日趋复杂,对金融业的风险评价和测量得到了广泛学者的关注。行业风险是投资者进行投资决策需要重点考虑的因素,科学有效的测量行业风险是一个亟待解决的难题。