基于Web日志挖掘和漏洞挖掘的安全系统的研究与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:jiaozhixuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网应用的安全性问题一直是人们关注的焦点,任何网站都不可能做到无懈可击,漏洞的存在对网站和用户都是极大的威胁。对于网站开发人员来说,如何使Web网站系统尽可能的减少漏洞成为了首要任务。Web应用的日志是反应整个系统的重要保证,从Web日志中可以得到系统的运行状态、性能指标、用户的访问行为以及各种统计分析所使用的有价值数据。Web日志是互联网系统的重要财富,通过Web日志挖掘,可以分析日志中反应的用户行为,抽离用户个性喜好并,结果数据可以应用在诸如搜索优化、推荐系统、网站结构化分析等多方面。在日志挖掘的研究中,单机处理能力已经难以适应海量日志数据。本文重点研究了多源的日志格式,并完成了在Hadoop平台下,对Web日志的日志预处理、聚类分析,并将用户行为集应用于漏洞挖掘研究分析中。本文的主要研究工作内容如下:首先,分析了漏洞挖掘与入侵检验系统的国内外研究现状,结合日志挖掘的相关理论,提出了以Web日志日志挖掘为基础,分析用户行为,并以此为依据挖掘网站漏洞、防范入侵攻击的可行性。其次,对Web日志系统调研,分析了不同的日志格式,并对日志的作用进行了详细阐述,对日志挖掘的作用及日志挖掘的步骤与算法进行了说明。为了系统能具备收集分布式系统实时日志,并分析处理海量日志的能力,本文结合了对Hadoop分布式框架与开源日志分析系统ELK的深入学习与实践,阐述了以并行编程框架MapReduce进行日志处理的可行性与优势。然后对常用的日志挖掘分析算法进行了阐述,分析了多种聚类算法、关联规则算法的优劣。并结合Hadoop提供的机器学习框架Mahout,实现了 Mahout所提供的K-means聚类算法。对用户行为集进行了聚类处理,并对处理结果进行了验证。最后,本文依托于Hadoop生态圈给出了基于日志挖掘的漏洞挖掘系统原型。
其他文献
双遗产地生态旅游的健康发展是影响未来遗产地可持续发展的关键问题。文章选取黄山2008-2018年面板数据,基于DPSIR模型测度黄山旅游健康发展水平。结果表明:(1)驱动力是黄山
采用多种探头组合对聚乙烯管件声学特性进行研究。通过对比试验得出检测大厚度聚乙烯管件的最优检测参数,并提出改进探头的思路。大量的检测试验和现场车削破坏性试验对比显
运用材料力学中径公式和弹性力学拉美公式,对内压圆筒的最大应力计算的两结果进行比较,当外、内径比K≤1.5时,两者误差不超过4%。GB150-198中径公式校核圆筒压力既方便又合理
主通风机是煤矿主通风系统的核心,为提高矿井主通风机的安全性、可靠性和自动化水平,利用先进的闭环控制、超限报警及通信技术,设计了一款具有智能化和数字化的风机监测、控
各学校为响应教育部关于线上教学的号召,都积极根据教育部印发的《关于做好普通高等学校在线教学组织与管理工作的指导意见》,在教学上进行了一系列调整。其中,教学方式的改
1~2月份港口生产经营继续保持好的发展势头,货物吞吐量、外贸吞吐量、集装箱吞吐量等主要经济指标仍然保持稳步增长。
针对现有37m^3聚合釜难以生产高含固率丁苯乳胶的现状,依据丁二烯与苯乙烯聚合反应的实际情况,测出12m^3、37m^3聚合釜的最大传热速率及传热系数,并对12m^3聚合釜生产高含固率丁
亲鱼要求6龄以上,体重超过15千克,按雌雄比为1:1.5放养,亩放15~20千克的青鱼10尾左右。
本文在系统梳理国内相关综合性国家科学中心建设情况的基础上,形成对建设国家热带农业科学中心的经验启示,即强化基础支撑、优化资源布局、创新体制机制,进而从功能定位、重
脾脏象理论是中医理论的核心内容。脾是"后天之本",脾脏象的研究是藏象理论发展的重要环节。现代人饮食不节、偏嗜肥甘厚味、劳逸失常、思虑失度等生活特点赋予了脾脏象更多