论文部分内容阅读
针对当前HTTP请求过滤方法对嗅探器端口依赖与时间戳连续性依赖的缺点,本文提出了一种基于K近邻的机器学习分类方法,在保证较好的分类效果的同时摆脱分类对时间连续性的依赖。该方法将机器学习的思想应用在HTTP请求过滤中,通过之前传统方法得到大量标记样本,然后采用K近邻分类算法利用大量标记样本对未知样本进行分类,通过确定新样本的类别标签来达到过滤目的。最后,通过理论分析与实验,证明该方法对于非均衡的HTTP请求日志样本集是可行的。