基于AdaBoost-Bayes算法的URL分类方法

来源 :信息网络安全 | 被引量 : 9次 | 上传用户:peterkong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为实现根据HTTP协议数据流对用户的行为进行分析,需要快速区分出用户访问资源的URL。为此文章提出一种结合规则过滤和机器学习算法的方法,用于快速识别用户访问的URL。首先将解析后的数据包根据URL后缀过滤掉资源加载类的数据包,然后根据浏览器UserAgent的特有字段和在浏览器上访问网页的特性识别出浏览器UserAgent, 最后通过基于AdaBoost和Bayse算法训练好的分类器识别出用户访问URL。实验结果表明,本文方法能够在局域网数据流中高效、准确的识别出用户访问的URL。
其他文献
从大规模的网络流量中分析挖掘出用户信息、总结用户行为,已经是互联网时代的一项关键技术。文章针对现有的研究成果做了充分调研,总结了前人在用户分类和网络流量分析方法上的优点与不足,并分析了云系统下可能的安全隐患,提出了一种云系统下多层次用户分类方法。该方法从IP、会话等多个层面对用户行为进行了分析,有针对性的提出了相应的分类标签,并提取了有效的分类特征,采用统计学结合机器学习的方法,对用户进行分类。该
俄在我国出版报刊有着特定的历史背景,其历史可以划分为1898~1905年、1905~1907年、1907~1917年三个阶段。总体上看,因受俄国国内政治局势变化的影响,沙俄在华办报活动持续时间
<正>与动植物育种比较而言,食用菌的育种研究工作起步较晚,又由于市场的狭小和缺少对食用菌育种研究的大量投资进而导致食用菌育种的科学研究滞后于动植物,特别是在分子育种
会议
重庆丰都世坪森林公园的常绿阔叶林是长江三峡库区低海拔区残存的较典型的常绿阔叶林.在此地选择具有代表性群落设立1hm2固定样地,应用相邻格子法进行每木调查,通过乔木层优
目的:实现有效沟通,从根本上杜绝冲突。方法:根据性格差异类型,采取有效沟通方式,以提高工作效率,积极应对冲突的发生。结果:通过区别性格差异类型,加强沟通,增进互相理解,避
问题提出:目前关于教练员-运动员关系主要有动机理论模型、多维模型、调解模型、逆理论、三维人际行为模型和3+1Cs理论模型,这些理论模型填补了研究教练员和运动员人际动力学
城市化过程通过直接或间接的改变地面形态及原本自然的生物地球化学过程,使生态系统的结构、过程和功能受到影响或发生不可逆转的变化,带来了显著的生态效应,其中对于气候影
一、引言本文从工业化与信息化融合视角探讨协调成本与经济增长的关系,由此回答为什么工业化与信息化深度融合构成中国制造2025战略任务这一重大理论与实践问题,从而为中国制