基于哈希函数的URL过滤技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:b329066975
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,合法和非法的信息充斥其中,所以网页的过滤技术成为了安全领域的新焦点。网页过滤技术多种多样,包括URL黑名单过滤技术、关键词过滤和模式过滤技术等。随着不良网站数量和网络流量的急剧增加,对URL黑名单过滤算法提出了新的挑战。所以设计一个内存占用少,过滤速度快的URL过滤算法是十分必要的。   本文的研究内容是URL过过滤算法和在windows7操作系统上的URL过滤技术。本文首先介绍了URL过滤技术发展的背景,阐述了为什么URL过滤技术成为了目前安全领域的新焦点。同时,还对各种主流的URL过滤算法进行了介绍和算法复杂度分析,并总结了在windows7操作系统下URL提取技术的发展现状。接下来,本文介绍了两种原创的URL过滤算法,第一种算法结合了Bloom Filter和MPHF技术,在URL匹配率比较低的情况下,很好的减少了做哈希计算的次数,同时给出了此算法的复杂度分析。第二种算法提出了一种基于哈希半值签名特征的算法,这种算法定义两个URL相等当且仅当两个URL的偶数位组成的字符串的哈希值相等且奇数位组成的字符串相等,这种定义方法使得算法有一定的误报率,所以第三章还给出了误报率的统计估值方法,第三章结尾对文中提出的五种算法做了实验,并给出了对比分析,本文的两种算法在过滤效率上都有很大提高,其中基于半值哈希签名特征的算法速度最快,而且内存占用最少。最后,本文详细论述了一个基于C/S架构的URL过滤系统的分析设计与实现。此系统的URL过滤功能使用windows筛选平台技术实现的。  
其他文献
随着互联网的发展,多媒体图像数据海量增长,互联网已经进入了一个大数据的时代。基于关键字的检索方法由于效率较低,检索速度较慢,已经无法满足对海量图像数据进行检索的需求
日前,少林寺释德扬法师应西班牙布鲁诺和意人利瓦尔特邀请,先后来到西班牙、意大利、瑞士、列支敦士登四国开展武术交流活动.本次传授的是完整版三路大罗汉拳,少林武术深受广
期刊
作为新文化和新思潮的代表,“90后”已逐渐成长为社会的主流力量,用他们特有的价值观影响着社会的发展,也注定将在社会公益领域书写极具特色的一笔.而刚刚迎来25岁生日的中国
期刊
7月11日凌晨五点钟,邵环等一行“爱·公益”的志愿者己经踏上了前往河南登封大金店镇的路上,去接15位贫困孩子走出山村和爱心家庭“大手牵小手,一起游郑州”。夜里九点钟,把孩子们安全送回家后,他们才刚刚踏上回郑州的路。  这些孩子们大都是第一次去郑州,第一次旅游,第一次参观博物馆,第一次吃汉堡包,第一次游海洋馆看美人鱼,第一次看3D电影……孩子们兴奋得不得了。尽管旅程只有一天,不论家在城市或山村,孩子
期刊
近年来,无线传感器网络在实际应用中有着较快的发展。现有的无线传感器网络安全研究大多集中在数据安全领域,而缺乏对路由安全及节点认证方向的关注与思考。本文将网络编码引入
随着信息高速公路的搭建及其高速发展,网络已经成为全球信息通信基础设施中不可或缺的主要组成部分,无论是军事、生活还是文化上,都起着重要的作用。由于计算机网络的开放性
7月26日下午,第三届《少年武状元》青少年搏击比赛在河南飞龙搏击俱乐部落下帷幕.来自全国的19支代表队104名运动员参加比赛.rn本次大赛由少年武状元组委会主办,河南飞龙搏击
期刊
可视密码术是M.Naor和A.Shamir于1994年提出来的密钥分享的新概念.该文主要研究了可视密码术的一种新的成果--叠像术:研究人员对可视密码术作了改进,使之即能隐藏原密钥,不为
随着计算机和互联网的飞速发展,各个行业对计算机的依赖逐渐加大。与此同时,带来的计算机安全问题越来越引起人们的重视,Web安全事故的颁发,更体现的Web安全检测重要性。随着
龙新民署长所说的“走开去”有两层含义:一个层面是努力扩大出版物的阅读人群,另一个层面是扩大出版物衍生产品的开发,拓展传统出版业的产业链,开发占领各种新兴媒体。就企业