基于DHT的邮件Nilsimsa摘要发布和查询方法

来源 :南开大学 | 被引量 : 0次 | 上传用户:lpve530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子邮件在世界范围内的广泛应用,垃圾邮件作为商业广告、恶意程序或敏感内容的载体,对系统安全和人类生活所造成的影响越来越严重。本文以实际捕获的邮件样本为依据,通过对垃圾邮件分布规律的统计与分析,论证了垃圾邮件具有时间上的突发特性,且10天是一个合适的垃圾邮件的生存周期。 Nilsimsa摘要算法在分布式垃圾邮件过滤技术中占有重要地位,本文在研究Nilsimsa摘要的基础上,提出了一种基于DHT的邮件Nilsimsa摘要发布与查询方法:DHTnil。文章详细论述了DHTnil的发布与查询算法,DHTnil使用摘要向量空间划分的方法将相似的摘要发布到少数几个结点之上,并以此为基础在DHT网络上面实现了邮件Nilsimsa摘要的近似查询。在DHTnil系统中,摘要的发布、查询、和存储都是分布式的,它突破了传统的Nilsimsa摘要总是集中处理的缺陷,使得系统具有更大的扩展性。本文通过仿真实验验证了DHTnil的有效性。针对随机生成的数据,DHTnil可以保证每组相似邮件的发布只涉及不超过3%的子空间,而近似查询只搜索3.5%的子空间就可以搜索到80%的相似邮件;针对实际捕获的邮件样本,仿真实验得到了与随机数据相似的结论。另外,我们通过仿真实验证明了DHTnil系统具有较好的负载均衡特性。最后,我们探讨了DHTnil系统设计和实现的一些细节问题。
其他文献
数据分类是数据挖掘中的一个重要课题。近年来研究提出的关联分类(associative classification简称AC)——将关联规则挖掘和分类结合起来,作为一种新的数据分类方法在数据挖
嵌入式系统广泛应用于科技领域和人们生活当中,同时它也在融合着各种先进技术,不断向前发展。无线通信技术的发展为嵌入式系统开拓了广阔的发展空间。无线通信技术在嵌入式系
随着网络规模的迅猛发展以及用户需求的膨胀,互联网的应用已经渗透到各个领域,越来越多的政府,企业以及个人在Internet上发布或查找信息。Internet上充满了文本、音频和视频等多
新冠肺炎疫情期间,我校数学教师利用在线开放课程资源,结合腾讯课堂等直播平台,实现了“停课不停教,停课不停学”的线上教学,学生满意度69.9%.本文阐述了在线开放课程建设的目
将虚拟现实技术引入到人机交互界面中,是对传统图形交互界面的一次飞跃性的改进。本课题主要研究智能化虚拟人在人机交互系统中的应用,实现虚拟人表现形式的智能提示界面(Int
随着经济发展和人们进行商业活动能力的提高,金融交易活动的发生日益频繁,在大量的交易活动中隐藏着许多非正常的交易,洗钱活动也伴随其中,根据专家知识以及相关法律法规人工
本文研究目标是解决网格仿真中的任务管理问题并验证所提方法的正确性和有效性。本文在仿真方法和任务调度算法两个层次上对基于网格的仿真进行了研究,内容主要包括基于网格
网格技术作为近年来的研究热点,能够为不同管理域之间的资源共享与整合提供一条有效的途径。本文的研究对象是组件形式的网格监控系统,它力图通过收集和发布网格资源的状态信
在信息时代,网络存储技术的出现和发展很好地解决了存储资源的充分利用问题。然而,存储网络在提高资源利用率的同时,由于设备之间缺乏互操作性,严重的增加了管理的难度。为了
目前,数据挖掘的研究己经成为了一项热点,但是其绝大多数应用主要是面向商业尤其是电子商务,对非盈利机构中涉足并不多。这就导致大量的机构对信息系统的使用只停留在日常事