邮件安全网关关键技术的研究与优化

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:fyps
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子邮件技术是一把双刃剑,它的普及给人们的交流带来了极大便利,同时垃圾邮件的泛滥也已经影响甚至威胁到人们日常的生活和工作。在当今高速网络环境中,大多数邮件安全网关通过解析邮件内容过滤垃圾邮件,这种过滤方式耗时费力。本文将从提高邮件安全网关在高速网络环境中的应用性能出发,针对邮件地址匹配算法和不需要解析邮件全文的垃圾邮件识别方法进行研究。首先,针对邮件地址匹配算法方面进行了研究,涉及到多模式匹配算法。WM(Wu-Manber)算法是一种经典的多模式匹配算法,然而将WM算法直接应用于海量规模的邮件地址匹配时,由于没有考虑邮件地址的特征,算法效率并不高。本文提出一种支持海量规模邮件地址匹配的ME-WM算法。ME-WM算法结合WM算法自身特点和邮件地址特征,针对WM算法存储结构和匹配流程进行优化。ME-WM算法利用一种高效的哈希模型减少哈希冲突;通过布隆过滤器存储和匹配邮件地址的域名,避免了邮件域名的重复存储,降低了算法的内存消耗;通过使用红黑树处理产生哈希冲突的元素,降低精确匹配耗时。最后通过与传统WM算法及其改进算法RFP-WM、Prefix Tree-WM算法进行对比实验,对比其时间性能和空间性能,证明ME-WM算法非常适合应用于海量规模的邮件地址匹配。其次,针对垃圾邮件的识别技术进行了研究。本文提出了一种基于时窗增量的中文垃圾邮件识别模型,利用决策树算法分析垃圾邮件的标题部分,探索标题特征与垃圾邮件之间的关联规则,应用这些规则,建立一个高效、准确的垃圾邮件识别模型。本文的垃圾邮件识别模型具有以下优点:不需要解析邮件全文,只分析电子邮件的标题部分,减少了计算的复杂性,提高了邮件网关的过滤性能;引入了适应互联网开放环境的中文分词算法;构造了加权时间窗口,用于计算每封待过滤邮件的概念漂移得分,将概念漂移作为一种构建决策树的关键因素,不需要重构分类器以解决概念漂移问题;设计了一种增量学习机制来扩充垃圾邮件关键词表,提高模型对动态环境的适应能力。最后通过实验证明本模型的有效性,并且性能优于改进的贝叶斯模型、优化的SVM模型和变精度粗糙集决策树模型。
其他文献
论述了西昆仑塔什库尔白勒达坂铜矿干成矿地质背景和矿床地质特征,通过矿床地质特征、矿石结构构造、矿石组合分析矿床的形成主要为热液型铜矿床。该区位于华南成矿区-阿克塞
依据山西省90年代完成的1:20万区域化探扫面成果,本文系统的统计了山西省Ag、As、Au、B、Ba、Bt、Bi、Cd、Co、Cr、Cu、F、Hg、La、Li、Mn、Mo、Nb、Ni、P、Pb、Sb、Sr、Th、T
日美欧等稀土消费"大户"为了应对中国管制稀土产品出口的新格局,开展了一系列相应活动。本文将这些活动详细盘点,并搞清其实际含义以及近期和远期有可能产生的影响,希望能对我
【正】 上述之苓桂枣甘汤方的煎服方法别具一格,甚关重要,亦不可不知。第一:此方必须用"甘烂水"煎,不能用一般水煎。因为水寒邪气欲上冲心胸,如用常水煎药势必以资水寒之气上
目前,全球大多数国家均发生着极度的地质灾害,严重威胁人类的生命与财产安全。而每个国家应对地质灾害的策略均不尽相同。其中,日本与美国这两个国家是当前全球上防灾工作做
透视2010年的铝市,我们发现平均一个季度就演绎一次价格的,上涨下跌巡回,这预示着价格的波动频率非常高,说明2010年全球铝行业并不平静。那么,有哪些大事件对全球铝市形成冲击?本文
作为高强、高导电合金的代表——铜铬锆合金,因具有导电率大于等于80%IACS和硬度HRC≥80的性能指标,在国民经济各部门,如电子、电力、机械工程等方面得到广泛应用,也成为铜及合金
库布苏北金矿由北、中、南3个金矿化带构成,矿化带受区域韧性剪切带库布苏大断裂两侧的韧脆性次级断裂控制。库布苏大断裂以北为野马泉地块南缘的泥盆纪火山岩浆弧带,断裂以
本文较为详细的阐述了风机失速过程及机理,介绍风机失速现象及危害,涡流导致的风机失速会严重损坏风机叶片,特别是具有“驼峰”性能曲线的风机。以相关图标数据来进行了失速
本文将对一种Mg-Al-Zn-Mn系镁合金进行热处理实验,对实验结果进行这种合金的组织和性能关系研究,通过对这种镁合金热处理后产生的最优化成分进行统计,体现为选择Mg-8Al-0.5Zn