基于分类及相似性的图像型垃圾邮件检测技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:Fzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和信息技术的发展,电子邮件已经成为人们沟通交流的重要工具。但是垃圾邮件的泛滥却给人们的工作和生活带来了极大的困扰。尤其从2005年开始,垃圾邮件制造者将垃圾信息嵌入到图像中,并在图像中加入噪声或模糊化等技术,形成了图像型垃圾邮件(image spam),以逃避反垃圾邮件系统的检测,因此如何精确和高效的检测图像型垃圾邮件是急需解决的问题。论文系统地分析了image spam的产生背景、发展现状及研究意义,对图像型垃圾邮件检测的关键技术进行深入的学习和研究,并在已有研究成果的基础上,提出了基于分类和相似性的图像型垃圾邮件的检测方法。论文主要完成了以下几方面的创新:1.分析了垃圾邮件检测技术使用的各种图像特征,提出了利用图片的局部不变特征来描述图片的垃圾信息分布的方法。2.针对image spam的多种构造方法,提出了基于垃圾技术分类的垃圾邮件检测方法,该方法构建两层的组合过滤器,第一层是检测图片中的噪声特征过滤器,第二层是颜色!特征、纹理特征、形状特征的组合过滤器。实验证明这种分层组合的过滤器具有较高的召回率。3.针对传统的基于相似性的image spam检测系统的不足,提出了利用加速的健壮特征SURF算法提取图片的局部不变特征,训练高斯混合模型GMM的分类器来检测图像型垃圾邮件的方法。论文通过实验证明,在图像型垃圾邮件的检测中,基于图片的局部不变特征的GMM分类算法比其他算法具有更好的检测效果。
其他文献
计算需求日益增多的今天,人们普遍采用GPU(Graphics Processing Unit)作为运算加速设备,现在利用通用显示核心(General-Purpose GPU,GPGPU)计算技术已经成为任何海量数据的必
随着通信技术、嵌入式计算技术和微电子技术的飞速发展和日益成熟,传感器网络引起了人们的极大关注,这种网络系统可以被广泛地应用于国防军事、环境监测、医疗卫生、智能家居
供水系统是城市重要的基础设施,保障着社会经济稳定发展和人民生活安定。随着城市规模的不断扩大和人口的不断增多,人们对供水安全性、可靠性和经济性都提出了更高的要求。供水
随着经济全球化和信息技术的飞速发展,面向服务的思维方式解决了企业信息系统对于快速响应需求与环境变化、提高系统可重用性、信息资源共享和系统间互操作水平的要求的一系列
模块规划是提高软件产品族生产效率和降低软件成本的关键技术,合理规划软件产品族模块是技术研究的重点。本文在分析软件产品族和模块规划发展现状的基础上,基于需求向量运用
中文分词技术主要包含以下三个研究方向:理解分词,机械分词以及统计分词。基于理解的分词方法研究尚未成熟,所以,绝大部分中文分词系统是应用机械统计相结合的方法。在目前主
随着计算机技术特别是多媒体技术的迅速发展,图像处理技术开始广泛应用于社会的各个行业,包括炉膛火焰图像处理领域。监控摄像机输出的视频信号能转化为计算机可以处理的数字
由于系统体系和呈现行为这两种概念及其理论和应用促进了大型软件系统和互联网应用的发展,所以在国际上得到计算机软件领域的普遍重视。随着技术的进步和各领域对系统要求的不
无线网络中,在一个节点向多个节点传递同样的数据包时,往往采用多播(Multicasting)的方式逐一将数据包传递给接收节点。由于无线链路的可靠性具有时变的特性,在一个节点发送
随着数据云存储概念的诞生以及因特网的普及导致的信息流加速,各种行业正在形成庞大的、复杂的、异构的数据环境。在这些庞杂的数据环境中,有一些公共数据库在生物学,天文学