【摘 要】
:
随着物联网时代逐步到来,电子邮件仍然是最重要的沟通工具之一。然而,其副产物——垃圾邮件的出现给人们的生活带来了潜在的危险。其中图像型垃圾邮件促使着反垃圾邮件技术进
论文部分内容阅读
随着物联网时代逐步到来,电子邮件仍然是最重要的沟通工具之一。然而,其副产物——垃圾邮件的出现给人们的生活带来了潜在的危险。其中图像型垃圾邮件促使着反垃圾邮件技术进入一个新的研究领域。如何精确和高效地检测图像型垃圾邮件是急需解决的问题。论文系统地分析了图像型垃圾邮件的产生背景、发展现状及研究意义,提出了基于组合及统计分类器的图像型垃圾邮件的检测方法。论文的主要工作和贡献在于:(1)提出了利用SURF特征提取算法来提取图片的局部不变特征并使用统计学中的高斯混合模型来对图像的这种特征进行高斯混合分布的拟合。通过改进K-means均值聚类算法,以交叉熵作为高斯混合分布之间的距离计算标准,对数据集中图像的高斯混合模型进行聚类以减少实验的计算量,提高实验的效率。最终设计并实现了基于交叉熵的高斯混合模型分类器,通过实验验证,新提出的分类器具有较好的分类效果。(2)以往的图像型垃圾邮件过滤系统只针对图像的内容特征或者图像的文字特征,而容易丢失图像信息,导致分类的准确度不高。论文提出使用堆栈组合模型分类器结合了图像的文字特征与图像的内容特征,充分利用了图像所携带的数据信息,特别地,针对不同的图像特征使用不同的分类器进行分类,然后通过多层次组合得出一个综合的结果。通过多种实验验证,发现使用堆栈组合模型综合图像的文字及内容特征能够获得更高的分类精确度及召回率。
其他文献
随着传统互联网在扩展性、移动性和安全性等方面面临着越来越巨大的挑战,软件定义网络(software-defined networking,SDN)随之应运而生。OpenFlow技术作为SDN体系结构的实际
自然科学、工程技术、社会科学中存在着大量的偏微分方程(PDEs).然而,许多PDEs的真解很难得到,或以实用的表达式表出.因此,为获得PDEs的近似解,发展高性能的PDEs数值解法是十分必
目前,企业级用户的广域网传输问题主要来自两方面,即链路与应用。链路问题包括带宽受限、网络时延大、丢包率严重等;应用的问题则集中于大数据量的传输,以及应用自身在广域网
语音合成是当今计算机智能应用领域的研究热点,目前它越来越广泛地应用于社会生活的各个方面,提高了人机交互性,发挥了很好的社会效益。随着当今社会计算机技术的快速发展,语
基于Handel-C语言的算法硬件化技术是一种使用高级语言进行算法设计,并通过硬件完成算法实现的技术。该技术可快速将已有成熟算法的C语言程序转化为硬件实现,也可高效开发全新
网格技术是将所有可用于共享的资源,通过网络连接起来,并将它们转化成一种计算能力,对资源进行整合,从而解决信息孤岛问题。用户将任务提交给网格后,需要对任务进行合理的分
随着图像处理在医学领域上的蓬勃发展,以计算机技术为核心的细胞检测技术在其发展上显得越发重要。作为细胞检测极为重要的一步,细胞分割技术的研究中,如何科学合理、高效快捷地
Web Spam是一种不考虑网页的真正价值,却有意实施不公正的相关性或重要性的排名行为。它的出现不但威胁到搜索引擎的公正排名,同时还严重影响用户的搜索体验。如何通过分类来检
本文研究数据挖掘技术在移动通信客户细分中的应用,旨在解决如何利用现有客户数据资源,寻求行业内对客户群体的有效细分方法,使用数据挖掘技术对移动通信客户进行合理的、有效的