基于多模态特征的垃圾邮件过滤技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fiona_01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,电子邮件作为互联网最初应用之一,现已成为人们日常生活、工作必不可少的交流工具。然而,垃圾邮件的出现和泛滥,占用了大量的存储资源与网络带宽。同时,垃圾邮件所携带的网络病毒以及色情、欺诈、反动等垃圾信息更是严重影响了人们正常的网络应用。电子邮件作为互联网上最广泛的应用之一,如何保障其内容的安全与健康已成为信息内容安全方面亟待解决的问题。近年来,垃圾邮件制造者为了逃避基于文本的垃圾邮件过滤系统的检测,将垃圾信息嵌入到图像中,并将其附着在邮件正文中进行传播。传统的基于文本的过滤方式无法处理此类包含垃圾信息的邮件图像。为了应对这种同时包含文本和图像的垃圾邮件,本文提出了一种基于多模态特征的融合文本、图像等多媒体信息的过滤方法。首先,抽取邮件的文本特征和图像特征;其次,采用P-SVM对不同的特征集进行训练,分别构造出基于文本与基于图像的分类器;最后,利用多分类器融合技术对各分类器的输出结果进行综合,以此达到融合文本特征和图像特征的目的。该方法有效地融合了垃圾邮件过滤技术中文本过滤与图像过滤的特点,实现了垃圾邮件过滤中多模态特征的融合。对TREC垃圾邮件语料集进行测试的实验结果表明,使用本文提出的多模态特征融合方法获得了比单独使用文本或图像过滤方法更好的效果,准确率达到90%以上。
其他文献
利用电镜技术探讨金属离子Co对绿色巴夫藻超微结构的影响.实验结果表明,一定浓度的Co可导致细胞色素体肿涨,类囊体片层受破坏,细胞质膜不完整,液泡增多变大,核内异染色质增多
由于难以预测世界石油供应前景,燃料价格不断上涨,生产成本增加……,农业生产面临越来越多的问题;更由于迫切需要保护自然资源,美国农场主,牧场主,和农业科学家们重新评价豆
本文通过对高等教育收费制度的理论和当前实施实践过程中存在的问题展开探讨,提出了完善高等教育收费制度、解决实施过程中的问题应以成本分担和个人家庭人力资本投资两个方面
混淆是现代密码学的新研究领域,其目的是针对我们感兴趣的程序,构造出功能上与其相同的程序。任何敌手在获得新程序后,除了能使用该程序的功能外不能从中获得任何有用的信息。程
随着通信技术的广泛应用,信息的安全问题越来越突出并且已成为一个研究热点。密码学技术是信息安全技术的核心,而随机性测试可以检测密码算法的输出序列是否符合随机性要求,
公钥密码体制的提出对现代密码学的发展做出了巨大的贡献,随着计算机技术的迅速发展,公钥密码已成为当代社会信息安全的核心。而随着量子计算机技术的发展,大部分密码体制都将面
在分组迭代密码函数中,线性扩散层是实现密码系统扩散功能的重要部件,对密码函数的安全性起到至关重要的作用。本文基于分组迭代密码函数扩散层的基本特性,研究了线性扩散层设计
根据混沌信号和高斯白噪声的不同表现特征,提出了降噪算法评价准则。利用该准则,可以从不同角度对降噪算法进行性能分析,并给出合理的评价。本文用奇异谱分析和小波阈值算法
简要介绍了全球第一个楼宇自控行业通信标准BACnet协议与国际互联网协议TCP IP的产生、内容以及发展。同时对使用TCP IP协议实现BACnet网络互联和报文传输的应用进行了重点阐
通过反-1-(4-甲基苯基)-2-(4-吡啶基)乙烯(E-MEP)在稀盐酸中的光二聚反应得到了接近定量的标题化合物(DMDPC).用元素分析,IR,UV,1H NMR和MS表征了其结构,并用X射线衍射法测定