基于TF*IDF的垃圾邮件过滤特征选择改进算法

来源 :计算机应用研究 | 被引量 : 17次 | 上传用户:aaron722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子邮件的普及与应用,垃圾邮件的泛滥也越来越受到人们的关注。而如何进行邮件特征选择,是邮件分类中的重要问题。在介绍词频和倒文档频度的基础上,对几种常用的特征选择算法进行了分析和比较,针对现有特征选择算法过于机械的缺点,将关键字权重引入到邮件分类中,提出了一种基于关键词权重的TF*IDF特征选择改进算法,并进行了实验验证。实验结果表明,采用该算法改进后的贝叶斯过滤器具有更好的过滤效果。
其他文献
首次利用双线性映射提出了一个基于身份的门限多代理多签名方案。在该方案中,原始群和代理群的管理员通过分发共享秘密来控制群成员的行为,在群成员获得共享秘密后,一定数量的原始签名者合作可以进行授权,一定数量的代理签名者合作可以产生签名。经分析得知方案具有秘密性、不可伪造性和不可否认性等安全特点。
基于RBF核,利用Synthc、BC等标准数据集,采用五重交叉验证,比较SVM(支持向量机)及RVM(关联向量机)模式分析性能。实验结果表明,与SVM相比,RVM时间复杂度、测试错误率较低,模式分析性能较优。
传感器网路布置模型是整个传感器网络监测系统的关键技术,直接影响网络成本及性能。目前研究者提出很多传感器布置模型,但这些模型在实际工程中实用性差、成本高。在软传感器启发下,根据实际监测环境特点,运用数学分析方法,提出一种虚拟传感器补偿算法,该方法大大地提高了传感器网络的性能,降低了成本。实验显示,基于虚拟压力传感器补偿的压力传感器网络具有很高的工程实用价值。
在Conway提出的"生命游戏"规则的基础上,为提高生命繁殖和生存的概率,通过改变周围邻居元胞的状态提出一种改进的演化规则。实验证明,结合元胞自动机的遗传算法,加入改进的演化规则后,用于求解复杂多峰函数优化问题获得了较好的效果。
为设计具有高检测率和低误报率的网格实时入侵检测系统,借鉴人类免疫系统与网格安全系统的相似性特征,在建立体系结构设计原则的基础上,确立了群体agent实现网格入侵检测系统的交互决策机制;在选定免疫模型与免疫算法的基础上,给出了人类免疫系统与网格入侵检测系统组件间的具体映射关系,从而实现了概念的逻辑移植;在建立agent网格体系结构基础上,设计了网格入侵检测系统的具体模块框架,详细阐释了与模块对应的具
针对求解job-shop调度问题中存在的易出现局部最优、效率低下的问题,提出了一种新算法。该算法采用了一种评价种群过早收敛标准的方法,引进了新的加快遗传算法进化速度的交叉算子,最后设计了人工免疫算法中疫苗的提取和接种方法,即基于加工机器的基因片断抽取疫苗方法和最后完工机器个体的接种方法。通过实验证明该算法能够有效地解决易出现局部最优、效率低下等问题。
设计了一套基于3GPP标准的移动流媒体视频实时监控系统,同时介绍了系统采用的服务器集群、安全防盗链等关键技术,最后给出了系统主要功能参数的评测。
设计了一种eDonkey网络爬行系统。该系统能避免被中心服务器的自动保护机制添加进黑名单,且能突破返回结果数量限制。通过对爬行获取的数据进行统计分析,得出了eDonkey网络中服务器分布和文件分布的一些特性。
提出了一种新的混合代理多签名方案,它是由一些原始签名人的部分签名和代理签名人的签名的随意组合。与一般的代理多重签名不同的是,一组原始签名人不是都将签名权授予指定的代理签名人,仅有一部分原始签名人授权,其余的是自己行使签名权,即实现了一组原始签名人只有部分成员不能行使签名权的要求。最后对方案的安全性进行了分析。
通过在微粒群算法中引入排雷策略的思想,对微粒群优化算法进行改进,使微粒群算法能摆脱局部极值点的束缚;另外通过在算法的迭代过程中加入旋转方向法,加快算法的收敛速度,从而形成一种新的改进粒子群算法。通过对三个典型函数进行优化计算,并与其他文献的改进微粒群算法的优化结果进行比较,表明基于排雷策略的改进算法很好地解决了粒子群优化算法早收敛、难以跳出局部极值点和收敛较慢的问题。