基于IMI-WNB算法的垃圾邮件过滤技术研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:zxzc10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互信息和朴素贝叶斯算法应用于垃圾邮件过滤时,存在特征冗余和独立性假设不成立的问题。为此,提出一种改进互信息的加权朴素贝叶斯算法。针对互信息效率较低的问题,通过引入词频因子与类间差异因子,提出一种改进的互信息特征选择算法,从而实现更高效的特征降维。针对朴素贝叶斯分类算法的独立性假设问题,在朴素贝叶斯分类时使用改进互信息值进行特征加权,消除部分朴素贝叶斯条件独立性假设对邮件分类的不利影响。实验结果表明,相比传统朴素贝叶斯算法,该算法提高了垃圾邮件过滤的精确度、召回率与稳定性。
其他文献
在经典的均值-方差模型中,研究者往往假设收益率服从正态分布,用收益率均值估计其期望。但在实际问题中收益率往往不满足假设,同时考虑到方差度量风险的局限性,从而我们构建
七十年来,战天斗地,巍巍我党光昌。挠攘风云,苏欧倾侧彷徨。百川独障声威显,竞朝宗,马列宏扬。更高标,特色康同,谁惧蹈汤!中枢擘划纲条举,人人挥赤帜,奋发图强。艰苦勤劳,文明
物理学是一门以实验为基础的学科,物理实验在整个物理教学过程中占有十分重要的地位。近几年来,物理实验教学越来越得到各高等院校的重视,物理实验课已同理论课一样:独立开课
以云南寻甸县棚户区改造项目为例,介绍了复杂工况下施工电梯基础的特殊处理和双笼翻板门电梯受条件限制而进行的改门处理,从而有效解决了施工电梯在有隔震层情况下的基础布置
量子力学原理与爱因斯坦的引力理论存在着明显的不相容性。如果把所有基本粒子都作为弦进行处理,就能得出一种自洽的量子理论,它可说明所有四种基本作用力之间的相互联系。
我校的教育实践,先后实施了两次改革,第一次是1987年开始实行的“五定”教育实习方案,第二次是1990年开始实施的“三段式”教育实践方案。第一次改革使我校教育实习逐步走上
面对着数以万计的微型小说,我常常感到无比焦虑,微型小说究竟属于何种体裁?是小说?散文?诗歌?还是寓言?笑话?速写?抑或是我们常见的实用文体?我陷入了深深的困惑之中…… 一
近年来,随着网络技术与计算机技术的迅猛发展,网络化控制系统(Networked Control Systems,NCSs)的研究得到了国内外控制领域专家学者的广泛关注。在NCSs中,控制器得出的控制信号或传感器采集的测量信号均可通过网络进行传输。随着网络化控制技术的快速发展,多智能体系统(Multiagent Systems,MASs)也逐渐接入网络,网络化多智能体系统(Networked Mul
描述真实气体状态的范德瓦耳斯方程在热学发展史上有重大意义。因为它是第一个既能应用到气相又能应用到液相且能显示出液—汽相变的状态方程。它包含了气相和液相大部分重要
本文应用边界元法计算了强震下流体的非线性晃动及其对槽身的水平力及翻转力矩,将所得数值结果与线性解析方法的计算结果作了比较,分析了两类结果的异同点.计算表明:强震时,