反垃圾邮件中贝叶斯方法的应用研究

来源 :成都理工大学 | 被引量 : 8次 | 上传用户:lianzi0118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文依托于国家高技术研究发展计划863项目重大专项课题“‘缩小数字鸿沟——西部行动’第一批课题(课题编号:2003AA1Z2530)——基于国产Linux的公共信息平台关键技术与应用研究”的研究内容。 近年来,我国的因特网应用进入大发展阶段,电子邮件给用户带来很大方便的同时,也产生了一个新的问题,即大量的垃圾邮件的出现。如何将电子邮件中属于“垃圾”类别的邮件过滤掉,已成为电子邮件用户关心的一大问题。这就是所谓的“反垃圾邮件(Anti-Spam)”问题。这也是基于国产NC和国产Linux公共信息平台要解决的一个问题。 要治理垃圾邮件,必须立法、组织、技术三管齐下。就技术而言,我们要清醒地认识到制造、传播垃圾邮件技术和反垃圾邮件技术的斗争如同人类和计算机病毒斗争一样,都是一个此消彼长、长期不断的过程。为此,本文就反垃圾邮件技术、文本自动分类系统、贝叶斯分类模型、多分类器组合等相关理论、知识进行了研究。 贝叶斯(Bayes)分类算法是基于概率统计原理的一种分类方法,它具有理论清楚、运算速度快、分类精度高等优点,因而被广泛地应用在各个领域的文本分类并取得较好的效果。本文对朴素贝叶斯分类模型(NBC)、朴素贝叶斯分类模型的提升(Boosted NBC)、半朴素贝叶斯分类模型(SNBC)、树扩展的朴素贝叶斯网络分类模型(TAN)、增量贝叶斯分类模型、贝叶斯网络(BN)等贝叶斯变形算法进行了深入地研究。 在此基础上,本论文提出基于贝叶斯技术的反垃圾邮件多分类器组合模型,并对模型的阈值优化设置提出了改进方法。实验结果表明,该算法模型可以获得较高的查准率和查全率,可以为设计出更好的反垃圾邮件方案提供理论的支持。
其他文献
我院2003~2005年共发现5例流行性出血热并发呼吸窘迫综合征患者,病情危重,3例死亡,但其影像发展有一定规律性,早期发现及诊断是及时治疗、降低病死率的重要前提,应引起重视,现报道如
经实验室高温湿蒸短流程前处理工艺试验,对前处理工艺主要参数、助剂的种类和用量进行了筛选和优化,认为这是一种连续、快速的前处理工艺。在试验基础上,先后三次在高温湿蒸染色
目的了解噪声作业人员现场护听器实际使用效果,为制定防聋干预措施提供科学依据。方法以噪声危害较严重的某市轧钢企业为346名劳动者为研究对象,对佩戴市售防噪声耳塞人员听
这是一个色彩斑斓的地方;这是一个活力四射的地方。六月的壮乡,激情如火;
涡旋光作为一个特殊的光束,它具有螺线形相位分布结构的相位因子,且其中的每一个光子都携带轨道角动量。涡旋光束的特殊性质得到了人们的重视和关注,逐渐开始对涡旋光束的深
赤峰工业职业技术学院是2011年经内蒙古自治区人民政府批准成立的一所公办全日制普通高等职业技术学院。学院以高等职业教育为主,以中职教育为辅,同时承担短期培训和成人继续
风能是一种重要的可再生能源,也是目前我国发展最快、最经济的清洁能源。但是,我国在风能开发和利用过程中也遇到了一些问题,其中最突出的是风电场选址不当所带来的一系列问
2013年2月,自治区人民政府发布了《关于进一步加强全区公共文化服务体系惠民工程建设的实施意见》(以下简称《实施意见》)。这份经过一年多系统调研、反复酝酿和多次修改的《实
目的:观察抗肿瘤新药长春瑞宾(NVB)和顺铂联合化疗治疗晚期非小细胞肺癌的疗效.方法:自2000-06~2002-11对36例晚期非小细胞肺癌(NSCLC)采用21d NP方案治疗.结果:部分缓解(PR)1
介绍了2001年全国主要染料生产企业概况和全国染料进出口主要国家和地区及省市的有关情况。2001年全国染料产量23.74万吨,有机颜料产量7.46万吨,全国染料进出口总量22.8万吨,比上年