基于Bayes的邮件过滤系统研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:hbc235wjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文为了提高过滤模块性能,研究了垃圾邮件过滤系统所需的各种技术,包括中文分词技术、中文分词词典机制、自动文本分类技术等。通过对各种分词技术进行比较分析,本系统采用支持首字哈希和完全二分查找的分词算法。比较了各种特征提取函数,采用期望交叉熵进行特征提取,为提高分类精度打好基础。 在实时黑名单模块,调用了linux的系统命令,这样模块可以随时去国际互联网协会网站下载最新的黑名单,从而降低用户收到垃圾邮件的可能性。
其他文献
软件行业的工业化趋势导致了软件构件的产生。能够像硬件系统那样,将部分软件组合起来构建软件系统,一直是软件行业多年来追求的目标。可以说,软件构件技术的出现是对传统软
以往逆半调研究较少关注颜色空间和人眼视觉系统对逆半调算法的影响。本文在总结影响逆半调处理的视觉特征以及颜色空间模型的基础上,提出了基于人眼视觉特性的彩色逆半调算法
目前的网络教学系统大多通过网页发布和一些交流工具来开展教学活动,基本上是Internet技术在教学上的简单应用。他们主要提供一些教学资源,学习的动态过程无从体现,没有发挥教师
本文在学习传统网络拓扑测量知识和理解P2P网络和传统网络差异的基础上,提出了在P2P网络上进行拓扑测量研究的对象应该是对等节点的角色和对等节点间的交互协议,这些不同于传统
人工生命的研究是当前的研究热点之一。贝叶斯网模型也以强大的知识表达和推理能力成为目前数据挖掘领域中的一项重要的工具。本文主要研究贝叶斯网在基因选择的进化过程中的
随着多媒体技术的发展和人们对人机交互和虚拟现实技术越来越高的要求,近些年来,可视语音合成成为多媒体领域一个研究的热点和难点。先前的研究已经证明,多通道的信息融合能够增
嵌入式GPRS数据业务以实时在线和成本低廉的特点,在工业生产中得到广泛的应用,其安全性显得越来越重要。目前,在GPRS数据业务的安全体制中,AAA机制实现用户的身份认证,VPN技术实现
随着微电子、计算机和网络技术的发展,人们对以身份鉴别为基础的信息安全技术的要求越来越高。传统的身份鉴别方法,如ID卡(身份证、工作证、智能卡、储蓄卡等)和密码等,存在携带
多值逻辑是计算机科学中的一个重要分支。随着计算机科学与技术的不断进步,多值逻辑得到了前所未有的发展,其研究主要包括理论、电路与系统、应用三个方面的内容。多值逻辑函
随着计算机网络及通讯技术的迅速发展,利用网络实现各种电子活动的信息化,数字化,无纸化和国际化,已经成为众多中小企业的共识。为了进行方便、快捷、高效的B2B网上交易活动,越来