一种基于贝叶斯分类的邮件网络协同过滤算法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:aiqi527927
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前网络中垃圾邮件泛滥,挤占大量网络带宽,更让用户烦恼的是,删除掉这些垃圾邮件会花费他们大量时间。目前,国内学者针对中文垃圾邮件的过滤研究也在如火如茶的展开。随着文本分类技术的发展,基于内容的垃圾邮件过滤成为一种有效的垃圾邮件过滤方法,而其中朴素贝叶斯分类算法因其简单高效收到了广泛青睐。但是该算法目前主要存在两大问题,严重制约了其分类的准确率。首先朴素贝叶斯过滤算法没有考虑用户之间的联系,而仅仅考虑了用户自己;其次,朴素贝叶斯过滤算法只有在充分训练的基础上才能表现出良好的性能,而充分训练就是需要用户长期的参与并且频繁的反馈。为了缓解以上矛盾,从而更好地提高垃圾邮件过滤的准确率,本文首先从整体的角度去分析垃圾邮件的传播特性,借助学生邮件网络集合,揭示出邮件网络的小世界特性;其次,构建学生邮件交互有向图,基于用户节点间的交互强度,定义交互强度矩阵W,进而根据交互强度矩阵W提出了一种新的计算用户之间交互强度的方法,本文中称为节点交互概率,并且区分对待邮件的收和发;最后基于节点交互概率提出协同过滤算法来进行垃圾邮件过滤。交互强度参数α的值是根据用户自己的需求去设置的,通过对α进行不同取值,用户可以决定是否需要依靠他用户的协同推荐来进行垃圾邮件的过滤,从而也解决了朴素贝叶斯过滤算法需要大量训练集的问题。实验结果表明,同采用朴素贝叶斯算法的单用户过滤方法相比,协同过滤算法在召回率R、正确率P以及精确率Auc三个评价指标方面均有提高,并且方法简单易行。
其他文献
随着Internet的不断发展,网络资源共享的加强,网络安全问题已日益突出,而身份认证和权限管理又是网络应用安全的两个重要内容,它们已逐渐成为了当前信息安全领域中的研究热点
电子支付是指通过网络进行货币支付,其本质是试图把传统的支付方式转化为以网络为介质的电子形式。电子支付是电子商务活动中最为核心和关键的环节,也是电子商务得以进行的基础
本文研究容错协同编辑通信层最主要的目的在于透明地进行容错故障的恢复,尽可能地减少由于回滚产生的计算量,为实时协同编辑系统提供一个可靠的通信层。本文引入故障检测器,建立
随着IT时代的到来,信息化系统已成为各企业管理中心的重要组成部分。为对所有信息化系统设备进行计算机自动化集中管理,作为支撑现代工业生产和社会生活的基础设施的监控组态软
语言是人类交流最重要的工具之一。随着电子计算机的不断应用与发展以及人工智能的不断进步与完善,人们越来越希望让机器能够理解人类的自然语言,这种需求使得语音识别技术有着
模型驱动构架是对象管理组织提出的一种新的软件开发方法,其核心思想是模型通过变换自动产生代码。其中,模型变换的依据是模型转换规则。在定义转换规则过程中,由于不同模型的关
传统网络存在着标准化周期长和兼容性差的问题,新应用和新技术往往领先于新服务的出现,严重制约了新服务的快速拓展。为此,人们提出了主动网络的概念。主动网络允许用户向网
数字水印是解决数字多媒体作品认证的一个重要途径,是传统加密有效的补充手段,它已经成为信息安全领域的重要研究课题。数字水印技术是在多媒体数字作品中嵌入隐藏信息,只有通过
面向服务的计算(Service-Oriented Computing, SOC)作为一种新型的计算模式,把服务作为基本组件来支持快速、低成本的分布式异构环境的应用集成。随着SOC的不断发展,服务的种
二十一世纪是信息的时代,数字图像成为信息表达与传递的重要载体,相比文字等的载体,数字图像有直观自然更具感染力的表达效果,而同时互联网为数字媒体的传播创造了极为有利的条件