基于偏最小二乘特征抽取的垃圾邮件过滤

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:chao_huang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着垃圾邮件逐渐成为网络用户的一大困扰,垃圾邮件过滤技术的研究显得越来越重要。针对电子邮件存在数据极度稀疏性、高特征维数和多重相关性等特点,本文提出了一种基于偏最小二乘原理的特征抽取方法,可以通过对原始特征进行线性组合抽取出既可反映邮件内容又可反映邮件类型的潜在语义特征,并可解决多重相关性问题。在Enron—Spare邮件数据集上的实验结果表明,同x^2特征选择方法相比,该方法在较低维数上可以获取良好的邮件过滤性能。
其他文献
本文基于实际汇率分解的视角来考察汇率对中美贸易平衡的影响。无论从基于局部均衡分析框架的弹性论,还是基于一般均衡分析框架的吸收论,以往的理论研究和经验研究在分析汇率
在含H2S的腐蚀环境中,可能发生多种形式的金属腐蚀,导致设备的破裂、泄漏甚至爆炸,造成巨大的经济损失和人员伤亡。而H2S腐蚀的微观反应过程尚不清楚,各种腐蚀机理还需验证。从理
相比其他三种风险,流动性风险的破坏性极强,处理不好甚至会引发整个金融系统的崩溃。随着资本市场的完善,未来金融脱媒趋势加强,我国商业银行面临的竞争压力会更大。我国商业
<正>新课程要求我们教师不仅做到教育"各因其才",还要做到发展"各尽其才",满足学生的多样化需求,使每个学生都学有所成,个性特长都得到充分发展。校本课程的
图书馆是各大高校进行科研、辅助教学的知识活动中心,是知识传承与创造的文化中心,是信息传递和共享的资源中心。伴随着科学技术的发展和人文意识的健全完善,图书馆受到“Web
在详细分析雷电灾害特征的基础上,阐述了防雷工作的主要技术手段。分析山西数字测震台站2012年-2013年雷击灾害的成因,针对测震台站的构成特点,研究了台站综合防雷系统的设计方
采用氩等离子体电弧熔炼(Ti0.9Zr0.1)1.1Cr2.0-xMx(M=Co、Fe,x=00.1)合金,并使用XRD、PCT、DSC研究了该系合金的相结构和吸放氢性能。研究结果表明,(Ti0.9Zr0.1)1.1Cr2.0-xMx(M=
近年来,随着经济与社会的国际化趋势,法学领域出现了法律发展的国际化与本土化之争。在对两者进行理论分析后,建议将法的国际化与本土化有机整合在一起,借鉴外来经验,发挥本
当前邮政金融业务市场竞争激烈,客户流失情况不容忽视,文章从业务发展费用、客户排队、服务态度、业务品种、科技投入等方面分析了客户流失的原因,探讨了避免客户流失的解决
通从狭义上来说,网络服务提供者的责任,是指其没有能够避免网络用户利用网络实施侵权行为而承担的不作为侵权责任。其属于过错责任,责任的基础是违反了安全保障义务。基于法