结构化集成学习垃圾邮件过滤

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:xingzhe009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决垃圾邮件过滤算法低计算复杂度与高分类准确率之间的矛盾,在多域学习框架下提出一种结构化集成学习思想,它根据文档结构组合多个基分类器的结果以追求更高分类性能.采用邮件文档的字符串特征生成多个轻量基分类器,并采用字符串-频率索引存储标注数据,使得每次更新和查询的时间开销是常数量级.根据邮件文档的多域结构特性,提出历史域分类器效力线性组合权和当前域文档分类能力线性组合权.综合考虑历史域分类器效力和当前域文档分类能力,还提出一种能够提高整体分类准确率的综合线性组合权.在TREC立即全反馈垃圾邮件过滤任务上的
其他文献
城市化进程伴随着大规模的圈地,这是转型期中国所必需经历的一个阶段。在这一背景下,是上千万务农无地、上班无岗、低保无份的"三无"农民生计维艰的隐忧。失地农民权益保障成
冬季湖面冰冻是一种常见的自然现象.受这一自然现象启发,提出了一种新的智能并行算法——湖水能量优化算法,并应用该算法解决旅行商问题.湖水能量优化算法模拟湖水降温时湖面的冰
期刊
李未教授提出了R-演算系统,它是形式理论的修正演算系统,是OPEN过程模式和GUINA过程模式的基础.R-演算在这2种过程模式中的核心作用是,当一个形式理论与事实产生矛盾时,找出
在治疗肝硬化、肝腹水等慢性肝病方面,可以说目前西医尚无良好的疗法,多采用输白蛋白、打利尿针等保肝药物治疗,虽能暂时解除病人痛苦,但治标不治本,容易反复,而且价格也昂贵,使得多
skyline查询能够从大规模数据集上计算满足多个标准的最优点.数据流上的skyline计算是数据流上最基本的查询操作之一,对于很多在线应用具有非常重要的意义,尤其在移动计算环
在福建,阮培金是个“名代表”。7年前,《人民政坛》长篇通讯《“专职代表”阮培金》使他扬名八闽,7年来,他从镇人大代表一直干到“省人大代表”。读者也一定通过各种渠道听说了这
2006年1月25日,也就是狗年春节的前几天,一度在政和县城闹得沸沸扬扬的“3.17”案件终于息访了。在我心头压了三个多月的大石终于放下了,我的努力总算没有白费。这个案件要是不息
期刊
针对军用光电器材封存包装特点和应急保障需求,研制了军用光电器材制充氮封存包装一体化设备。介绍了制氮原理、工艺流程以及设备组成、功能特点等。大量的实践应用表明:设备运
今年,中华环保世纪行闽清活动,围绕“珍惜资源,推进节约型社会建设”这一主题,继续瞄准梅溪流域综合治理,通过动员部署,检查采访,跟踪督查,媒体曝光,部分试点企业治污经验推广等,促进梅