基于KNN的不良文本过滤方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户：fjyasp

【摘要】

：

不良文本过滤是当前的一个研究热点。通过对χ2统计量的具体分析,证明χ2统计量在2类文本特征项提取过程中特有的优势。提出正面文本阈值δ,并从理论上推断出该值的大小。在

【作者】

：

王洪彬刘晓洁

【机构】

：

四川大学计算机学院

【出处】

：

计算机工程

【发表日期】

：

2009年24期

【关键词】

：

KNN算法不良文本过滤 χ2统计量 K-Nearest Neighbor（KNN） algorithm reactionary text filtering

【基金项目】

：

国家自然科学基金资助项目（60573130 60502011）, 国家“863”计划基金资助项目（2006AA01Z435）, 教育部新世纪优秀人才计划基金资助项目（NCET-04-0870）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

不良文本过滤是当前的一个研究热点。通过对χ2统计量的具体分析,证明χ2统计量在2类文本特征项提取过程中特有的优势。提出正面文本阈值δ,并从理论上推断出该值的大小。在此基础上改进KNN算法,消除了KNN算法中N的不确定性,彻底实现了无参性,大幅减少了分类所用的时间。实验证明,该算法符合Web实时在线分类的要求。

其他文献

基于生本理念的小学数学高效课堂的构建

摘要：在课程改革的时代背景下，如今的小学教学提倡以人為本的教育模式。这一模式提倡生本教育理念，鼓励去激发学生的学习热情，突出学生的课堂主体地位。生本理念指的是以学生为本。生本理念扭转了传统教学模式，课堂教学从以往的以教师为中心转变为以学生为中心，突出了学生的课堂主体地位，让学生最大限度地发挥学习潜能，切实提高教学效率，有利于学生的成长。　　关键词：以生为本;小学数学;高效课堂　　中图分类号：G6

期刊

以生为本小学数学高效课堂

基于模型检查技术的信息系统生存性研究

在运用Jha方法进行信息系统生存性研究时，没有分析不同攻击场景与系统节点失效之间的关联性，也未考虑系统提供多个服务情形下的生存性分析。针对上述问题，提出运用模型检查技术

期刊

信息系统生存性分析模型检查information system survivability analysis Model Checking（MC）

双齿围沙蚕全人工育苗与精养技术研究

为探索双齿围沙蚕全人工养殖技术,于2014-2016年在温岭市长新塘开展了双齿围沙蚕全人工育苗与精养技术研究试验。试验用于亲体蓄养、苗种繁育的水泥池11口,面积共660 m~2,催

期刊

双齿围沙蚕全人工育苗精养技术

信息技术模式下对“六轴本体”的一体化教学探讨

新时代背景下的信息技术给职业学校的实践教学改革带来了促进作用,分析了新时期实践教学内涵与新要求,探索通过改革,采用一体化课程模式,培养学生的实践操作和综合职业能力。

期刊

信息技术六轴本体一体化教学明确任务过程控制

一种弱硬实时约束规范（m,p^1）

当弱硬实时系统约束规范中μ-patterns首个字符为0时,弱硬实时约束规范（m,p）就失去作用。针对该问题,通过改变截止期满足率的计算方法,提出一个弱硬实时约束规范（m,p^1）,在保持（m,

期刊

约束规范严格性比较弱硬实时系统偏序关系constrain specification strict comparison weakly hard rea

川崎病分期辨治

期刊

川崎病急性期恢复期辨证论治

基于多尺度脊波字典的图像去噪算法

基于人眼视觉系统特性,根据图像几何结构特征,提出一种多尺度脊波字典的构造方法。构造出的多尺度脊波字典具有多分辨率、多尺度、各向异性和多方向等特性,能够更为稀疏地表示图像,从而得到一种基于多尺度脊波字典的稀疏性约束图像去噪算法。实验结果表明,该去噪算法能有效去除噪声,更好地保留图像的边缘等细节。

期刊

稀疏表示脊波图像去噪匹配追踪sparse representation ridgelet image denoising matching pursui

“永、久、黄”创始人范旭东

期刊

侯德榜实业部中外合资卜内门公司创始人

境内外银行进入对西北地区银行业市场的影响分析

当今世界,经济一体化、贸易自由化的趋势越来越明显,并且随着2001年我国成功的加入WTO,国内的境内外金融机构也进入了一个快速发展的时期。伴随而来的是金融机构西进步伐的加

学位

外资银行外埠银行市场结构市场绩效

WTO效应：开放促改革、促发展（下）——中国入世四周年盘点

5产业开放新动向作为建设中国特色社会主义的伟大实践之一,改革开放27年来,对外开放从无到有,从小到大,领域不断拓宽,地域不断扩大,方式不断多样,结构不断优化,水平不断提高.

期刊

WTO效应中国入世中国特色社会主义党的执政能力建设2004年9月盘点对外开放水平产业开放伟大实践改革开放中共中央主动权新任务地域忠诚

基于KNN的不良文本过滤方法

与本文相关的学术论文