基于KNN的不良文本过滤方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:fjyasp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不良文本过滤是当前的一个研究热点。通过对χ2统计量的具体分析,证明χ2统计量在2类文本特征项提取过程中特有的优势。提出正面文本阈值δ,并从理论上推断出该值的大小。在此基础上改进KNN算法,消除了KNN算法中N的不确定性,彻底实现了无参性,大幅减少了分类所用的时间。实验证明,该算法符合Web实时在线分类的要求。
其他文献
摘 要:在课程改革的时代背景下,如今的小学教学提倡以人為本的教育模式。这一模式提倡生本教育理念,鼓励去激发学生的学习热情,突出学生的课堂主体地位。生本理念指的是以学生为本。生本理念扭转了传统教学模式,课堂教学从以往的以教师为中心转变为以学生为中心,突出了学生的课堂主体地位,让学生最大限度地发挥学习潜能,切实提高教学效率,有利于学生的成长。  关键词:以生为本;小学数学;高效课堂  中图分类号:G6
在运用Jha方法进行信息系统生存性研究时,没有分析不同攻击场景与系统节点失效之间的关联性,也未考虑系统提供多个服务情形下的生存性分析。针对上述问题,提出运用模型检查技术
为探索双齿围沙蚕全人工养殖技术,于2014-2016年在温岭市长新塘开展了双齿围沙蚕全人工育苗与精养技术研究试验。试验用于亲体蓄养、苗种繁育的水泥池11口,面积共660 m~2,催
新时代背景下的信息技术给职业学校的实践教学改革带来了促进作用,分析了新时期实践教学内涵与新要求,探索通过改革,采用一体化课程模式,培养学生的实践操作和综合职业能力。
当弱硬实时系统约束规范中μ-patterns首个字符为0时,弱硬实时约束规范(m,p)就失去作用。针对该问题,通过改变截止期满足率的计算方法,提出一个弱硬实时约束规范(m,p^1),在保持(m,
基于人眼视觉系统特性,根据图像几何结构特征,提出一种多尺度脊波字典的构造方法。构造出的多尺度脊波字典具有多分辨率、多尺度、各向异性和多方向等特性,能够更为稀疏地表示图像,从而得到一种基于多尺度脊波字典的稀疏性约束图像去噪算法。实验结果表明,该去噪算法能有效去除噪声,更好地保留图像的边缘等细节。
当今世界,经济一体化、贸易自由化的趋势越来越明显,并且随着2001年我国成功的加入WTO,国内的境内外金融机构也进入了一个快速发展的时期。伴随而来的是金融机构西进步伐的加
5产业开放新动向作为建设中国特色社会主义的伟大实践之一,改革开放27年来,对外开放从无到有,从小到大,领域不断拓宽,地域不断扩大,方式不断多样,结构不断优化,水平不断提高.