基于区域划分的KNN文本快速分类算法研究

被引量 : 0次 | 上传用户:sxiaohui8709252
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
kNN算法是一种简单、有效和非参数的分类方法。但是,kNN算法需要计算测试样本与每个训练样本的距离并比较大小,算法的效率较低。为了有效提高kNN算法执行效率,本文提出一种基于区域划分的kNN文本快速分类算法,该方法将训练样本集按空间分布情况划分成若干区域,通过各区域与测试样本之间的距离关系来建立初级分类器。利用初级分类器裁剪训练样本并快速查找测试样本的新训练集。在新训练集上使用kNN分类器对测试样本进行类别判定,减少了kNN分类器的计算量,有效提高了kNN分类算法的效率。文章着重讨论了网格划分方法、划分聚类划分方法、等半径球形划分方法和等样本球形划分方法这几种有效的区域划分方法。在这些划分方法的基础上建立了网格区域初级分类器模型和球形区域初级分类器模型,并针对这两类初级分类器模型提出了相应的kNN改进算法。数学推理和实验结果均表明,该算法在确保kNN分类器准确率不变的前提下,显著提高了分类效率。
其他文献
我叫牛天海,是兖矿集团唐村实业公司采煤工区的一名生产班组长。目前,全班现有职工78人,是采煤工区最大的一个生产班组。作为煤矿企业的一名“小官儿”,我认为,班组长应采取大伙乐
经济发展阶段变化所引起的增长方式转变的内在需要,以及人均收入水平提高所引起的对环境质量的更高要求,是节能减排政策能否实现与地方政府的发展动机及企业行为激励相容,从
国有企业相比非国有企业具有更低的效率和效益,信贷资金过多地投放给国有企业意味着资金配置低效率。那么,什么因素影响银行信贷决策?针对1996—2004年国有工业企业和"三资"
本文从研究新时期海防管理形势的变化入手,指出了山东省海防管理机制存在的现实问题,然后以跨部门合作、整体性政府及组织间网络等理论为基础,借鉴了已有的政府部门协调机制
随着联合国气候大会的多次召开,节能减排成为当今经济发展的重要课题,木材可将大气中的CO2固定,将木材作为木建筑、木制品等能够延缓排放CO2的时间,从而实现的低碳环保节的目
简论系统教学设计的十大特色盛群力刘善存俞鸣人傅金潮当素质教育的观念逐渐深入人心、由理论探讨转向政府行为和教师的自觉实践时,我们进一步认识到提高课堂教学效益的必要
目的:本研究欲通过闪光视觉诱发电位(flash visual evoked potentials,FVEP)无创颅内压(Intracranial pressure,ICP)监测与头颅CT进行比较,评价其在神经外科颅脑损伤疾病中颅内
<正>近年来,巴西农药销售量和销售额持续增长,位居全球农药市场前列。据估计,2014年巴西农药销售额同比增加6%,总额达122亿美元。然而,2014年农药公司的利润缩减,竞争力削弱,
文章以结构效应为问题分析的视角,从国防工业的技术结构、行业结构和部门结构耦合质量三个方面剖析国防工业提高经济效益实现跨越发展的机理,并提出了相应的建议。
目的:研发一种安全、有效、便携式用于乳腺增生症的医用治疗器。方法:采用棉布等无害原材料,参考健康女性胸围,参照女性常用胸罩,对罩杯部位进行特殊设计,便于药疗、热疗及磁疗所