一种改进的文本分类算法

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:miumiumin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类技术是文本挖掘技术中的研究热点之一,但是传统KNN分类算法的时间复杂度高,在不均匀密度样本下分类准确率低.针对这些问题,提出一种在不均匀密度样本下的优化KNN算法:IKNN算法.首先选取样本分类不均匀的训练样本,并对其中高密度样本做出相应的裁剪,以提高准确率.然后在此基础上,针对裁剪后的训练样本使用投影寻踪理论,选取更小的、更具代表性的样本库,以降低分类算法的时间复杂度.在此理论基础上,通过实验表明,在大量的训练样本下,与经典KNN算法相比,IKNN算法具有更高的效率和准确率.
其他文献
针对风场干扰下高空飞艇的定点驻留控制问题,阐述如何利用系统状态估计值和特征模型对飞艇进行控制器设计。首先,在平流层飞艇受力分析的基础上,建立了数学模型;然后设计了扩
天气雷达以使用相同参数标定的晴空标准地物回波强度为参考,和实时采集的回波强度进行对比分析,在实现回波强度数据质量检测的同时完成对其校正,对比参考地物及实际回波强度间误
目的:探讨中医调理应用于慢性胃溃疡的价值。方法:以我院收治的104例慢性胃溃疡患者为研究对象,随机分为对照组(n=52)和研究组(n=52),两组采用同样的治疗方法,对照组给予常规
2011年以来,柳州市柳南区通过“公司+基地+农户”的模式,扶持龙头企业,建设蛋鸡养殖小区,完善水、电、路等基础设施,截至2018年,蛋鸡养殖规模已经达到100万只。随着蛋鸡养殖
【正】 世界上最早完成团身后空翻三周(以下简称“后三周”)是苏联技巧运动员本德列尔。他在1974年全苏冠军赛及当年的第一届世界技巧锦标赛上都完成了这个动作。以后,在历届
文中介绍了遗传算法以及遗传算法在水声宽带换能器匹配中的优化设计,本实验在基于实频法设计上尝试采用了具有并行性和全局搜索性的遗传算法优化。水声换能器采用ZT40-16,匹配后得到的器件匹配参数通过实验测试。最后实验表明,虽然匹配后阻抗没有很明显变化,但相位却变化巨大,未加匹配前相位角度的变化范围从-90°至-30°之间,而加了匹配之后变化的范围变小,尤其在20~60 k Hz之间这段变化范围仅从-1
本文提出了一种基于具有高阶消失矩的IIR正交小波构造方法.从小波的正交性和正则性条件出发,可以得到一些约束IIR滤波器组的条件,并且探讨约束滤波器系数及其零极点的关系.依
以信号处理中非递归型Finite Impulse Response(FIR)滤波器作为研究对象,针对硬件电路设计中存在的面积、功耗和计算性能的问题,通过利用CatapultC高层次综合工具先优化单个FIR滤
根据AES算法的特点,从3方面对算法硬件实现进行改进:列混合部分使用查找表代替矩阵变换,降低算法实现的运算复杂度,采用流水线结构优化关键路径-密钥拓展,提升加密速度,利用F
【正】 关于运动时体内胰岛素的动态,从现有的材料看,运动时血液的胰岛素水平变化很少,大概它与运动时的代谢很少有直接关系。但是,我们提出“运动与胰岛素”这个题目的目的