一种基于密度的改进KNN文本分类算法

来源 :漳州师范学院学报:自然科学版 | 被引量 : 0次 | 上传用户:yushu522216869
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KNN算法是一种应用广泛的人工智能算法,在文本分类应用中,简单有效,易于实现.但是,KNN分类的时间复杂度与训练样本数量成正比,而且,训练样本分布密度的不均匀性将导致分类准确性的下降.本文在KNN算法的基础上,提出一种改进算法.算法分析了训练样本的分布密度,通过裁减高密度区域训练样本,降低样本数量,调节训练样本分布,达到提高分类准确性的目的.实验证明,基于密度的改进KNN文本分类算法在降低时间复杂度的同时,还具有较好的准确率和召回率.
其他文献
图像分割技术在PCB自动光学检测中应用广泛.K-means聚类算法简单有效,能实现PCB灰度图像的自动分割.然而,随机选取的初始聚类中心易导致K-means算法最终找到的是局部最优值,对PCB图像分割效果有一定影响.引入PSO算法的群智能搜索策略,提出一种新的寻找聚类中心的算法.实验表明,在PCB图像分割中使用该算法可防止陷入局部最优值.
本文对Petri网的基础知识作了相关的介绍,以及对Petri网的结构性质进行一定的介绍与分析,其中主要介绍的结构性质是可重复向量和死锁,并适当的通过举例来说明问题.根据Petri
随着能源危机和粮食危机问题日益突出,世界能源发展正步入一个崭新的时期,即世界能源结构正在经历由化石能源为主向可再生能源为主的变革。燃料乙醇因被当作最佳液体替代燃料并
距离测度是度量两个直觉模糊集的重要方法,在聚类分析中被广泛应用.本文基于相异度矩阵的思想,在直觉模糊多属性聚类中,定义了距离测度矩阵,然后根据不同的阚值要求转化为布尔矩阵
谷胱甘肽(GSH)在啤酒中具有抗老化作用,选育高产谷胱甘肽的啤酒酵母菌株有助于改善啤酒抗老化性能。以啤酒酵母S5为出发菌株,经紫外诱变和硫酸二乙酯(DES)诱变后,获得突变株SC67,其GS
对于给定的图H,称π是蕴含H可图的,如果π有一个实现包含H作为子图.K k,C k,Pk分别表示k阶完全图,圈长为k的圈和路长为k的路.本文刻划了当n≥6时,蕴含(K 4-e)+K3的可图序列,其中
采用滴涂法制备了分子筛修饰玻碳电极(SBA-15/GCE),然后采用滴涂法将血红蛋白(Hb)修饰到SBA-15/GCE表面构建了一种新型的生物传感器(Hb/SBA-15/GCE).采用循环伏安法和电化学阻抗法对电极
设计了一种基于物联网的嵌入式无线智能家居系统.构建了以ARM S3C6410及CC2530 ZigBee芯片为硬件平台、Linux为操作系统的智能家居网关.通过ZigBee自组网的形式,实现ZigBee各
在耳声发射的测试过程中,其耳声发射信号判别时的实时性和准确率一直是OAEs测试研究中的重要课题,对于实时性要求较高的嵌入式测试系统更是如此.本文对OAEs信号判别算法进行了研
园区网络设计的目标主要是为用户提供尽可能高的带宽、高可用性、冗余性、扩展性和弹性等.而构成园区网络的以太网拓扑结构虽然简单,但存在可靠性差,单点故障等,一旦因故障产