【摘 要】
:
由于传统的KNN算法需要针对不同的数据集选择不同的k值的缺陷,提出了两种自适应近邻值的检测算法。该算法以传统的KNN算法为基础,使用多个K值对数据进行多次分类,而后对多次
【机 构】
:
上海理工大学光电信息与计算机工程学院
论文部分内容阅读
由于传统的KNN算法需要针对不同的数据集选择不同的k值的缺陷,提出了两种自适应近邻值的检测算法。该算法以传统的KNN算法为基础,使用多个K值对数据进行多次分类,而后对多次分类结果进行统计,根据统计值来决定样本点的类归属。方法一为统计多次分类中每个类别所包含的近邻数目,将近邻数目最多的类作为样本点的归属类;方法二为统计多次分类中的归属类数目,将数目最多的作为样本点的归属类,两种方法可以避免每次设置K值的弊端。从实验结果可以看出,提出的算法得到的数据更加稳定,更具有代表性。
其他文献
通过对数据库技术与应用课程在电商专业学生培养中的地位和针对高职院校电子商务学生对数据 库学习的现状分析, 结合信息化时代工匠精神, 以数据库课程教学为例, 从教学重难
伴随信息社会与知识社会的来临,坚持人本管理已然变成企业管理的主要内容之一。人本管理思想成为企业成长的客观需求,成为企业管理工作人文化与科学化的主要表现之一。科学看
由国家档案局档案科学技术研究所、国家档案局技术部与有关技术公司联合完成的“录音录像档案数字化抢救技术研究”课题,针对数字化技术在录音录像档案抢救中的应用及科学化管
本文主要从祁门县退耕还林取得的成果、巩固退耕还林成果的重要性以及巩固退耕还林成果应采取的措施三个方面系统阐述如何巩固和加强祁门县退耕还林成果,为祁门县退耕还林政策
集约化管理和高密度养殖是现代商业化水产养殖的最大特点,该养殖模式在实现了养殖利润最大化的同时,也给水环境乃至于人们的健康造成了严重影响。氨盐、亚硝酸盐等氮素是存在
通过分析Candan算法和2N点DFT算法的性能,本文提出了一种改进的基于DFT的正弦信号频率估计算法。在对原始信号进行必要的离散化预处理后,在粗估计阶段利用Candan算法估计出频
慢性阻塞性肺疾病(COPD)是呼吸道的慢性病,气流受限持续性发展,虽然在我国常见多发,但是是可以预防和治疗的。近年来随着吸烟人群的扩大及人口老龄化加剧,空气污染、职业粉尘和
全球能源互联网发展合作组织的成立对建成全球能源互联网,推动世界能源的可持续发展具有重要的战略意义。而作为已经在国内外产业界趋于成熟的专利池制度,也可以在全球能源互
"大符拉迪沃斯托克"规划以其鲜明的区域优势成为俄罗斯东部开发战略的重要组成部分,它通过城市集群化、工业化和国际交通一体化的发展途径,实现在滨海边疆区南部建立一个面向亚
目的探讨新生SD大鼠脑发育与早期行为发育的关系.方法选取1、11、21日龄幼鼠,观察其自发运动,抑制性回避反应和生后精神行为发育情况,测定脑重和各脑区锌元素含量分布.结果新