一种基于信息增益的K—NN改进算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:lsylianyangdeyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统K—NN算法易受单个属性干扰和时间效率较低的问题,提出了利用信息增益和可拓关联度对其进行改进。通过计算属性的信息增益来确定属性的权重系数,根据权重系数将属性划分为关键属性、次要属性和无关属性,在计算欧氏距离时引入权重系数,使各个属性的作用受其重要性的约束,有效地提高了K—NN算法的抗干扰能力和精确性。将属性空间划分为若干个子空间,利用可拓关联度将待测样本映射到某个子空间中,由这个子空间组成搜索空间,减少计算量,提高时间效率;测试结果表明,改进后的算法可行有效。
其他文献
为解决在多跳环境下蓝牙设备之间动态组建散列网存在的问题,利用对生物的群体性行为研究得出的集群智能聚类模型的自组织特点.提出了一种新型组网算法BBSF(Based on Bionics Sca
目的:分析肿瘤患者术中给药错误的原因并探讨解决的方法。方法:对34起手术室给药错误事件进行回顾性分析。结果:在给药错误发生的手术级别中,三级手术占58.8%,四级手术占35.3%;在给药错
对于频繁项集挖掘,采用一种FP-数组技术来减少FP—tree的遍历时间,减少数据集的扫描次数,在此基础上提出了一种基于FP—tree进行频繁项集挖掘的FP—growth+算法,提高了算法的效率
产品成本关系着企业的生存和发展,降低成本是企业持续追求的目标。生产成本控制的实施,是有效降低产品成本的一场变革。其特点是从工序过程中人的行为开始就控制成本,增强执行过
目的:初步观察重组人p53腺病毒注射液(recombinant adenovirus-p53,rAd-p53)治疗肝癌临床疗效,和治疗前后血清p53蛋白的变化及其临床意义。方法:对38例原发性肝癌患者,采用瘤
周期任务与非周期任务的混合调度是实时调度研究的一个重要方向。针对现代嵌入式实时系统的任务特性,和经典实时调度算法只调度周期任务的特点,提出一种新的静态优先级调度算法
在实际应用中由于规则网格DEM的数据量大而不便存储,而且某些分析计算也经常需要使用TIN模型的DEM,需要将网格DEM转成TIN模型的DEM。采用迭代搜索算法将网格转化为DTIN。在DTIN
介绍了H9110不饱和聚酯亚胺无溶剂浸渍漆的老化试验、常态电老化试验和热电老化试验,并以其在高压电机少胶VPI绝缘结构和低压散嵌绕组电机上的实际应用为例,提出高、低压电机通
信号处理方法是最常用的时间序列消噪方法。但由于这种方法仅考虑了频率因素,因此会损失某些有用的突变信息。同时虑波器本身及其参数的选择也较复杂。针对以上不足,提出了基于
针对高压输电线路红外图像的特点提出一种基于直方图包络曲线的图像边缘检测新算法。为了抑制红外图像中噪声的影响,利用Savitzky-Golay(S-G)滤波器求取灰度直方图的包络曲线来平滑噪声,根据包络曲线的极值点对红外图像进行边缘提取。实验结果表明,该方法简单有效、定位精度高、优于传统的几种边缘提取算子。