基于Hubness与类加权的k最近邻分类算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:zl6273008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对高维不平衡数据中维数灾难和类不平衡分布问题,提出一种改进k最近邻(kNN)分类算法HWNN。将样本的k发生分布作为其在预测时对各个类的支持度,以此减少高维数据中hubs对kNN分类带来的潜在负面影响。通过类加权的方式増加少数类在所有样本k发生中的分布比例,以提升对少数类样本的预测精度。在16个不平衡UCI数据集上的实验结果表明,该算法在高维不平衡数据中的分类结果优于典型kNN方法,且在普通维度的不平衡数据中优势同样明显。
其他文献
在建筑结构设计中的弹性基板的计算一般采用有限元法或图表法.在理论上没有一般性的解析表达式.本文由边界积分法给出了一般封闭解析解的表达式.作为算例,求解了有六个点作用
文章主要是从就业导向的角度出发,并就当前我国中职院校会计专业教学改革过程中存在的问题进行了深入地剖析,进一步深入探索了中职院校会计专业教学改革的有效对策。
给出了弱均衡NTU对策,且证明了弱均衡NTU对策具有非空的核心.
IPSec协议体系是IETF制定的新一代网络安全协议标准,该文深入剖析了IPSec在自由操作系统下的实现方式,针对IPv4协议栈和IPv6协议栈提出了不同的实现方案,并提供这两种方案下的测
作为当代资本市场的重要组成部分,证券分析师相比于广大普通投资者具有更加专业的分析能力,在收集、分析和传播上市公司信息方面起到了极其重要的作用。在美国《机构投资者》
本文对2001—2011年在学术期刊上所发表的体育与健康课程改革研究论文进行了分析。分析包括教学内容、学习评价、师生关系、课外体育活动、信息技术整合五个方面。通过分析,本
我国水资源短缺严重,工业及城市用水严重不足,农业用水低效率导致的水资源浪费进一步加剧供需矛盾。我国于2005年开始探索建立水权市场,实现水权有价转让,以期通过市场机制优
由于商誉的不可辨认性和不确定性,其一直以来都是会计界争论较多,处理较难的学术论题。自创商誉作为商誉问题中的难点与重点,其处理更是难上加难。随着经济的发展和会计环境的变
[摘 要] 党的十六届五中全会提出要建设社会主义新农村,同时要促进城镇化的健康发展。本文论述了城镇化发展对社会主义新农村建设的带动作用,并提出,为加快城镇化进程,服务于建设社会主义新农村,应采取加强科学规划、走新型工业化发展的道路、消除不利于城镇化发展的体制和政策障碍、重视对农民的培训教育等四项具体对策。  [关键词] 城镇化 建设社会主义新农村 带动作用 对策
结构胶在汽车车身中使用可提高车身性能,包括提高车身刚度、防撞性能、车身NVH性能、焊接性能等,同时可以减轻车身重量级降低整车成本。本文介绍了结构胶在汽车行业及某主机厂