基于密度峰值聚类的自适应欠采样方法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:wild_lynx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于K-means聚类的欠采样存在仅适用于超球形状数据、未考虑重叠区对分类的影响及簇中样本的稠密程度等问题.因此,文中提出基于密度峰值聚类的自适应欠采样方法.首先利用近邻搜索算法识别重叠区的多数类样本并将其删除.然后应用改进的密度峰值聚类自动获得多个不同形状、大小和密度的子簇.再根据子簇中样本的稠密程度计算采样权重并进行欠采样,在获得的平衡数据集上进行bagging集成分类.实验表明,文中方法在大多数数据集上性能表现较优.
其他文献
北京世纪奥科生物技术有限公司成立于2007年11月,于同年创建国家标准物质网站,依托该网站平台,专业从事标准物质产品销售和技术服务,是国内较大的标准物质提供商之一。
应用地质异常致矿、控矿理论和GIS空间结构分析方法,探讨胶东金矿集区的地质异常控制,主要进行了线、面及组合地质异常结构及其与金成矿的时空耦合关系。分析研究结果表明,该
本文从康德对"启蒙"概念的界定出发,讨论了"理性"在近代德国哲学中的基本用法和演变轨迹。在康德那里,理性与知性之间存在区分,启蒙被视为知识的进步和知性的运用。黑格尔批
当前,随着我国城市化的快速推进,基础设施也在不断发展和完善中,排水工程有着基础性的作用,在实际中和人们的生活息息相关,影响着人们的生活和生产,并且随着人们的意识不断提
按照市政工程监理工作的实际需要,文章阐述了当前市政工程监理中存在的一些问题,并提出了一些对策,以全面推进我国市政工程施工监理工作,充分保证市政工程的整体质量,希望本文的分
2015年11月18日,河南省项城市商品混凝土和混凝土预制构件质量问题治理工作会议在市党政综合楼召开。各镇办分管副职,市住建局、市交警队有关负责人以及项城市商品混凝土生产企
随着人们环保意识的增强和经济的快速发展,人们对自身居住的环境提出更高要求。生态城市的概念已经深入人心,城市生态建设是城市的核心,是城市未来得以持续发展的前提,生态城市规