自然最近邻相关论文
密度峰值聚类算法的局部密度定义未考虑密度分布不均数据类簇间的样本密度差异影响,易导致误选类簇中心;其分配策略依据欧氏距离通......
对于基于划分的聚类算法随机选取初始聚类中心导致初始中心敏感,聚类结果不稳定、集群效率低等问题,提出一种基于MapReduce框架和......
离群检测是帮助人们在繁多复杂的信息中准确而快速地获取具有显著异常特征信息的数据挖掘方法。其在互联网、通信、金融、医学、地......
在各学科领域及实际应用中,存在着大量的分类问题。随着信息技术的迅猛发展,人们面临着急速增长的数据量,然而人们迫切地希望从已......
在信息技术飞速发展的带动下,机器学习领域中的半监督学习自从产生便不断发展壮大,在丰富了数据挖掘、统计研究等相关领域的同时,......
推荐系统或推荐引擎(Recommender System)作为信息时代一种有效解决互联网信息过载(Information overload)问题和向用户进行推荐的......
随着物联网、电子商务和社会化网络在全世界范围内的快速普及,全世界数据的储量呈爆发式地增长,世界正在向数字化世界转变。数据挖......
随着外部环境的深刻变革,高校图书馆的服务模式正由以资源建设为中心向以读者服务为中心进行转变,个性化主动服务得到发展。个性化......
针对DPC(密度峰值聚类)算法参数敏感以及簇边界模糊数据分配欠合理问题,提出一种结合自然最近邻和隶属度函数的密度峰值聚类算法.......
基于快速搜索和寻找密度峰值聚类算法(DPC)具有无需迭代且需要较少参数的优点,但其仍然存在一些缺点:需要人为选取截断距离参数;在......
任何涉及k近邻求解问题的算法被应用于处理不同特征的数据集时,参数k值的选择都会明显影响算法的性能和结果.因而,如何选择k近邻算......
针对现有过采样方法存在的易引入噪声点、合成样本重叠的问题,提出一种基于自然最近邻的不平衡数据过采样方法。确定少数类样本的......
传统谱聚类算法经常在处理一些结构复杂的数据集时效果不太理想,并且其相似度矩阵构造时参数的选取往往需要依靠多次实验及个人经......
数据挖掘就是在大量的数据中探索出有价值的模式、规则和规律的过程,即从海量无规律的数据集中提取出可理解的、之前人们并不清楚的......
在实际应用中,近邻技术具有简单、快速、高效的特点,受到研究人员的青睐.近来自然最近邻被提出并应用到离群检测和聚类中,鉴于自然......
鞋底花纹图像是犯罪现场遗留率较高的物证之一,对于大量的鞋底花纹图像,采用聚类算法构建数据集以实现自动管理可以提高案件的侦破......
谱聚类算法是基于谱图划分理论的一种聚类算法,由于其对非凸数据集具有优越的性能而广受欢迎。因为谱聚类算法中的相似图构造的好......
谱聚类算法作为一种有效的聚类分析方法,理论基础可靠,聚类性能良好,已在文本分析、语音分析、机器视觉以及图像分割等领域成功应......
在数据挖掘领域中,k最近邻域是一个最基本的并被广泛采用的邻域概念,它是由离数据对象最近的k个点所形成的一个局部数据子集。国内外......