混合型数据相关论文
针对混合型数据中周期性名义变量的观测之间的距离刻画样品间相似性的不足,提出了一种对周期性名义变量的观测进行量化处理的新方......
混合型数据集是既有离散型属性又有连续型属性的数据集。这类数据集在医疗,金融,自然现象等领域广泛存在,对它们的分类问题在现实生活......
Rodriguez和Laio在2014年提出的快速聚类算法(RL算法),由于可以识别任意形状的类簇,且不需设定最终聚类的个数k,而被广泛应用。因......
基于划分的方法是经典聚类方法之一,如何选择恰当的聚类个数和初始类中心是所有划分聚类方法初始化过程中必须面对的问题。尽管针......
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和......
在对混合型数据进行图模型的学习时,利用CG分布的假设会要求离散变量和连续变量处于不对称的位置,且连续变量的边缘分布为混合型正态......
混合型数据(同时包含离散数据和连续数据)在金融业,制造业,服务业等领域的应用日益广泛,如何有效的监控混合型数据成为人们关注的......
随着计算机技术的广泛应用,人类社会产生数据的速度急剧增加,大量有用信息被隐藏在海量数据中。数据挖掘则是人们提取这些信息,进......
在处理混合型大数据时,已有孤立点检测算法往往存在时间代价大、适用性差等问题.为了解决这一问题,本文基于最近邻思想提出了一个......
在现实世界中经常遇到混合数值属性和分类属性的数据,k-prototypes是聚类该类型数据的主要算法之一.针对现有混合属性聚类算法的不......
当前采用的混合型数据存储方法存在丢包率高、能耗高等问题,为了解决上述问题,提出了基于无线传感网络的混合型数据高效存储方法,......
提出了一种基于集成技术和谱聚类技术的混合数据聚类算法CBEST。它利用聚类集成技术产生混合数据间的相似性,这种相似性度量没有对......
依据支持向量机的基本理论,分析支持向量机方法在个人信用评估领域的适用性,使用这种方法处理含有混合型数据的个人信用评估实例,......
针对k-prototypes算法无法自动识别簇数以及无法发现任意形状的簇的问题,提出一种针对混合型数据的新方法:寻找密度峰值的聚类算法......
为了科学使用真实世界数据,探索适用于日益常见的混合型数据的聚类方法,文章分析和比较了两种典型的混合型数据聚类方法K-prototyp......
类别不平衡分类问题广泛存在于金融、生物医学、信息安全等诸多领域,在信用风险评估、疾病检测等实际应用中,类别不平衡数据通常是......
对于混合型数据(含定性和定量指标)的产品评估问题,虽有一些方法可以彩和,但在理论和计算上都比较复杂,不易为实际工作者应用。为了避免......
信息技术不断的进步,现实世界中需要处理的数据已由单一的数值型逐渐转变成由数值、文本、符号等类型构成的混合型数据。与现存大量......
聚类混合型数据,通常是依据样本属性类别的不同分别进行评价。但这种将样本属性划分到不同子空间中分别度量的方式,割裂了样本属性......
在问卷调查时,为获取更详细信息,收集的数据一般既有定性的又有定量的。如何对混合型数据的加以处理,建立适当模型,是问卷调查中的......
聚类分析作为一种无监督学习方法,是数据粒化以及信息压缩的一个基本工具,同时也是机器学习研究和数据挖掘应用中的一个重要内容。......
目的针对混合型缺失数据,使用几种填补方法在缺失填补中的应用并评价填补效果。方法结合实际数据,模拟出不同缺失比例(10%、20%、3......
聚类分析是数据挖掘中的一个重要研究领域,已被广泛应用于图像处理、信息检索和生物信息学等研究领域。目前,已有多种聚类算法被发......
聚类分析是一种无监督的学习方式,是数据挖掘的重要途径之一,也是统计机器学习、模式识别的重要研究方向之一.目前,针对数值型数据......
在许多应用中,很多数据集都具有数值型和分类型数据的混合特征,k-prototype是针对这类数据聚类的经典方法之一,该方法是一种基于k-mea......
数据缺失的存在是实际分析中经常出现的问题。然而大部分统计方法无法直接应用在不完整数据集上,这大大降低了统计学的应用价值。......
学位
给出了一种新的处理海量数据的聚类算法WIDE(window-density clustering algorithm).它通过网格方法将数据之间的相互关联局部化,......
孤立点检测作为一种重要的数据挖掘方法,旨在发现数据集中偏离多数模式的异常情况,在制造业、金融业、网络安全甚至医疗领域都有着......
通航机场选址关系通航机场建设,更影响通用航空的生存与发展.从通用航空特点出发,遵循科学规律及行业规范,构建通用航空机场选址评......
传统K-modes算法在分类属性聚类中有着广泛的应用,但是传统算法并不区分有序分类属性与无序分类属性。在区分这两种属性的基础上,......
K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象。传统的K-prototypes聚类算法在计算数据对......
针对传统K-prototypes在计算分类属性的差异度时未考虑各个分类属性对聚类结果的影响程度,且算法容易受到噪声的干扰,无法处理数据中......