高维数据集相关论文
高维数据集引起的“维数灾难”问题不仅增加了计算内存和运行时间,而且会导致学习器分类性能的下降。而特征选择技术通过排除冗余......
伴随着当下信息时代的高速发展,大数据相关的应用成为了业界关注的焦点,通过数据驱动经济发展已成为全球许多强国的战略计划之一。然......
随着Skyline查询在多标准决策、数据挖掘、用户偏好查询、数据库可视化等领域的广泛应用,国内外学者已经提出了多种Skyline算法,但由......
随着社会经济的高速发展,人们对环境舒适度要求越来越高,尤其大型工矿企业,嘈杂环境声严重影响工作人员的身心健康,同时也严重影响......
近年来,随着科学技术的进步,数据收集与数据存储的能力也得到了进一步的发展,从而使人们可以获取海量数据,如何从海量的数据中寻找......
挖掘数据中蕴含的因果关系是自然科学研究的一个基本问题.近年来,尽管很多研究者致力于从可观测数据中寻找其中可能存在的因果关系......
基于高维数据往往属于几个低维子空间的并的事实,子空间聚类就是一种揭示高维数据的潜在低维结构的方法。对于给定的一个来自高维空......
贝叶斯网络(Bayesian network,BN)是一种基于概率论和图论的相关知识而提出的图模型。它可以利用图的直观性将随机变量间复杂的关......
采用激光拉曼光谱技术对变压器油纸绝缘老化状态检测是一种有效的方法。随着样本量的扩充,亟待处理的数据集维度逐渐增大,研究适用......
针对目前聚类算法没有充分地利用输入知识,不便于知识的学习和增长的情形,提出在高维数据集的情况下,恰当地利用输入知识可以更准确有......
提出了一种基于马尔可夫链的离群点检测(outlier detection algorithms based on Markov chain,MRKFOD)算法。该算法把基本数据集看......
离群数据就是相对于大量常规数据而表现出异常数据模式的数据点。许多数据挖掘方法致力于减少离群数据的影响或者将它们彻底清除,这......
现有的k-支配轮廓算法虽然可以对给定的高维数据集计算出不同k(k≤d)值对应的k-支配轮廓,但是,由于不能共享计算结果,会导致很多冗余操......
针对数据挖掘中高维数据多分类问题,提出了一种基于二分K均值的SVM决策树的高维数据分类方法.该方法先利用二分K-均值将高维数据基......
传统的H-K聚类算法将层次聚类算法和k-means聚类算法有机结合起来,从而使得H-K聚类算法具有单个聚类算法所不具有的诸多优点。为了......
在数据集中,离群点是指那些相对于大量常规数据异常孤立的数据模式。在很多情况下离群点被认为是噪声而抛弃,但在实际应用中我们发......
针对高维数据集,采用局部稀疏差异和局部密度差异的度量因子,给出一种相关子空间中的局部离群数据挖掘算法.该算法根据K最近邻(K-N......
针对统计最优样本大小算法在确定大数据集,尤其是高维数据集抽样样本大小时的执行效率较低,以及高维数据集中每一维属性的重要性不......
期刊
面向高维数据的聚类分析是当今数据挖掘研究的重要领域,其中的关键问题在于如何对高维数据的聚类结果进行高效率的可视化分析。针......