样本密度相关论文
分类是数据挖掘领域中一个重要的分支,普通的分类模型通常假设数据集中各类别的样本数量差距很小且对于每个类别的误分代价相等,而......
河床地形是有关河流水环境管理、航道整治、生态保护等研究的重要基础数据,空间插值方法是生成河床地形的主要方法之一.为更好地比......
此文用几种不同的密度推定法,对测线调查样本进行密度推定。把5种密度推定法用于计算机模拟产生测线调查的距离数据,由统计量RRMSE和......
考虑用最大似然法和核函数法对于测线调查样本的密度推定,选用四个核函数、三个最佳带幅宽;分别用两个探知函数生成计算机模拟数据......
针对模糊C均值(FCM)聚类算法在图像分割中存在的对初始类中心敏感且迭代过程中计算量大的问题,提出了一种改进的算法。先通过精简......
针对不均衡数据下分类超平面偏移、少数类识别率较低的问题,提出一种基于样本密度的不均衡数据分类算法。该算法首先计算样本密度和......
KNN是基于实例的算法,训练样本的数量影响KNN的分类性能.合理的样本剪裁可以提高分类器的效率.提出了一种聚类条件下基于密度的KNN......
为有效解决传统K-means 聚类算法在处理大规模数据集时面临的扩展性问题,提出了一种Hadoop K-means 聚类算法. 该算法首先根据样本......
从聚类中心的直观属性出发,选取样本中密度较大的点作为FCM算法的初始聚类中心。解决了FCM算法对初始值敏感、收敛结果容易陷入局......
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出一种新改进的SVM(IMSVM)不平衡数据集分类算法。该算法先计算每个样本在距......
提出了一种基于聚类和密度的KNN分类器训练样本约减方法。使用KNN分类器进行文本分类的时侯,由于训练样本在类别内分布的不均匀,会......
针对网络数据集过于庞大,学习速度过慢的问题,提出了一种基于空间块和样本密度的SVM算法,并将其应用到入侵检测中。该算法根据样本......
针对传统次胜者受罚竞争学习(RPCL)算法忽略数据集几何结构对节点权值调整的影响,以及魏立梅等提出的新RPCL算法(魏立梅,谢维信.聚......
针对传统K-medoids算法对于初值敏感、容易陷入局部最优解、稳定性差等缺点和方差优化初始中心的K-medoids聚类算法的时间复杂度较......
提出了一种新的利用样本分布的密度函数进行聚类的非迭代最优化聚类方法,给出了一组与标准模糊C-均值聚类算法进行对比的典型实验,得到......
作为一种简单而成熟的分类方法,K最近邻(K nearest neighbor,KNN)算法在数据挖掘、模式识别等领域获得了广泛的应用,但仍存在计算量......
本文讨论了传统的径向基(RBF)神经网络聚类算法的基本原理,针对其选取初始中心矢量的不足,提出了一种新的选择初始中心矢量的方法,给出......
随着计算机网络的普及,人们的工作和生活更多的与数据信息产生联系,制造和使用的数据量越来越巨大,我们进入了一个大数据时代。人......
对于不平衡数据集,传统模糊支持向量机存在分类敏感等问题,且确定样本隶属度时大多只考虑距离因素,不能精准地反映样本点的重要程......
为了提高半监督分类的性能,提出一种基于主动学习策略的半监督分类算法SSC_AL和一种基于改进的主动学习策略的半监督分类算法SSC_I......
在智能人-机交互系统中,语音情感识别是目前的研究热点之一,支持向量机(Support Vector Machine,SVM)方法被广泛用于语音情感识别......
对于不平衡情感数据集,传统的模糊支持向量机原理上分类不灵敏,支持向量的隶属度值被给予不准确情况,提出一种对样本点赋值的设计......
针对传统K均值聚类算法中存在的聚类结果依赖于初始聚类中心及易陷入局部最优等问题,提出一种基于样本密度的全局优化K均值聚类算......
为确定-means等聚类算法的初始聚类中心,首先由样本总量及其取值区间长度确定对应维上的样本密度统计区间数,并将满足筛选条件的密......
统计学习理论中的支持向量机方法具有全局最优、结构简单、推广能力强等优点,是目前机器学习和模式识别领域的研究热点之一。但是,......
针对传统核模糊聚类(KFCM)算法无法克服边界噪声数据影响且对初始聚类中心敏感的不足,提出一种基于样本密度和最大类间方差法相结......
k-means聚类算法是在确定的聚类数k下对数据集进行聚类,通常凭借先验规则假定一个k值,取值具有很大主观性;此外,k-means初始聚类中心的......
针对k-means的聚类效果主要依赖初始聚类中心的缺陷,本文提出了一种改进算法。该算法引入一个密度参数,并依据该参数选取k个相对分......