UCI数据集相关论文
该文通过实验利用公开规范的UCI数据集通过3个步骤建立字符识别模型,一是基于主成分分析,提取UCI记录中有较好识别效果的变量因子;二......
基于内容的图像检索,是根据图像自身所包含的颜色、纹理、形状、空间关系等各种物理特征,在图像数据库中检索具有相似特征的图像。由......
聚类分析是数据挖掘中的重要内容之一,是将数据对象按照相似性度量划分成各类簇的过程,并广泛的应用在数据挖掘,模式识别等领域。K......
进入了互联网时代,海量数据潜藏的价值也越来越巨大,同时也面临着从海量数据中剔除不相关,冗余特征的难度也进一步提高了。特征选......
聚类问题是数据挖掘领域的重要研究课题,它不仅能用作独立工具来发现数据集的特征信息,而且能作为其他数据挖掘算法的预处理过程,......
由于仿射传播(AP)聚类算法中偏向参数对聚类精度有着直接的影响,但其偏向参数都是经验取值导致不能得到最优的聚类结果,针对这一问......
计算机信息粒通常是使用概率性方法以判别式学习的方式进行的,当分类任务的性质是识别特定类别的模式时,如在情绪检测的情况下,可......
现有的多核学习算法大多假设训练样本分类完全正确,将其应用到受扰分类样本上时,由于分类存在差错,因此往往只能实现次优性能。为......
为了分析不同的距离测量方法对AIRS的性能影响,采用三种距离测量方法实现AIRS,这三种方法分别是Euclidean距离、Manhattan距离和RB......
通过矩阵刻画粗糙集理论,用模糊矩阵定义了模糊粗糙集的上(下)近似、重要度等概念,给出模糊决策系统的属性约简算法.将其运用到信......
当前,极大熵聚类(maximum entropy clustering,MEC)在面对多视角聚类任务时,是将多视角样本合并成为一个整体样本再进行处理,然而这......
为了提高数据分类性能,提出一种双层分类器集成的协同分类算法CCTL。算法由训练算法和测试算法两部分组成。算法采用双层结构集成,......
K-means算法以其简单、快速的特点在现实生活中得到广泛应用。然而传统K-means算法容易受到噪声的影响,导致聚类结果不稳定,聚类精度......
K-medoids聚类分析具有对孤立点敏感度较低和良好的鲁棒性等特点,但由于初始聚类中心的选取和中心点迭代更新等,聚类精度和效率较......
无监督学习聚类算法的性能依赖于用户在输入数据集上指定的距离度量,该距离度量直接影响数据样本之间的相似性计算,因此,不同的距......
数据聚类在智能信息处理中具有非常重要的作用。传统的数据聚类方法,如K-means算法,存在对初始聚类中心敏感等问题。随着智能优化......
在数据挖掘领域中,对不完备数据进行补全,能够有效修复残缺的信息,提高挖掘效率和建模成功率。在大数据场景下,数据缺失机制的复杂......
基于模糊粗糙集的知识获取方法在模糊粗糙集的研究中具有十分重要的作用,通过矩阵来刻画粗糙集理论,用模糊矩阵定义了模糊粗糙集和粗......
针对Sina微博博文的转发关系,建立起用户转发博文之间的演化网络,从而利用SMOSVM(sequentialminimaloptimizationsupportvectormachin......
随机选择初始聚类中心的k-means算法易使聚类陷入局部最优解、聚类结果不稳定且受孤立点影响大等问题.针对这些问题,提出了一种优化......
针对目前粗糙集属性约简速度比较慢、不能得到属性约简集的问题,提出了一种新的属性约简算法。通过理论分析、具体的实例和UCI数据......
针对因素分析表中的因素实时变化的问题,利用因素空间决定度,给出了动态的因素约简算法.该算法分析了增加因素的决定度与原静态因......
针对非平衡数据分类问题,提出了一种改进的SVM-KNN分类算法,在此基础上设计了一种集成学习模型。该模型采用限数采样方法对多数类......
分析经典ID3型决策树挖掘算法中存在的问题,对其熵值计算过程进行改进,构建一种改进的ID3型决策树挖掘算法.重新设计决策树构建中的熵......