数据集划分相关论文
分子性质预测模型是针对特定应用需求筛选设计化学品的有力工具,然而诸多相关建模过程中的测试集划分、交叉验证、算法选择等关键环......
许多现实生活中的应用都受到类不平衡问题的困扰,如医疗诊断和金融危机预测。在这些应用中,目标往往是代表性不足的类别。然而,经......
图像超分辨率重建技术是为了在不改变成像设备的基础上通过信号处理的手段来提高原有图像的分辨率,进而增强图像的视觉效果便于后......
决策树是一种有监督的归纳学习算法,它用于对有类标的数据集进行分类,而聚类是一种无监督的学习算法,它可以对无类标的数据集进行......
针对有限样本情况下,多次训练模型时容易出现不稳定和偏差问题,提出一种基于Gaussian混合的距离度量学习数据划分方法,通过更合理......
设计了一种新的数据集划分关联规则挖掘算法,并对该算法的挖掘效率进行了测试,分析了影响DPARM算法挖掘效率的主要因索.......
为提高硬盘剩余使用寿命预测器的精度,提出一种基于smart数据筛选和随机森林预测器进行剩余使用寿命预测的方法。提出基于硬盘使用......
近年来,随着互联网、物联网的迅速发展,数据产生方式日益多样化的同时数据可用性问题日益突出。数据可用性的一个重要方面是数据完......
近红外光谱数据的预处理是特征提取和分析模型建立的基础,在获取真实光谱数据和获得可靠结果方面起着重要作用。文章基于玉米籽粒......
海量知识的高效管理是网络监测预警发挥效能的前提。为此,提出一种基于图数据库的大规模资源描述框架(RDF)数据存储方法。根据RDF数据......
通过分析AGWL中已有的数据集划分方法,发现在涉及到数据子集相关性时,现有的研究方法仅是通过一种定性的复制数据块间部分子数据集......
MapReduce是一个目前应用广泛的并行计算框架,如何解决Reduce节点的负载平衡问题是MapReduce程序执行效率的一个重要研究方向.基于......
期刊