非平衡数据集相关论文
随着互联网技术的快速发展和大数据时代的到来,企业得利于网络和科技的发展,获得和收集了大量用户的数据和信息。然而企业面对海量......
电子病历是临床医疗活动最详实、直接的记录形式,是进行智能诊断的数据基础。电子病历的诊断结果是多病种的,包含正常诊断、病理诊......
作为一种脑部疾病,脑卒中是当前临床医学上最常见的疾病之一,具有高致死率和致残率等特点。引发脑卒中的风险因素众多,发病前高效......
支持向量机作为现今最流行的分类算法之一,已经被广泛地应用于生活中的各个领域。它不仅有着较为完善的理论背景,在数据分类时也有......
半监督学习已经成功地被运用于基于动态数据分析的数据挖掘和机器学习等研究领域之中。非平衡类的学习是分类问题中最具挑战的问题......
非平衡数据集是指同一个数据集中某些类的样本数远远少于其他类的样本数,它广泛存在于现实生活中.利用传统的机器学习方法分类,对......
现在每天都有大量数据需要提取和分析,数据挖掘技术在许多实际应用中获得巨大成功,分类模型已经在许多应用场合得到广泛应用,如原......
合成孔径雷达(SAR)是一种不受天气、光照等各种外界环境影响,并可以对感兴趣的区域进行全天候、全天时侦查的微波探测传感器。自SA......
不平衡数据集的特征是不同类的样本数量存在着显著的数量差异。从不平衡数据集学习到的基本分类器的预测结果通常会偏向于多数类。......
非平衡数据集的分类问题是机器学习领域重要的研究课题。一般地,少数类样本在数量上比多数类样本少且空间分布不均匀,但信息价值却......
随着信息技术的迅猛发展,我国已经处于信息化和数字化时代,文字作为信息的重要载体,文本挖掘在各个领域中扮演着越来越重要的角色,......
案例推理(Case-Based Reasoning, CBR)是商业预测领域的预测方法之一,它在保持较好预测性能的同时可对预测结果做出解释。企业经营......
非平衡数据集分类问题是模式识别、机器学习和数据挖掘领域中的常见问题,也是热点问题,吸引着众多学者的眼球。非平衡数据集是指数......
通过学习特征变换矩阵,可以将样本映射到新的空间,以适应给定的样本距离测度方法.基于此,提出一种面向k近邻的特征变换方法用于提......
化学样本数据常为非平衡,用传统方法分析这些数据集时,对于需特别关注的少数类数据,识别能力往往较差。因此,提出建立基于粒计算的......
为了提高育种领域选种的准确率同时缩短品种培育年限,利用改进的随机森林算法根据小麦育种历史数据构建评价模型. 在训练分类器之前......
随着网络上非平衡数据的大量涌现,使得对非平衡数据分类的研究成为一个新的研究热点.根据特征在类别中的分布特点,提出了基于类间......
针对传统的过采样算法在增加样本的同时可能使决策域变小和噪声点增加的问题进行了研究,提出了一种基于错分的混合采样算法。该算......
针对传统的特征选择方法在非平衡数据集中分类效果不理想的问题,提出了一种适合非平衡数据分类的改进特征选择方法.该方法将集中度......
将线性尺度空间的特征点扩展问题转化为多尺度数据集的同尺度内分类问题,该问题属于尺度不变的非平衡数据集分类问题。提出了一种......
针对分类算法在非平衡数据集的情况下分类性能不理想的问题,总结了常见的数据平衡化方法,包括改造数据集与改进算法,提出一种全新的基......
CBES是面向非平衡数据集分类的组合选择方法。相关的实验表明,CBES方法能大幅度提升基分类器的泛化能力。已有研究表明,抽样方法能有......
针对传统的SVM算法在非平衡数据分类中分类效果不理想的问题,提出一种基于分类超平面和SMOTE过采样方法(HB_SMOTE)。该方法首先对......
用深度学习(DL)的方法对蛋白质O-糖基化位点进行了预测。首先用SMOTE方法处理非平衡数据集,对较少一类的样本用“近亲繁殖”的方法......
非平衡数据集在金融、商业以及学术的研究等诸多的领域有着广泛的应用,主要研究的是对于非平衡数据集的处理和分类问题,首先使用了......
动态数据存在数据量动态改变,数据类别分布非平衡、不稳定等问题,这些问题成为分类的难点.针对该问题,通过对在线极端学习机模型进......
在机器学习及其分类问题时经常会遇到非平衡数据集,为了提高非平衡数据集分类的有效性,提出了基于商空间理论的过采样分类算法,即Q......
非平衡数据是指两类问题中正类样本与负类样本个数不相等,甚至相比悬殊.非平衡数据集会导致许多分类器的性能下降,这与分类器的构造原......
大数据时代下,挖掘数据潜在的价值己成为各行各业提高核心竞争力的必要手段。在通信行业,坐拥丰富数据资源的运营商需要借助数据挖......
近年来,随着互联网的普及以及信息化程度的提高,各行业数据呈现快速增长趋势,对这些数据进行快速分类和识别,是有效提高各行业智能......
随着科技的不断进步,民航新科技不断在大型枢纽机场成功应用。为保障飞机安全进近和着陆,民航近年来投入大量资金建设机场盲降设备......
脉冲星是高度磁化的旋转中子星,具有体积小、密度大等特点。脉冲星的发现在物理和天文学领域都有着重大的意义。随着人工智能技术......
在进行煤层底板突水预测时,水害状况一般分为安全和突水2种状态,状态数据具有非平衡特点,而已有的煤层底板突水预测模型主要适用于......
非平衡数据集分类是近年来机器学习和模式识别领域研究的热点问题之一。在实际应用中这种非平衡数据分类问题很常见,如卫星图像检测......
非平衡数据集分类是指在数据集中各类样本数目不相等的分类问题。传统的分类算法大多是建立在样本分布均等或者样本错分代价相同的......
非平衡数据集分类是机器学习和数据挖掘领域的一个重要研究方向。所谓非平衡数据集,在二分类问题中,即是在数据集中一类样本数量远远......
非平衡数据集的不均衡学习特点通常表现为负类的分类效果不理想。改进SMOTE再抽样算法,将过抽样和欠抽样方式有机结合,有针对性地......
非平衡数据集的分类问题是机器学习领域的一个研究热点。针对非平衡数据集分类困难的问题,特别是由于非平衡分布引起的少数类识别......
近年来,非平衡数据集分类问题一直是数据挖掘和机器学习领域的研究难点。所谓非平衡数据集分类问题,是指训练样本数量存在类分布不......
现实生活中存在大量的非平衡数据,大多数传统的分类算法假定类分布平衡或者样本的错分代价相同,因此在对这些非平衡数据进行分类时......
期刊
在对实际问题进行数据挖掘时面临的多数是非均衡数据集,即各种类型的数据分布并不均匀,且关注的类型常是少数类。运用含有少量少数类......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
在灾害天气、故障诊断、网络攻击和金融欺诈等领域经常存在不平衡的数据集。针对随机森林算法在非平衡数据集上表现的分类性能差的......
为了解决Keerthi改进的序贯最小优化(SMO)算法在处理非平衡数据集时,整体分类性能较低、稳定性差等问题,对两个类别施加不同的惩罚系数......
支持向量机(SVM)作为一种有效的机器学习技术可以很好地处理平衡数据集,然而除了对噪声点和野点敏感以外,SVM在非平衡数据分类时会偏......
模式识别是人工智能领域的一个重要研究任务,而分类和聚类是模式识别中的两个重要的研究课题。由于客观世界的多样性,不可能找到一种......