非均衡数据集相关论文
以深度学习为代表的人工智能技术是解决电磁目标识别问题的一种有效方法 .然而,在识别多模式电磁目标时,目标内部不同模式间数据的差......
该文针对信用卡欺诈客户数据集极不平衡的特点,设计了SMOTE、Borderline SMOTE、ADASYN、SMOTENC四种采样算法,对数据集进行均衡处理......
本文主要研究的内容为模糊聚类算法在含噪声数据集和非均衡数据集上的应用。随着科技的不断发展,聚类分析已经在许多领域得到了广......
在模式识别、机器学习以及数据挖掘中,分类是一个基本而又重要的问题。作为模式分类的研究方法之一的支持向量机技术近来也得到广......
相关向量机(Relevance Vector Machine,RVM)是一种基于稀疏贝叶斯理论提出的机器学习算法,它的主要宗旨在于拟合目标数据进行分类......
分类预测是数据挖掘和机器学习的重要任务之一,非均衡数据广泛存在于真实世界的分类问题中.本文提出一种新的解决非均衡数据集的预处......
大多数非均衡数据集的研究集中于纯重构数据集或者纯代价敏感学习,本文针对数据集类分布非均衡和不相等误分类代价往往同时发生这一......
非均衡数据集的分类过程中,产生了向多数类偏斜、少数类识别率较低的问题。为了提高少数类的分类精度,提出了一种S-SMO-Boost方法......
在传统的随机森林算法中,随机森林由多棵决策树组成,分类的结果由所有的决策树共同投票决定。随机森林算法在训练决策树的过程中,......
非均衡数据是分类中的常见问题,当一类实例远远多于另一类实例,则代表类非均衡,真实世界的分类问题存在很多类别非均衡的情况并得到众......
在设备故障诊断过程中,数据集中正负分类样本数量相差较为悬殊等数据不平衡问题会导致诊断准确率降低。为减少由于正负类样本不均......
针对训练数据集的不均衡性这一问题,结合采样方法和集成方法,提出一种集成支持向量机分类算法。该算法首先对不均衡的训练集进行非监......
金融风险识别与防控既是一个经济问题,又是一个社会问题。从概率论角度看,金融风险识别是一个非均衡数据集的分类判定问题。文章建......
在非均衡数据集中,针对使用单一的过采样或欠采样方法可能造成少数类样本过拟合或者丢失含有重要信息样本的问题.提出了一种新的基......
随着科技的不断进步和互联网技术的不断发展,IPTV正逐渐改变着人们的生活方式。然而由于IPTV机顶盒本身出现的故障或者网络传输堵......
随着科技的进步,各行各业无时无刻不在产生大量的数据,也面临着海量数据的分析与处理的难题,如何从海量数据中获得所需的价值成为......
我国进入老龄化社会后,老龄化和高龄化趋势仍在加速,养老事业的精细化管理、“智慧养老”迫在眉睫,精准地预测养老需求十分必要。......
集成学习算法是目前非常有效的机器学习框架,其中Boosting算法通过串行将弱学习器组合成强学习器,进而能很好的拟合真实模型,解决......
非均衡数据集的分类是数据挖掘的任务之一,通常传统分类方法应用于非均衡数据集会带来少数类分类精度的下降等问题,而非均衡数据集......
分类是数据挖掘和知识发现的重要任务之一,传统的机器学习分类研究大多基于如下假设:(1)以高总体分类正确率为目标;(2)数据集中的......
P2P网贷作为互联网金融领域的代表发展非常迅速,与此同时,众多风险也随之暴露,其中最主要的是信用风险(借款方违约风险)。因此,对......
大多数非均衡数据集的研究集中于重构数据集或者代价敏感学习,针对数据集类分布非均衡和不相等误分类代价往往同时发生这一事实......
为了提高P2P网络借贷平台的风险控制能力,提出一种基于多特征融合的、代价敏感决策树的网络借贷项目风险评估方法。该方法首先从互......