不平衡样本相关论文
针对变压器故障样本类别不平衡和模型诊断精度低的问题,首先使用自适应综合过采样对训练样本中少数类别进行扩充以平衡样本,然后通过......
无人机视角的图像数据集常具有分辨率较低、特征信息较少和检测目标较小的特征。基于YOLO v3的深度学习框架,借鉴了Boosting算法的......
互联网金融给人们的生活带来了极大的便利,在方便信用卡贷款同时也带来了贷款违约的风险隐患。因此了解违约用户的行为特征是降低......
随着大数据技术的迅猛发展和医疗卫生信息化建设的不断加快,医疗大数据逐渐成为研究热点。越来越多的研究将机器学习方法应用于医......
传统的车货匹配市场,信息不对称、价格不透明,缺乏诚信等问题频发,从而使得货运市场中间商占据着价格的控制权。随着行业形势的变......
学位
近年来,我国天然气产业得到飞速发展,天然气消费总量也在逐年增多,如何有效的实现天然气的安全输送已成为天然气行业进一步发展亟......
随着信息技术的迅猛发展,出现了越来越多的数据形态,而流数据就是其中之一。该类数据不同于传统数据,其拥有海量性、实时性和动态......
极值理论在机器学习中的应用日益广泛,常用于预测稀有事件的发生、刻画不对称的决策边界以及估计某些距离极值的分布等.本文借助极......
电子商务崛起,网上购物成为常态。线上商品多到让人目不暇接,用户每次浏览的商品数量总是冰山一角,为了购买符合自己要求的商品,用......
介绍现有K-近邻分类法的基本思想和研究现状,并针对此方法在分类各类数据集分布不平衡时容易造成分类精度低的问题作相应的改进。......
支持向量机在处理不平衡数据集时,对少类样本的分类效果很不理想。传统的处理方法尽管能够提高少类样本的分类准确率,但多类样本的......
为提高变压器故障诊断效果,并改善训练样本数量不平衡对故障诊断的不利影响,提出了一种基于变分自编码预处理深度学习和油中溶解气......
支持向量机在分类平衡样本集时的分类效果非常好,但是对不平衡样本集的分类效果并不理想。仔细分析样本集不平衡的原因,一是数量上的......
用户或项目的分类是推荐算法的关键内容,而推荐过程中的不平衡样本问题,会影响少数类用户或少数类项目的推荐效果。笔者提出了SVM集......
针对膜蛋白类型预测中普遍存在的不平衡样本问题,分析一般支持向量机(SVM)在处理不平衡样本时的缺陷,引入加权SVM来补偿由于训练集......
两总体分布检验是非参数检验中的重要研究课题,也是本文探究的主要问题。基于非参数方法的两总体分布检验方法研究由来已久,而不平......
在线评论是当今消费者做出消费决策的重要参考指标,而虚假评论的涌现不仅干扰了消费者获取信息的准确性,并且影响了商务交易的公平......
近年来,同时具有高维问题与不平衡问题的高维不平衡数据越来越多地出现在以生物信息、卫星图像为代表的新兴领域中,其复杂的数据特......
本文基于SMOTE算法和随机森林算法提出了SMOTE-RF企业财务困境预测方法,即通过SMOTE算法构造人工数据增加少数类样本数量,以随机森......
在股票市场中,由于被评为"ST"的公司数量远远少于普通的公司,所以用于训练财务预警模型的数据有着严重的不平衡性。而一般的分类模......
在高速公路养护过程中,裂缝是路面评价指标的重要依据。考虑到样本不平衡、路面图像噪声干扰、裂缝尺寸多样的特点,作者提出了一种......
针对机械故障检测中,正常样本多、故障样本少、训练样本严重不平衡的客观情况,将小球大间隔方法引入其中,提出了一种不平衡样本下......
国内互联网金融和消费信贷的迅猛发展,催生了互联网个人征信的巨大需求。针对不平衡的互联网征信数据,采用随机过抽样、随机欠抽样......
高铁是复杂巨系统,任何子系统和设施、设备发生故障都可能危及高铁的运行安全。面向移动装备、基础设施状态、运行环境等高铁运行......
智能电网预测分析是保证智能电网经济、安全运行的基础.借助人工智能的突破性技术以及智能电网的大数据环境,实现基于人工智能的智......
本文介绍了旋转机械故障诊断的背景、发展和故障机理等基础知识,概括了常用故障诊断的方法,着重研究了二十世纪六十年代初迅速发展......