非均衡数据相关论文
针对银行贷款风险控制中客户个人信用难以评估的特点,提出一种基于异构集成算法模型的个人信用评估.对个人信用特征进行分层学习,......
针对轴向柱塞泵实际故障诊断中采集到的故障类数据远少于正常类数据的情况,为提升故障分类精确率,提出了一种基于平衡随机森林(Bal......
在当今大数据时代,数据的规模以指数级的速度快速增加,数据作为互联网的核心,其在人们生活中应用价值越显关键。如何通过技术手段......
案件案由是对案件所涉及法律关系性质的描述,科学、完善的案由设置有利于正确适用法律,是人民法院实行案件分类管理的重要途径.案......
电子商务的繁荣促使了在线商品评论的急剧增长.海量的在线商品评论中,既包含反映消费者真实情感的评论,也包含了蓄意捏造的虚假评......
针对非均衡数据的情形,基于条件生成对抗网络(conditional generative adversarial networks,CGAN),利用梯度提升树研究了聚焦损失......
非均衡数据(分类不均匀分布)和冗余特征的出现极大增加了数据准确分类的难度.以最优化学习算法的预测准确率为目标,结合合成少数过......
利用多视图学习、流形学习以及协同正则化的多重惩罚处理,对含有大量无标签的类别数据提出一种多视图半监督学习的分类器构造方法.......
分类学习是模式识别、机器学习与数据挖掘的核心问题,它广泛存在于诸多应用领域。近几十年来一直受到研究者及工程应用人员的普遍......
近年来,非均衡数据的分类问题引起了众多研究学者的关注和讨论。在地质勘探领域,岩石数据呈现非均衡特征的情况也多有发生,加上复......
非均衡数据,是指数据的两个或多个类别存在严重非均衡,如征信数据中违约样本和非违约样本比例常常存在失衡的情况。回顾近三十年的......
在二元分类问题中,非均衡数据集所具有的特征是两类实例个数明显不同。已有的分类方法在分类过程时多以最大化模型的整体分类效率......
宽度学习系统(broad learning system,BLS)作为深度神经网络的替代框架,具有快速自适应模型结构选择和在线增量学习能力,被认为是......
非均衡数据场景在现在的大数据处理,机器学习任务中十分常见。标准的机器学习算法一般都是以样本数据分布大致均匀为前提建立的,然......
学位
入侵检测是一种主动安全防御技术,可以有效识别网络中的入侵行为,但现有网络中不同攻击类型数据的数量差异很大且网络数据呈现海量......
多媒体通信技术发展日新月异,以互联网为载体、以运营商专用宽带网络为传输媒介的交互式网络电视(Internet Protocol TV,IPTV)成为......
[目的]针对糖尿病并发症数据样本不均衡带来的分类器刻画能力不足和决策边界偏移问题,探索合适的分类器模型,提高糖尿病并发症预测......
基于数据驱动的电网异常数据辨识方法已成为电网安全领域研究的重点,由于实际电力发电统计数据中异常数据样本数极少,给通过数据挖......
针对交互式网络电视(IPTV)用户报障因素复杂、故障样本相对贫瘠的问题,基于相关向量机(RVM)高稀疏性的建模特点提出一种结合RVM参......
传统的分类算法大都默认所有类别的分类代价一致,导致样本数据非均衡时产生分类性能急剧下降的问题.对于非均衡数据分类问题,结合......
针对传统的最小二乘支持向量机对于非均衡数据的分类时,分类结果具有对较大类数据的偏向性问题,为了减小分类器的负担和样本的错误......
根据支持向量样本、边界向量样本、噪声样本、中心距离比值、百分位数和加权系数之间的关系,提出了基于中心距离比值的加权支持向......
针对支持向量机(support vector machines,SVM)检测异常用电用户精度受样本非均衡性和核函数选择影响的问题,提出一种基于TLSmote-......
根据支持向量样本、边界向量样本、相对距离和加权系数之间的关系,提出了基于相对距离的加权支持向量机.利用相对距离表示了每个样......
设计并实现了一个基于OpenShift云计算环境的数据质量评估平台,对非均衡数据的完整性常规指标和专用指标具有评估功能.......
当前,处理类别非均衡数据采用的主要方法之一就是预处理,将数据均衡化之后采取传统的方法加以训练。预处理的方法主要有过取样和欠......
针对传统超球体支持向量机在处理非平衡数据集时出现的少数类查全率较低的问题,通过引入最大间隔和参数ν,提出了ν-最大间隔超球......
针对海域船舶大规模非均衡数据,重点阐述大规模非均衡数据下的船舶风险分类模型,利用船舶-风险矩阵、聚类-矩阵因子分解等方法,缓......
基于预处理结果将降噪BP神经网络方法应用于非均衡数据分类。通过SGD方法获取最小代价的函数损失值。引入学习率自适应更新方法对S......
针对城市排水管道正常与堵塞故障状态在数据获取上的非均衡性造成的运行状态识别准确率下降的问题,提出基于非均衡数据的管道堵塞......
随着微型传感器(加速度计、磁力计、压力计等)在智能设备上的普及,催生出许多新型的研究领域,其中基于可穿戴设备的动作识别是一项......
近年来,随着计算机科学和电子通信技术的发展,人们已经进入了大数据时代。原始数据的数据量以及数据种类的爆炸式增长,使各行各业......
过去的几年里P2P网贷平台呈现野蛮式的扩张,但最近的“跑路”潮、倒闭潮频现,引发各界对我国P2P网贷市场安全性和稳定性的担忧。P2......
学位
文本分类能够很好地帮助用户整理、获取信息,在提高信息检索的速度和准确率方面显得意义重大,具有很重要的研究价值。针对以往的近......
针对支持向量机对噪声的敏感,以及当两类训练样本数量差别悬殊时,造成分类结果倾向较大类等弱点,通过理论分析,合理地设计隶属度函数,提......
重抽样方法是常用的解决数据非平衡问题的一种有效手段,为提高入侵检测系统的检测效率,降低数据的不平衡程度,提出了快速分层最近......
在信用卡数据建模的分类器构造问题中,“好”“坏”客户具有严重不均衡的数据特性,在抽样方法的框架下,解决数据非均衡性的方法主......
随着全球的商业竞争愈来愈激烈,客户流失预测已经成为客户关系管理中非常重要的内容。预测即将流失的客户,并制定相应的措施挽留客......
指数分布的数据特征存在广泛,在风险预警中,正负样本是非均衡的,传统的算法不能满足该类数据特征选择的效率和准确率。为了提高指......
基于自变量之间的非正交性或相关性,非均衡数据两因素方差分析方法区别于经典的均衡数据方差分析。文章给出了非均衡数据两因素方......
为优化针对非均衡数据的分类效果,结合犹豫模糊集理论与决策树算法,提出一种改进的模糊决策树算法。通过SMOTE算法对非均衡数据进......
提出了非均衡数据目标识别中SVM模型多参数优化选择方法.首先从理论上分析了SVM模型多参数选择的内涵和必要性,针对非均衡数据的分类......
随着信贷行业的迅速发展和数据挖掘技术的不断进步,传统人工完成的信用风险评估工作正逐步被大数据背景下的机器学习所代替。作为......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
目的针对印刷标志图像训练数据集非均衡性导致印刷标志图像中少类数据套准状态识别准确率低的问题,提出改进的SMOTE训练集过采样方......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
随机梯度下降(stochastic gradient descent,SGD)方法已被应用于大规模支持向量机(support vector machine,SVM)训练,其在训练时采......