非均衡数据相关论文
在当今大数据时代,数据的规模以指数级的速度快速增加,数据作为互联网的核心,其在人们生活中应用价值越显关键。如何通过技术手段......
分类学习是模式识别、机器学习与数据挖掘的核心问题,它广泛存在于诸多应用领域。近几十年来一直受到研究者及工程应用人员的普遍......
基于类中心确定隶属度函数的模糊支持向量机能有效地解决支持向量机对噪声或孤立点敏感度高的问题,但是,由于它对支持向量赋予较小......
近年来,非均衡数据的分类问题引起了众多研究学者的关注和讨论。在地质勘探领域,岩石数据呈现非均衡特征的情况也多有发生,加上复......
非均衡数据,是指数据的两个或多个类别存在严重非均衡,如征信数据中违约样本和非违约样本比例常常存在失衡的情况。回顾近三十年的......
在二元分类问题中,非均衡数据集所具有的特征是两类实例个数明显不同。已有的分类方法在分类过程时多以最大化模型的整体分类效率......
非均衡数据场景在现在的大数据处理,机器学习任务中十分常见。标准的机器学习算法一般都是以样本数据分布大致均匀为前提建立的,然......
学位
入侵检测是一种主动安全防御技术,可以有效识别网络中的入侵行为,但现有网络中不同攻击类型数据的数量差异很大且网络数据呈现海量......
多媒体通信技术发展日新月异,以互联网为载体、以运营商专用宽带网络为传输媒介的交互式网络电视(Internet Protocol TV,IPTV)成为......
[目的]针对糖尿病并发症数据样本不均衡带来的分类器刻画能力不足和决策边界偏移问题,探索合适的分类器模型,提高糖尿病并发症预测......
基于数据驱动的电网异常数据辨识方法已成为电网安全领域研究的重点,由于实际电力发电统计数据中异常数据样本数极少,给通过数据挖......
类别混叠度是指不同类别数据之间互相交叠、混合的程度,其量化指标包含基于几何统计的和基于信息论的两类,用于衡量数据分类的难易......
针对交互式网络电视(IPTV)用户报障因素复杂、故障样本相对贫瘠的问题,基于相关向量机(RVM)高稀疏性的建模特点提出一种结合RVM参......
传统的分类算法大都默认所有类别的分类代价一致,导致样本数据非均衡时产生分类性能急剧下降的问题.对于非均衡数据分类问题,结合......
针对传统的最小二乘支持向量机对于非均衡数据的分类时,分类结果具有对较大类数据的偏向性问题,为了减小分类器的负担和样本的错误......
根据支持向量样本、边界向量样本、噪声样本、中心距离比值、百分位数和加权系数之间的关系,提出了基于中心距离比值的加权支持向......
针对支持向量机(support vector machines,SVM)检测异常用电用户精度受样本非均衡性和核函数选择影响的问题,提出一种基于TLSmote-......
根据支持向量样本、边界向量样本、相对距离和加权系数之间的关系,提出了基于相对距离的加权支持向量机.利用相对距离表示了每个样......
当前,处理类别非均衡数据采用的主要方法之一就是预处理,将数据均衡化之后采取传统的方法加以训练。预处理的方法主要有过取样和欠......
针对传统超球体支持向量机在处理非平衡数据集时出现的少数类查全率较低的问题,通过引入最大间隔和参数ν,提出了ν-最大间隔超球......
针对海域船舶大规模非均衡数据,重点阐述大规模非均衡数据下的船舶风险分类模型,利用船舶-风险矩阵、聚类-矩阵因子分解等方法,缓......
基于预处理结果将降噪BP神经网络方法应用于非均衡数据分类。通过SGD方法获取最小代价的函数损失值。引入学习率自适应更新方法对S......
随着微型传感器(加速度计、磁力计、压力计等)在智能设备上的普及,催生出许多新型的研究领域,其中基于可穿戴设备的动作识别是一项......
近年来,随着计算机科学和电子通信技术的发展,人们已经进入了大数据时代。原始数据的数据量以及数据种类的爆炸式增长,使各行各业......
过去的几年里P2P网贷平台呈现野蛮式的扩张,但最近的“跑路”潮、倒闭潮频现,引发各界对我国P2P网贷市场安全性和稳定性的担忧。P2......
学位
文本分类能够很好地帮助用户整理、获取信息,在提高信息检索的速度和准确率方面显得意义重大,具有很重要的研究价值。针对以往的近......
针对支持向量机对噪声的敏感,以及当两类训练样本数量差别悬殊时,造成分类结果倾向较大类等弱点,通过理论分析,合理地设计隶属度函数,提......
在信用卡数据建模的分类器构造问题中,“好”“坏”客户具有严重不均衡的数据特性,在抽样方法的框架下,解决数据非均衡性的方法主......
研究了小额贷款公司对客户进行信用风险评估时面临的问题,构建了信用风险评估指标体系,改进了支持向量机(Support Vector Machine,......
随着全球的商业竞争愈来愈激烈,客户流失预测已经成为客户关系管理中非常重要的内容。预测即将流失的客户,并制定相应的措施挽留客......
基于自变量之间的非正交性或相关性,非均衡数据两因素方差分析方法区别于经典的均衡数据方差分析。文章给出了非均衡数据两因素方......
为优化针对非均衡数据的分类效果,结合犹豫模糊集理论与决策树算法,提出一种改进的模糊决策树算法。通过SMOTE算法对非均衡数据进......
提出了非均衡数据目标识别中SVM模型多参数优化选择方法.首先从理论上分析了SVM模型多参数选择的内涵和必要性,针对非均衡数据的分类......
随着信贷行业的迅速发展和数据挖掘技术的不断进步,传统人工完成的信用风险评估工作正逐步被大数据背景下的机器学习所代替。作为......
目的针对印刷标志图像训练数据集非均衡性导致印刷标志图像中少类数据套准状态识别准确率低的问题,提出改进的SMOTE训练集过采样方......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
随机梯度下降(stochastic gradient descent,SGD)方法已被应用于大规模支持向量机(support vector machine,SVM)训练,其在训练时采......
针对严重非均衡数据提出一种非迭代核逻辑回归的学习方法.该方法是对经典处理核逻辑回归的迭代加权最小二乘方法的一种改进,不仅减......
大健康时代的到来让我们重新观察人类身处的健康环境,也越来越关注生活质量和身体健康,然而各种现代病却在不知不觉地向我们袭来。......
自古以来,人们不断积攒着各个不同领域的数据,而近些年随着计算机技术的飞速发展,数据的接收和存储变得极其简单快捷,导致海量的数......
目前,非均衡数据分类预测问题是数据挖掘和模式识别领域的重要研究课题,一般具有数据分布非均衡、数据数量非均衡、数据属性特征非......
支持向量机是机器学习算法中的一种经典分类方法,具有分类性能好,训练速度快的优点,尤其在非线性分类场景下有较优异的表现。支持......
随着现代科技的迅猛发展和数据业务的不断增多,大量数据不断积累的同时数据类型也越来越多样化。其中具有代表性的非均衡数据现在......
半结构、非结构化、海量的供应链金融数据使得大数据环境下金融数据分析的模式和方法相对复杂。面向大数据样本研究,如何将大样本......
重载列车重量大、编组长,线路条件复杂,司机驾驶过程中工况切换频繁,不当的牵引或制动将增大列车纵向冲击力,甚至发生脱钩的危险。......
随着银行业发展的日新月异,交易数量呈指数型增长,与此同时异常交易也在增多,造成了不可估量的损失和风险。就如何从海量客户信息......
极速学习机(Extreme learning machine,ELM)虽然已在理论和应用中证实有很好的泛化性能和极快的训练速度,但是在处理非均衡数据时,它......