不均衡数据集相关论文
克拉玛依油田七区砂砾岩油藏岩性多样、隔夹层发育,常规取心识别方法成本高,在非取心段识别精度低,导致储层划分困难.为实现岩性的快速......
为了提升深度学习模型在不均衡小样本激光焊接表面缺陷数据集上的性能,优化了小样本数据量输入下的对抗生成网络(Generative Adversa......
针对现存的大学生综合体质评价模型在不均衡数据集下泛化能力受限问题,提出了一种基于三层数据挖掘和遗传算法的体质评价模型.从身......
近年来互联网行业飞速发展给人们的生活及工作带来了巨大便利,但同时也伴随着诸多网络安全威胁,不同类型的漏洞、病毒及恶意攻击都......
在文本分类中,各类别样本数目不等是普遍存在且备受关注的问题.本文从特征选择优化出发,分析了特征项在类内出现的频率、类内分散......
随着建筑企业信息化建设的推进,智慧化管理需求日益增长,因此,如何构建建筑企业的隐患管理信息系统就成为了目前的研究热点及难点......
随着计算机存储技术和人工智能领域的发展,不均衡的数据集的研究越来越受到研究人员的关注。近年来,机器学习和数据挖掘领域常见的分......
在生产与生活中经常出现不均衡数据集问题,尤其在许多实际的应用领域更多见,例如诈骗信用卡的检测、信息检索、网络入侵检测、医疗......
机械设备运行时,由于故障状态时间远小于正常状态时间,使得故障样本数量远小于正常样本数量,造成样本间数据不均衡现象。在进行故......
数据分类作为数据挖掘中备受关注的一个研究方向,已经有了许多研究成果,这些成果大多在数据集中样本分布均衡的条件下能够取得很好......
在如今大数据时代,分类问题一直备受研究者的关注。传统研究的分类算法都是建立在数据分布均衡的基础之上,并假设各个类别错分的代......
学位
信用作为当代的“经济身份证”,是社会经济发展的必然产物,建立完善的信用评价体系有助于为银行等金融机构提供精确的客户“画像”......
癫痫是一种由大脑神经元同步化异常放电所引起的脑部疾病,具有突发性和反复性。患者发病时,会出现晕厥、不自主的颤抖等症状,严重......
信用风险评价一直是企业发展与经济社会发展重点关注和研究的问题。随着电信运营商业务规模的持续扩大和消费型创新产品的不断推出......
在文本分类中,不均衡数据集广泛存在.本文从特征选择优化方面出发,分析了特征项在类内和类间的分布情况以及不均衡数据集下文档的......
提出一种改进的果蝇算法优化加权极限学习机入侵检测算法,利用加权极限学习机训练时间短、泛化性能好等优点,对NSL-KDD入侵检测数......
生物等效性研究中受试者脱落或各种原因造成的数据剔除,会导致两周期生物等效性集不均衡或不完整,在不同的统计算法或不同版本统计......
随着信息科学技术的快速发展,计算机技术与各种智能仪表在机械装备的监测中获得了广泛应用,反映系统运行状态的海量过程数据被采集......
近年来支持向量机理论取得了长足的发展,并广泛应用到模式识别、回归分析、信号处理、函数估计等诸多领域,但仍有待进一步的研究和......
针对实际网络入侵检测中经常遇到的有标定的不均衡数据集,实现了一种基于双v支持向量机的异常入侵检测方法,其基本思想是对具有不......
针对传统分类器在数据不均衡的情况下分类效果不理想的缺陷,为提高分类器在不均衡数据集下的分类性能,特别是少数类样本的分类能力......
针对不均衡数据下分类超平面偏移、少数类识别率较低的问题,提出一种基于样本密度的不均衡数据分类算法。该算法首先计算样本密度和......
针对传统的分类算法在处理不均衡样本数据时,其分类器预测倾向于多数类,少数类分类误差大,提出了一种基于聚类和遗传算法的样本生......
针对实际生产中,石化设备故障呈现出“不均衡小样本”特性,致使传统诊断模型适用性不足,准确率低下这一问题,基于一类支持向量机(O......
传统的分类器对不均衡数据集的分类严重倾向于多数类。为了有效地提高不均衡数据集中少数类的分类性能,针对此问题提出了一种基于K......
将K近邻分类法和支持向量机分类法结合起来,给出一种电信客户流失预测方法,即对边界样本采用加权K近邻分类,而对非边界样本采用改......
齿轮是传动机械中的重要部件,也是在运行过程中产生故障的主要原因之一,因此对齿轮进行故障诊断研究就具有十分重要的意义。但是在......
文本分类中数据集的不均衡问题是一个在实际应用中普遍存在的问题。从特征选择优化和分类器性能提升两方面出发,提出了一种组合的不......
针对不均衡数据集下分类超平面偏移导致直推式支持向量机样本标记准确率低的问题,结合动态代价和TSVM算法,提出一种代价敏感的TSVM......
针对网络行为数据的不均衡、数量大、更新快的问题,结合均衡化、增量学习、分类器集成思想提出一种用于网络入侵检测的协同增量支......
目前支持向量机(SVM)对均衡文本数据集进行文本分类时表现十分良好,但如果文本数据集是不均衡的,尤其是当不均衡率很大时,容易导致......
针对不均衡数据分类决策面偏移导致少数类识别率较低的问题,提出一种混合取样算法。首先计算类样本数的比值 K;然后分别在多数类和少......
在不均衡数据集下,SVM分类超平面的偏移,使得基于KKT条件进行样本选择的增量学习算法性能不佳,针对该问题,提出动态代价的SVM增量......
传统的分类算法在处理不均衡样本数据时,分类器预测倾向于多数类,样本数量少的类别分类误差大。针对该问题,提出一种基于聚类和遗......
文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术.文本分类中数据集的不均衡问题是一个在实际应用中普遍存在的问题.如......
摘要:为了解决多标签SVM主动学习对不均衡数据集学习效率低下问题,该文提出一种基于偏侧分类间隔的SVM主动学习选择策略,即依据当前分......
传统的不均衡数据集处理方法存在人工设置特征繁琐、普适性差等缺陷,难以适用于海军军械不均衡文本数据集处理。针对此问题,本文提......
基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系......
为提高不均衡文本分类的准确率和稳定性,提出了一种基于类别加权和方差统计的联合特征选择方法.首先,基于类别文档数大小对特征选......
针对多分类不均衡问题,提出了一种新的基于一对一(one-versus-one,OVO)分解策略的方法。首先基于OVO分解策略将多分类不均衡问题分......
针对于MDSMOTE算法在生成部分新样本时没有将错分样本纳入其中的问题,将对错分样本修正的方法加入到现有的MDSMOTE算法中,提高样本......
分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属......
分类问题是日常决策中经常遇到的问题。传统的分类算法前提假设是数据集的类别均衡或者每一类的错分代价一样,但是在现实中面对的......
传统支持向量机(SVM)方法在数据不均衡情况下无法有效实现托攻击检测。在研究SVM的基础上,提出一种基于欠采样和代价敏感SVM相结合的......
【目的】从产品论坛中识别潜在客户,对产品论坛中的用户生成内容特征进行分析,识别有购买意愿的产品潜在客户。【方法】将不均衡数......
使用KNN(K Nearest Neighbor)分类算法进行不良文本信息过滤时,由于包含不良信息的样本不易获取,导致分类器预测结果严重倾向于多数......
合成少数类过抽样技术(SMOTE)中的噪声样本可能参与合成新样本,所以难以保证新样本的合理性。针对这个问题,结合聚类算法提出了改......