代价敏感学习相关论文
[目的] 增强虚假评论识别任务中模型对文本深层语义信息的学习,并解决虚假评论识别任务中存在的严重的数据不平衡问题。[方法] 基于......
针对辐射源个体识别(SEI)中样本标签不完整和数据类别分布不平衡导致分类准确率下降的问题,该文提出了一种基于代价敏感学习和半监督......
正类和无标签类学习(Positive and Unlabeled learning,PU学习)作为弱监督学习领域中不完全监督的一个重要分支,由于其在实际应用中......
传统的机器学习分类算法通常是在各类数据集样本数量基本平衡的基础上建立起来的。但实际应用场景中的数据集常存在不平衡问题,如......
以机器学习和深度学习为代表的数据挖掘技术为日益加剧的财务造假现状的缓解提供了技术帮助,但财务造假识别所具备的类不平衡性和......
当前推荐系统的商业价值日益突显,虚假用户检测成为保障推荐系统信息安全的关键.现有方法忽略了虚假用户检测问题的代价敏感特性,......
阿尔兹海默症(Alzheimer’s Disease,AD)是一种不可逆的大脑神经退行性疾病,随着病情的加重患者通常会出现认知能力下降、记忆力衰退......
【目的】提出一种面向不平衡数据的电子病历自动分类方法,以进一步提高临床电子病历分类性能。【方法】利用MC-BERT增强电子病历的......
道路提取作为遥感影像对象提取环节中的重要角色,可以为道路提供语义信息和位置信息,属于一种特殊的语义分割任务,目标是将图像像......
燃气是城市生活中重要的能源,而燃气管线作为输送和分配燃气的载体,更是起着不可或缺的作用。由于燃气具有易燃、易爆、有毒的特点......
研究目标:构建动态不平衡财务预警模型以同时处理概念漂移和数据分布不平衡问题.研究方法:在改进AdaBoost算法的基础上,以代价敏感......
软件缺陷预测通过设计一个鲁棒的机器学习模型,可准确判断待预测软件模块中是否存在缺陷程序,进而为合理分配测试资源以及提高软件......
组合核相关向量机可以融合多个特征空间,输出变压器隶属于各种状态的概率。本文将代价敏感学习机制融入组合核相关向量机,构建了代价......
最小测试代价属性约简问题是数据挖掘和机器学习中的重要问题。最近,一个信息增益算法被设计用于解决该问题,但该算法的效果并不理想......
在模式识别中,由于对象或条件限制,样本集中往往某些类别样本数量远大于其他类别。使用不均衡数据训练的分类器趋向于把样本识别为多......
针对图像标注数据集中存在的标注对象比例不一致和标签分布不平衡问题,提出基于特征融合和代价敏感学习的图像标注方法。在卷积神......
电网中不同设备的故障概率存在差异,影响智能诊断技术的准确性.为解决此问题,提出了一种基于代价敏感学习和模型自适应选择融合的......
随着互联网时代的到来,数据规模的快速增长给存储带来了巨大挑战。磁盘凭借其容量大、价格低等优势,被广泛用于数据中心存储。然而,磁......
随着信息技术的迅速发展和互联网规模的不断扩大,互联网已经成为了全球最大、最广泛使用的信息库,如何有效检索这些海量信息成为当前......
信用风险评估是商业银行信贷风险管理中一项基础性且关键性的工作,其目的在于分析商业银行在贷款业务中可能面临的信用风险,从而为贷......
在真实世界的分类问题中,不同的分类错误往往会带来显著不同的损失,而且不同类别样本的数目往往有显著的差别。传统的机器学习研究假......
近年来,国际国内各种社会组织的数量及活跃度快速增长,对各国的政治、经济等领域的影响日益加深。因此,迫切需要研究各种社会组织......
从广义上讲,机器学习(Machine Learning)是以使其包括任何计算机程序通过经验来提高其任务处理性能的行为。如果机器能够真正完全......
网络技术的不断发展、网络知识的不断普及,使得我们的生活发生了根本性的变革,社会生活的各个方面都受到了极大的影响,网络系统已成为......
随着网络技术的迅速发展和互联网规模的不断扩大,互联网已经成为了全球最大、最广泛使用的信息库,如何有效检索这些海量信息成为当前......
在数据挖掘中要面对三大挑战性问题:挖掘方法、挖掘对象和挖掘约束,分类问题是三大挑战中的挖掘方法问题。早期的分类的效果一般以......
多视图的学习在最近十几年引起了众多研究人员的极大兴趣和关注。而传统的模式识别和机器学习的方法多是集中在单视图上进行的。这......
超网络是在细胞中生物分子网络的启发下形成的一种用于学习和记忆的概率图论模型。超网络是一种由大量超边组成的特殊超图。与一般......
数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性信息的过程。数据挖掘又译为资料探勘、数据采矿,是数据库知识......
数据中心网络中的流可以分为大象流和老鼠流,预测流类型是实现优化调度各种流的基础,而现有方法在开销、准确性、预测时间等方面都......
针对云检测任务中云和背景样本不均衡易造成模型泛化能力差的问题,应用代价敏感学习方法,在卷积网络的损失函数中引入代价系数,同......
蛋白质分类预测通常包括如下四个步骤:(1)构建合理的蛋白质数据集;(2)特征描述方法把蛋白质信息转化为特征向量;(3)若数据集维度较......
软件缺陷预测是一个活跃的研究领域,它寻求有效的方法来预测给定软件项目中的缺陷倾向。软件缺陷预测技术通过挖掘源代码文件和一......
大数据时代下,传统的异常流量检测采用静态规则匹配的方法,已然不能满足多变复杂的网络环境。而机器学习由于其自学习、自演化的特......
工业产品质量控制是工业产品获得稳定质量要求的重要手段。传统的工业产品质量控制是独立分析各种潜在信息或价值数据对质量指标的......
随着信息时代的发展,数据形式呈现多样化。其中,具有高维和不平衡双重特性的数据广泛存在于我们的实际应用中。传统的分类模型在分......
软件缺陷预测作为软件工程领域的研究热点,其主要的目标是发现软件中存在的缺陷从而提高软件质量。以往的研究大多数致力于项目内......
在许多场景和应用领域中,不均衡数据学习是一个常见并且长期存在的问题。例如在实际生活中电信管理,信用卡欺诈检测,诊断数据中的......
随着科学技术的爆炸式发展,人类在很多领域都获得了不小的进步。人类基因组计划的实施以及下一代基因测序技术的成熟也产生了海量......
在现代工业生产中机械设备的智能化程度不断提高,这些设备在大幅提高生产效率的同时也带来了维护上的困难。现实中即使是一个不明......
不平衡数据分类问题在数据挖掘领域占有重要的地位,如何有效处理不平衡数据已然成为当前的一个研究热点。采用传统的分类模型时,数......
近年来,深度学习模型在许多领域都取得了卓越成果,这其中的关键是大规模的有标注数据集。但实际上大规模数据集很难拥有完善的数据......
在机器学习算法中分类作为数据分析的手段已被广泛的应用在工商业以及科学研究中。由于数据多元化的结构特征使得很多数据呈现了多......
近年来,人工智能和知识发现的发展迅速,计算机技术在各领域的应用日益增多。数据量剧增,并呈现高维度、多类别、结构复杂等特点,对......
逻辑回归是多标签分类以及排名任务中最常用的损失形式,但逻辑回归下的Sigmoid交叉熵损失函数受类别不平衡的影响极其严重。这种不......