类别不平衡相关论文
在人类日常生活中,面部表情在非言语信息传递上,扮演着重要的角色。随着人工智能的迅速发展,面部表情识别的研究在心理学、模式识......
文本分类(TC)是自然语言处理(NLP)领域的重要基础任务,多标签文本分类(MLTC)是TC的重要分支。为了对多标签文本分类领域进行深入了解,介绍......
软件缺陷数据的类别分布不平衡特点给软件缺陷预测任务带了巨大的挑战。合成过采样是解决这一问题最为主流的技术,但如何设计合适的......
语义分割是自动驾驶车辆进行场景理解的关键技术之一,可以保障自动驾驶车辆的行驶安全。与非视觉方式的场景理解技术相比,该方法在......
在许多现实应用中,机器学习算法面临着数据中类别样本数量不平衡的困难。随着互联网、分布式计算以及边缘计算等领域的快速发展,更......
在传统监督学习中,一个样本通常对应单个标记,提供了明确的监督信息。在偏标记学习中,一个样本对应一组候选标记,其中仅有一个标记......
视觉关系检测的目的是通过形式描述图像中的物体以及它们之间的交互关系(谓词)来提供对图像的全面理解。视觉关系检测在图像字幕生成......
蛋白质对于调节和执行细胞的生命活动具有重要作用。只有少数的蛋白质独立发挥作用,大多数蛋白质通常通过与其它蛋白质或分子相互......
信息的爆炸性增长导致数据流广泛出现在各个应用领域中,如无线传感器网络数据流、股票交易数据流、电子商务数据流等,如何高效获取......
信用风险管理的目标是使银行信贷业务的风险降到最低,从而保证信贷业务收益最大化,其中信用风险模型在银行的信用风险管理中扮演着......
随着大数据时代的到来,人类在生产生活中产生了越来越多的数据,为了挖掘这些数据中蕴含的知识,许多研究工作开始对不同类型的数据......
新型冠状病毒肺炎(COVID-19)的肆意蔓延对全世界人民的生命和财产安全带来了巨大威胁。胸部CT被认为是新冠肺炎诊断和后续治疗的有效......
静态缺陷定位技术是指依赖缺陷报告、源代码和开发过程中产生的静态信息,为给定的缺陷报告推荐可疑的代码片段。静态缺陷定位技术......
现如今人工智能伴随着机器学习和深度学习等相关技术的快速发展,已经在日常生活、工作中处处发挥着便利我们的作用,但是智能机器进......
宫颈液基薄层细胞学检测(Thinprep cytologic test,TCT)是进行宫颈癌筛查的重要途径。目标检测算法可以辅助医生对TCT切片中的病变细......
神经胶质瘤是成人脑肿瘤中最常见的一种,在原发性脑肿瘤中占据最高的死亡率和患病率。它们可以分为高等级神经胶质瘤(HGG)和低等级神......
无线传感器网络(Wireless Sensor Networks,WSNs)是由大量微型、低功耗、动态协作的传感器节点组成,并采用多跳方式,进行信息传输的......
汽车产品的设计、制造、维护等环节将产生大量的数据,使用机器学习技术挖掘汽车大数据所蕴含的价值,对于推进汽车行业数字化转型具......
学位
近年来,随着人工智能的兴起,无人驾驶技术逐渐成为研究的热门领域。无人驾驶汽车通过传感器感知周围环境,而环境感知主要包括目标......
随着芯片规模的扩大与工艺节点的缩小,后端设计的规则变得越来越复杂,设计周期变得越来越长。布线是后端设计流程中耗时最长的过程......
合成孔径雷达(Synthetic Aperture Radar,SAR)图像舰船识别是海上目标解译的一个重要环节,也是目前研究的一大热点。由于SAR特有的全......
为了有效解决类间相似度高、类内差异化大、数据类别不平衡的皮肤病变识别,提出了基于改进AlexNet的可变形卷积网络皮肤病变识别算......
在高速重载铁路货车快速发展的背景下,铁路货车零部件可靠性备受关注。闸瓦作为基础制动装置中的关键部件,其状态对列车运行有着很......
对用户开展精细化用电行为画像及分类,是电力企业精准掌握用户用电规律、提升服务水平和市场竞争力的关键因素之一.针对当前电力用......
在当下这个数据膨胀的时代,世界各地发生了大量基于信用卡的交易,基于信用卡在线支付中的欺诈行为也急剧增加,这促使银行、信贷机......
作为保障信息安全的一种新手段,信息隐藏近二十几年以来一直受到广泛重视。研究隐写和隐写分析为代表的信息隐藏技术符合国家信息......
信用评估模型在金融机构的借贷决策中起着重要作用。可靠的信用评估模型有利于降低信用分析的成本,减少可能遭受的经济损失风险,帮......
雷达辐射源分选是电子侦察环节的重要内容,信号分选的效果直接决定着电子战局势的发展。随着雷达技术的日益发展,雷达体制逐渐多样......
针对现实信用评估业务中样本类别不平衡和代价敏感的情况,为降低信用风险评估的误分类损失,提出一种基于DESMID-AD动态选择的信用......
随着大数据时代的来临,机器学习作为现代数据分析技术的理论基石,发挥了至关重要的作用,同时也面临着大大小小的挑战。分类问题作......
医学图像分类是医学图像分析中最重要的任务之一,在实际应用中,通常会面临样本集不平衡的问题,即不同类别间的样本数量存在较大差......
在大数据时代,聚类方法作为机器学习与数据挖掘中最重要的方法之一,已经在各行各业都广泛应用。其中,半监督聚类通过增加少量的辅......
随着中国经济的快速发展,提前消费模式受到越来越多的年轻人追捧,个人信用卡的使用愈加频繁,由此造成还款逾期问题,引发商业银行信......
偏标记学习是一种重要的弱监督机器学习框架,它广泛地存在于现实世界的许多应用场景中,比如计算机视觉、互联网、生态信息学等。在......
随着遥感技术的快速发展,遥感影像的获取已不再是困难,遥感数据的质量和数量都呈指数增长。高分辨率遥感影像的语义分割通过对遥感......
多标签分类旨在准确分类出同一个图像中不同物体所属的类别,广泛应用于文本分类、图像识别等实际场景中。多标签分类研究中存在两......
近年来,随着软件工程的发展,软件系统越来越复杂,软件自承认技术债受到了工业界和学术界的极大关注。所谓软件自承认技术债是指在......
计算机网络的开放性、共享性促进了数字化时代的来临,同时网络面临的入侵行为也与日俱增,用户的信息和财产安全得不到保障。入侵检......
如今各种网络攻击层出不穷,对个人和企业乃至国家带来了严重的危害,网络入侵检测方法提供了一种主动的防御措施。随着人工智能技术......
分类的目的在于根据其特征将数据“分门别类”,在数据挖掘中的研究中备受人们的关注。分类问题包含了两个基本过程:学习和分类。在......
伴随着信息技术的迅猛发展,互联网每天都会产生海量的数据。数据分类是信息管理的一种重要手段而文本分类是数据分类中重要的一种......
意见解释分类问题是解释性意见挖掘研究领域的基础问题,对后续的研究工作有着极其重要的影响。本文收集并整理了手机和酒店领域的......
随着信息技术的发展,大量数据得以存储积累,人们进入信息爆炸时代。在大数据世界里,知识就是力量,从这种新的知识中提取规则对传统......