数据不平衡相关论文
脉象识别是中医客观化、智能化的重要组成部分,这种无创、快速的诊断方法具有巨大的临床价值,然而数据不平衡和特征提取繁杂仍是具有......
高级持续性威胁(Advanced Persistent Threat,APT)是当前最为严重的网络安全威胁之一.DNS隐蔽信道(DNS Covert Channel,DCC)由于其泛在......
针对风机叶片结冰故障检测中状态数据维度高和检测率低的问题,提出1种使用功率数据驱动的多尺度排列熵(multiscale permutation entr......
氨是化工生产和农业生产重要的物质,常用合成氨工艺的手段获取,而合成氨工艺过程容易产生爆炸和有毒气体,对此我们需要对合成氨工......
二维(2D)医学图像分割在疾病诊断和计算机辅助治疗中具有重要作用.针对2D医学图像由于目标大小、形状不一以及边界模糊而难以精确分......
用户的重复购买行为一直是电商领域的研究热点。近年来电子商务平台快速发展,为人们购买商品提供了很大的便利性。然而随着入驻商......
随着基因测序技术的发展和人们对精准医学认知的加深,基因组学数据呈现爆发式增长。受到样本来源与质量、实验方法与操作、文库质......
随着计算机技术的不断发展,网络中的数据呈现出复杂、庞大、冗余且多维的特性。为提高基于深度学习的入侵检测系统的检测性能,提出基......
冷水机组作为暖通空调系统的一个核心组成部分,为整个系统的高效、稳定运行提供了基础条件。但是,在冷水机组的实际运行过程中,由......
随着互联网技术的发展,网络给人们的日常生活带来了极大的便利,但复杂的网络架构使得网络的维护工作越来越困难,网络服务提供者需......
近年来互联网消费信贷业务快速增长,但同时由于信贷业务的特殊性,存在数据不平衡问题,并且目前的相关研究普遍将违约预测作为二分......
数字货币作为一款新兴的投资产品,由于其良好的技术应用前景和较高的投资回报率,在交易市场受到追捧。与其他投资产品一样,市场迫......
近年来,人们饮食不规律和生活作息紊乱等现象使肝脏承担着巨大的压力,因此肝脏出现问题的病患也越来越多。在手术规划系统中,肝脏C......
随着我国经济体制改革的深入以及民营金融的合法化,小额贷款业务成为我国信贷市场的重要组成部分和补充力量。自2008年银监会和中......
随着经济全球化的进程,金融活动日益活跃,洗钱犯罪行为也日益猖獗。而银行作为金融活动的主要机构,是洗钱的主要渠道,因此建立一套......
互联网技术的不断普及,给人们带来了便利的同时也带来了挑战。由于网络安全事件的频繁发生,急需构建高效的流量异常检测模型并将其......
随着人工智能技术的发展以及司法数据的公开,司法领域的人工智能研究与应用受到了广泛关注。罪名预测作为法律判决预测中一个重要......
降水相态是指地面降水的形态,可分为雨、雪、冻雨、雨夹雪等多种类型。传统的观测方式是在观测站点以人工观测为主,在无地面观测的......
针对汽车零部件质检数据存在合格品与不合格品数量不平衡的问题,提出了基于密度聚类与多工序制造特征的MCDC-MF-SMOTE质检数据过采......
我国高校教育扶贫工作是国家精准扶贫政策中一项重要的内容。目前,国家教育扶贫工作主要包括贫困生的资格认定和贫困生贫困等级的......
针对SAR图像舰船目标识别中存在的数据不平衡问题提出了一种基于批内平衡采样和模型微调的两阶段迁移学习方法。首先使用批内平衡......
Web服务在网络服务中得到了广泛的应用,因此也成为了不法分子的主要攻击对象.现阶段针对Web攻击的检测技术可分为误用检测与异常检......
互联网已成为一个重要的信息和资源共享平台,互联网用户不仅可以在网上处理各种事务,还可以在网上搜索自己想要的信息。给定一个具......
本文针对机器学习中的数据不平衡问题进行研究,提出了一种均衡采样的方法。该方法采取过采样和欠采样相结合的策略,使少数类数据增......
发现和修正软件缺陷一直是软件开发与维护最昂贵的活动,因此软件缺陷预测是软件工程领域的一个重要研究方向,特别是用于解决现有工业......
近年来,随着动作识别技术在现实应用中需求的不断增加,该技术成为了计算机视觉领域的研究热点。通过对熊猫素材进行动作识别与分类......
膜蛋白的类型对于了解其结构和功能具有重要意义。随着后基因组时代的到来,传统的通过生物实验进行膜蛋白类型预测的方法逐渐不再......
在人类基因组中,非编码序列占基因组序列的90%以上,micro RNA(miRNA)作为一类非编码RNA在细胞分化和组织发育中具有重要的调控作用......
近年来,在线社交活动与日俱增,越来越多的人倾向于在网络上发表意见和表达情感,与之而来的在线评论数据也日益繁多。通过对这些数......
P2P网络借贷平台,简称P2P,是互联网金融的一种重要形式。P2P作为一个平台连接了两类群体,一类群体需要筹集资金,另一类群体有闲置......
随着网络文本数据日益增长,文本之间错综复杂的关系也亟待梳理,但庞大的数据量和专业的领域知识,令人工确定文本之间的关系非常困......
锚链由许多个链环连接而成,是用来缓冲船舶与海洋工程平台所受外力的重要装置,其质量的优劣往往会影响到相关人员的生命和财产安全......
自然语言理解作为任务型人机对话系统中一个重要的组成部分,一般包含领域识别、意图识别和语义标注三个部分,其中领域识别作为自然......
微博能让用户快速获取各方面的言论,是国内最受用户欢迎的社交平台之一。微博的时效性、多元化等特点吸引着众多网民,但同时微博谣......
在现代工业生产中机械设备的智能化程度不断提高,这些设备在大幅提高生产效率的同时也带来了维护上的困难。现实中即使是一个不明......
车载热成像行人检测系统通过热成像传感器获取场景信息,使用模式识别技术检测道路场景中的行人。现有的方法多将图像行人与背景作......
病虫害危害植物生长是现代经济作物生产、植物栽培面临的重要不利因素。具有抗逆基因的植物对于恶劣环境有着良好的适应性,因此对......
信用贷款作为当前被大众接受最广的一种贷款模式,其发展规模不仅决定了金融机构的资金发展水平,同时也为客户生产生活提供了巨大的......
随着科学技术的发展,我国正处在医疗数据信息化的高速发展阶段。医疗数据的指数式增长及医疗平台的发展,使得医疗数据的获取日益便......
实体是现实世界中数据和信息的主要载体,通过对实体的语义内容、属性特征和内在联系等有价值的信息进行挖掘,可以解决大数据分析中......
大于胎龄儿(LGA)是指出生体重在相同胎龄平均体重的第90百分位以上的新生儿。体重过高的新生儿表现出严重的新生儿和产妇并发症。......
数值预测一直是机器学习中一类重要的任务,但准确度的提高始终是一个普遍存在的难题.本文简要地阐述了机器学习的建模过程,对比了......
摘 要:针对朴素贝叶斯算法在处理不平衡数据时准确率不高的问题,提出类权重和属性值权重相结合的双重加权朴素贝叶斯算法.双重加权可......
基于软件大数据的自动化缺陷检测模型已成为缺陷发现的重要工具.针对软件大数据中,被准确标定的缺陷样本稀少,且漏标、误标率高,导......
服务器部件检测是智能产线装配过程的重要环节。目前,服务器装配的检测步骤主要还是以人工为主,针对传统人工检测存在的工作效率低......
在求解多目标整数规划的加权方法中,交互式方法虽然考虑了决策者的偏好,但计算量较大;非交互式方法计算量虽小,但没有考虑决策者的偏好......