过采样方法相关论文
为了解决正负样本不均衡分布造成的分类边界偏移,训练模型对少数类样本学习不充分的问题,提出了融合条件熵和TFIDF的HTTE过采样方......
不平衡数据的分类问题一直是机器学习与数据挖掘的共同课题。在传统的学习过程中,分类器大多在不平衡比例接近1的数据集上进行分类......
随着大数据时代的到来,数据规模急剧扩增且类型错综复杂,人们获得的数据大部分是在不同类别上的数目比例相差悬殊的不平衡数据。不......
蛋白质是一种有机大分子,是生命的物质基础,是构成细胞、承载生命活动的基本有机物。在蛋白质翻译过程中,氨基酸相互连接形成肽链,......
近年来,不平衡数据的分类问题经常出现在各种分类和预测问题中,已经成为数据挖掘和机器学习领域中的一个重要研究方向。不平衡数据通......
随着网络技术和应用的迅速发展,视频流量成为互联网中增长最快的流量类型,其占据了网络流量的大部分。快速增长的视频流量对互联网......
在许多场景和应用领域中,不均衡数据学习是一个常见并且长期存在的问题。例如在实际生活中电信管理,信用卡欺诈检测,诊断数据中的......
针对由于网络流量数据不平衡而导致入侵检测模型检测率低的问题,提出了一种基于聚类和实例硬度的入侵检测过采样方法(CHO)。首先,......
目前,对电力系统综合测量装置的研究主要是在数据处理这一环节上.该文对电力系统基本电气量的测量算法、电力系统频率的测量算法和......
针对传统的合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)在类别区域重合的数据集应用时,可能产生多个......
在对样本分布不均衡的数据进行预测分类时,样本均衡化往往是最重要的一步,而不同的均衡化方法产生的结果不同。对于“少数类”样本......
蛋白质在生命过程中扮演着重要的角色,与许多疾病有着密不可分的关系。随着测序技术的不断发展,蛋白质序列信息呈现爆发性增长,但......