论文部分内容阅读
基于数据分布的不平衡数据混合采样研究
【摘 要】
:
数据不平衡问题是目前的研究热点之一,其广泛存在于疾病检测、金融欺诈、入侵检测等众多领域。不平衡数据的主要特点为少数类样本少且难以识别,但往往又具有较高的价值。所以,解决数据不平衡问题应在不影响总体准确率的前提下提高少数类样本的识别率。目前数据不平衡问题的处理方法主要为数据层面方法和算法层面方法,数据层面的欠采样和过采样是有效的不平衡数据处理方法,但单独的欠采样方法易丢失有价值信息,单独的过采样方法
【机 构】
:
山西财经大学
【出 处】
:
山西财经大学
【发表日期】
:
2021年01期
【基金项目】
:
其他文献