论文部分内容阅读
训练样本集在模式识别问题中起着重要的作用,它是分类器“知识”的基本来源,直接影响分类器的训练结果和识别系统的综合性能。为了减轻冗余数据对分类器训练和系统维护所带来的负面影响,该文在采样定理的启发下,遵循理想训练样本集所须满足的三个基本性质:遍历性、相容性和致密性,针对大数据量原始样本集,提出了一种基于频度统计重抽样手段构造精简训练样本集的方法。试验表明,该方法能够在保证分类器性能的前提下,有效减少冗余样本,降低计算代价和分类器复杂度。