论文部分内容阅读
主动学习解决了因训练样本过大而导致需要大量人力物力的问题,核心问题是如何选择有价值的样本减少标注成本。以神经网络为分类器,大多数方法选择信息量大的样本并没有考虑所选择样本间的信息冗余问题。通过对冗余问题的研究,提出一种降低信息冗余的样本选择优化方法。用不确定性方法选出信息量大的样本构成候选样本集,同时用网络中计算的潜变量向量表示样本信息,利用该向量计算候选样本间的余弦距离选择出间隔距离大、信息冗余度低的子集。在Mnist、Fashion-mnist,以及Cifar-10数据集中与几种不确定性方法相比