论文部分内容阅读
增广类别学习(Learning with Augmented Class,LAC)是应对开放动态环境问题的重要方法,而大多数现实应用都面临着开放动态环境的问题,因此LAC方法的研究有着重要的现实意义。以往的LAC算法都基于传统机器学习算法,其使用的特征通常是人为设计的,往往不够抽象和完备,这将会导致算法在特征利用方面受到局限。由于深度学习算法在提取抽象完备的特征方面有着巨大的优势,其经常被用作传统机器学习算法的特征提取前端来提升算法性能。所以,本文使用深度学习方法来帮助解决增广类别学习问题。本文提出基于深度学习的标记置信度传播算法(Label Confidence Propagation based on Deep Learning,DL-LCP),通过利用深度学习方法来改进原有的标记置信度传播(Label Confidence Propagation,LCP)算法从而提升分类性能。相对于LCP算法,DL-LCP使用了更为抽象完备的特征来进行标记置信度初始化和标记传播,减少了LCP算法在模型训练过程中的噪声累积,从而提升算法性能。具体地,本文提出散度损失(Scatter Loss)来充分利用所有的训练数据(包括有标记数据和无标记数据)学习一种具有“使同类的样本更接近而异类样本更加分开”的属性的特征表示。这种特征表示能够使已知类别的样本聚集而增广类别的样本分散在更广阔的开放空间中,从而增强特征的判别性。实验结果表明DL-LCP算法相比于LCP算法和同领域的其他算法在多个不同规模的数据集上都有着明显的提升。此外,为了进一步体现LAC方法的工程实践价值和验证DL-LCP算法在现实应用中的实际效果,本文设计并实现了以DL-LCP算法为核心的图像分类标注工具OpenLabel。然后对OpenLabel的功能及性能进行了充分的测试,结果表明该标注工具在开放动态的现实环境中呈现了良好的类别预测性能和相对较高的标注效率。