开放集图像识别技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:zqtoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
封闭集假设是大多数基于机器学习的识别算法所使用的假设,即假设测试集中可能出现的物体类别与训练集中存在的物体类别一致。然而当模型面向现实世界进行应用时,模型显然需要具有识别出训练集中不存在的物体类别并将其标注为“未知”的能力,即开放集识别能力。一种常见的处理“未知”类别的方法是在模型训练阶段额外添加“背景”类别或其他类别,为模型提供一定的识别“未知”类别的能力,但是“背景”类别无法穷尽,当在现实应用中出现“背景”类别未能穷举的未知类别时,模型的行为仍然无法预测。模型行为无法预测非常危险,如自动驾驶中出现的未知行为可能导致交通事故的发生,危害人们的财产及生命安全。虽然风险可以通过在训练阶段使用数以万亿字节的数据训练的方式降低,但数以万亿字节的数据仍无法预测并穷尽所有可能的输入,对于这样一个安全性至关重要的系统来说,即使是未知输入上的一小部分错误也可能是致命的,因此一个充分鲁棒的系统必须具有处理未知的输入或未知的类别的能力,从而使系统可以忽略或拒绝未知的输入或未知的类别,即系统应具有开放集识别能力。本论文针对上述开放集识别问题,主要完成了以下三个方面的工作:1.发现并证明了紧致递减概率模型(CAP)不适合直接应用于以卷积神经网络的logits层作为特征提取器的开放集识别算法,并提出了两种消除不适应性的思路。目前,以OpenMax算法为代表的大多数以卷积神经网络的logits层作为特征提取器的开放集识别算法均采用了紧致递减概率模型(CAP)作为其算法构建的基础。CAP模型假定空间中任意测试样本被判定为已知类别的概率随着测试样本与已知样本的距离的增加而减小。这在传统的基于机器学习的开放集识别算法中是可行的,因为算法采用的特征空间通常不具有方向性。然而,卷积神经网络的logits层,作为卷积神经网络的输出层,其所在的特征空间具有强烈的方向性,即样本沿某一方向移动的距离越远则样本被判定为某一类的概率更高。因此,CAP模型不适用于以卷积神经网络的logits层作为特征提取器的开放集识别算法。可以通过两种解决思路消除不适应性:(1)对logits层所在的空间做空间变换,使CAP模型生成的边界可以包含最大分量远大于其他分量的样本。(2)在logits层所在的空间中找到一个理想的高维曲面,恰当地把已知空间K和未知空间O划分开。2.基于思路(1),提出了 OpenSoftMax算法。通过对卷积神经网络的logits层所在的空间做SoftMax变换,使得转换后的空间生成边界。转换后空间中方向性仍然存在,但样本可能出现的位置出现了上限,从而减轻了 CAP模型应用的不适应性。与OpenMax算法相比,OpenSoftMax算法在各不同开放度的数据集上的平均最优准确率提升为15.55%,平均最优F1分数的提升为28.35%。OpenSoftMax方法具有性能强且简单易于实现的优点,但是由于其最优值附近的梯度过于陡峭,OpenSoftMax方法的最优值难以逼近。3.为了探索最优值易于逼近的方法,基于思路(2),提出了边界半封闭的OpenMax 算法(OpenMax with Partial Enclosed Boundrary,OPEB)。由于基于深度神经网络的开放集识别算法采用了 CAP模型,其在特征空间中生成的边界应为圆形、球面或超球面。然而,在一个具有方向性的空间内,合理的分界面应该是半封闭的曲线、曲面或超曲面。OPEB算法给出了拟合此理想分界面的方法。实验可得,OPEB方法其最优值附近梯度较缓,最优值相对易于逼近,与OpenMax算法相比,OPEB算法在各不同开放度的数据集上的平均最优准确率的提升为13.17%,平均最优F1分数的提升为25.7%,在和OpenSoftMax方法的比较中,以最优准确率即最优F1分数为评价标准,OpenSoftMax在开放度较低的数据集中展现出了更好的性能,而OPEB方法在开放度相对较高的数据集中展现出了更好的性能,在不同的应用场景下两者性能互有优劣。
其他文献
学位
网络结构数据的处理是当前数据科学的前沿热点研究方向。与研究较多的静态网络相比,时序网络数据维数更高、结构变化更为灵活,建立相应的数学模型和数值算法更具挑战。本论文聚焦时序网络中的社区发现问题,利用低秩优化理论,建立了时序网络社区发现的极小化凸优化模型,并从社区实时发现的应用需求出发,提出了一种数据驱动的时序标签游走(TLW)算法。具体地,本学位论文的贡献主要包括:一、将静态社区发现的凸优化模型首次
加快乡村振兴建设已成为国民共识,加快建设产业兴旺是乡村振兴的重要基础和前提,完善乡村建设理念直接关系到乡村建设的底色和最终成效。文章通过对海南省政策及现状深入研究,从设计要素出发,提出"七位"体系,全面分析并阐释乡村发展过程中设计策略及实践路径,依托"七位体系"搭建多元乡村发展格局,实现"五通"延展需求,通过设计策略指导实践实现双循环背景下乡村振兴战略多元化发展格局。
在全球范围内,非自杀性自伤已成为一种严重的公共卫生问题,是导致青少年自杀死亡的重要危险因素,预防和治疗异常困难。本文主要描述青少年非自杀性自伤的流行病现状及发病机制,并分别从人口学、个人、家庭、学校、社会等方面进行归纳总结危险因素,探讨其相关机制,为更好的干预提供参考依据。
随着农村人民居住环境的持续改善,一幅幅乡村旅游带动乡村振兴的画卷在神州大地徐徐展开。为推动海南农村的发展,也为加快推进海南国际旅游自贸港的建设发展,支持海南建设成为国际旅游购物中心和具有国际竞争力的旅游天堂,国务院决定在海南省开展离岛旅客免税购物政策试点,目前该政策在促进海南省旅游业态优化调整、体制改革等方面的作用日益明显。因此,文章基于时代发展的营销特点,站在一个新颖时尚的角度,对目前海南免税店
随着时代经济发展,我国机动车和驾驶人数量激增,《道路交通安全法》施行的累积记分制本着完善规范驾驶人管理,为职能部门提供交通管理的依据和支撑,但现行累积记分制仅实施于驾驶人开始暴露出一系列如“买分卖分”、“代扣分”、“交通违法王”等社会现象,对道路交通秩序造成了影响。本文致力于研究对机动车本身并轨实施累积记分制,资料数据主要以贵州省贵阳市为例,采用资料文献分析法、调查问卷及多学科知识交叉运用等方法,
高阶精度方法一般指精度高于二阶的方法。相比于低阶方法,其在给定的误差范围内可以减少一定的自由度,因此更加有效。在对湍流和气动声学等复杂流动问题的直接数值模拟(DNS)和大涡模拟(LES)的求解中,高阶精度方法有更好的分辨率和更高的计算效率。特别地,高阶有限差分方法在处理拥有多个波长的问题时是最理想的。但高阶有限差分方法的一个主要难点在于稳定边界格式的构造。对长时间模拟来说,必须使用误差不会随时间增
作为强平面波电磁背景场狄拉克方程的精确解,Volkov函数是强场量子电动力学(QED)的理论基础。它的正交性是理论具有幺正性以及电荷守恒定律的前提条件,对研究强激光与高能电子相互作用具有重要意义。本论文基于强场QED的唯象学应用,对Volkov函数的正交性问题进行研究。首先,我们构造了三个力学量算符,Volkov函数是它们的本征态。当强平面波背景场满足电磁矢势沿波传播方向上的空间积分值不是与δ(0
图谱理论主要利用图的邻接矩阵、拉普拉斯矩阵、无符号拉普拉斯矩阵和规范拉普拉斯矩阵等矩阵的谱来刻画图的结构.本文主要研究图的谱参数及相关问题,具体内容如下:1.图的能量与匹配数和秩的关系.首先,我们研究了给定匹配数的图的能量上界,并且刻画了极图.然后,我们研究了给定匹配数且圈不交的图的能量下界,并且刻画了极图.最后,我们给出了秩大于4的连通图的能量下界,并且刻画了所有能量小于这个下界的连通图.2.图
学位