基于噪音Oracle的模型未知错误识别研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:owenzikao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着以深度学习为代表的机器学习技术在学术界和工业界的不断发展与进步,研究人员训练出来的模型已经能够在多个领域能够该领域的专家,如图像识别、围棋、语音识别等。但是深度学习这类需要大量高质量有标签数据支持的技术,往往在一些数据量少或标注成本昂贵的任务上无法取得较好的预期效果,比如医疗诊断或者小语种机器翻译任务等。在这些任务中,由于训练时所收集到的数据和现实环境数据在分布上存在较大的偏差,导致训练出来的模型对于一些样本识别错误非常严重——识别错误的同时给予了这次识别非常高的置信度。这类被严重预测错误的样本被称作为模型的未知错误(Unknown Unknowns),这类错误对高风险任务(如医疗诊断)会造成灾难性后果。因此,对模型的未知错误进行识别和分析是非常必要的。由于未知错误是模型无法感知到的一类错误,因此现有的识别算法都依赖于第三方人工标注系统Oracle,即利用人工做最后的标注工作。而现有已提出的算法都是假设Oracle返回的标签是百分之百正确的,这在实际应用中并不现实。尤其是当识别算法基于众包(Crowdsourcing)等常规标注系统时,Oracle返回的标注结果往往带有一定的噪音,即有可能返回错误的标注结果。这些错误标注会导致识别算法将模型预测正确的样本认做是未知错误,这些伪未知错误的存在会对识别算法产生巨大的影响,包括降低最终识别出来的未知错误质量以及对识别过程造成误导。为此,本文将基于噪音Oracle对模型的未知错误进行识别和分析,试图在有限的预算下提高模型未知错误的识别率和准确率。归纳而言,本文的贡献有以下几点:1)本文指出和分析了传统识别模型未知错误算法在噪音Oracle下的局限性,这些局限性包括:识别出来的未知错误质量低以及算法在识别过程中容易受错误标注影响。并对已有效用函数进行扩展,提出了一种适用于噪音Oracle下识别未知错误的新效用函数。2)本文提出了两种高效的识别未知错误算法,包括基于动态最近邻算法和基于标签传播算法。实验验证了我们提出的两种算法在识别未知错误的有效性和在噪音Oracle下的抗噪性都优于已有的算法。此外,本文还设计并实现了一套模型未知错误自动化识别系统,能够在未标注数据中结合研究人员的自我标注快速找到大量有价值数据,方便理解模型的缺陷和后续模型的改善。
其他文献
在进行地震波模拟计算的过程中用有限的计算区域模拟地下无限空间,需要进行边界截断。为了在边界处不产生虚假反射影响模拟结果,需要引入吸收边界条件。完全匹配层是目前吸收
目的:阿尔茨海默病(Alzheimer’s disease,AD)是一种进展性神经系统退行性疾病,其主要病理改变为淀粉样β(Aβ)蛋白沉积和神经纤维缠结,其他变化包括小胶质增生和神经元、白质和
明清時期的學者們,就已經注意到《說文解字》中引用的經文和該時期經典用字不同的情況,柳榮宗的《說文引經考異》就在這種背景下應時而生。《說文引經考異》通過廣泛徵引文獻
近年来,分数阶控制系统成为了控制领域的研究热点之一。一方面,许多的物理系统和自然现象能够被分数阶微分方程更加全面、更准确地刻画出来。另一方面,随着分数阶微分器的物
功能项目为了满足学生交际的需要应运而生,以立项原则为出发点,对学生交际中经常使用的句式进行归类整理,提高学生在不同情境下使用特定句式的准确性,而“劝告”功能项目在汉
本文首先以博落回茎叶为原料,对其中4种生物碱的检测方法进行方法学考察,检测不同产地原料中4种生物碱的含量,并对其差异进行分析,建立了博落回茎叶特征图谱。其次对比酸水渗
滤波器和天线作为通信设备中两个必不可少的微波器件,两者的性能直接影响设备性能的好坏。传统的方法是分开设计滤波器和天线并进行匹配连接,不过这种方法不利于设备的小型化
航空遥感具有机动灵活、覆盖范围广、空间分辨率高等特点;而高光谱遥感具有极高的光谱分辨率,在可见光范围内可分布高达两百多个波段,包含有大量的信息,在海洋应用上具有极大
随着小小区密集化和支持缓存的智能设备的出现,移动边缘缓存被认为是减轻核心网络流量负担的一种重要技术。在这种场景下,流行的内容被预取并存储在小型基站(Small Base Station,SBS)或用户设备中。然而,由于人为因素,内容流行度可能会随时间动态变化。本文考虑内容流行度变化,研究了D2D(Device-to-Device)辅助蜂窝网络中的协作缓存问题,首先对研究背景及意义进行了概述,详细分
论文题目为“浅谈观看方式的演变——从功能性的角度讨论图像视点制式的变化”,其核心是在探讨“视点”、“投影”、“观者”三者的关系,核心是视点制式——在创作和理论之间