面向可解释的软决策树算法的设计与实现

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:warinkeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络在从语言建模、计算机视觉到语音识别等广泛的应用领域取得了巨大的成功。然而,目前,仅凭良好的性能还不足以满足实际部署的需要,在涉及伦理和关键应用的情况下,需要可解释性。目前对于可解释性的研究无法满足需求,深度神经网络的复杂模型使其难以理解和推理预测,这阻碍了其进一步的发展。因此,提高模型的可解释性不仅具有学术意义,更具有现实价值。本文的研究思路是通过集成学习增强可解释系统。依据研究思路,本文首先对可解释性的概念以及重要性进行了阐述,并且对当前可解释性的研究方法进行了分析和总结,接下来对软决策树的决策过程进行进一步解释,并且对当前的集成学习算法进行改进,使得它适合深度学习的模型和数据集的集成,并且对用改进后的集成算法对基于知识蒸馏的软决策树进行改进,获得了基于可解释的树型模型的可解释系统。具体而言,本文工作如下:1.可解释性相关研究的调查与技术总结近年来,关于可解释性的研究逐渐成为新的热点。本文介绍了可解释性的具体概念,人们需要可解释性的原因和具体场景。同时根据现有的研究技术,对可解释性进行了划分:基于获得解释性的时间可以划分为本质可解释性和事后可解释性,基于解释的范围可以划分为全局可解释和局部可解释。并且针对每种可解释的类别简单介绍了有代表性的方法。2.软决策树的决策过程分析通过知识蒸馏生成软决策树是将知识从复杂模型迁移到可解释模型中,使用可解释的软决策树模型模拟复杂模型的行为,从而通过理解软决策树的行为来解释复杂模型。然而当前对于软决策树的解释性研究仍然存在不足。本文提出了对于软决策树多阶段决策的解释,总结了软决策树的特征,分析了内部节点的决策逻辑以及子树的特征,从而回答了决策过程针对什么部分,以及什么样的输入更有左子树和右子树的特征的问题。3.基于权重调整标准的多类噪声数据集校正AdaBoost目前的集成学习算法通常用于将弱分类器组合起来生成强分类器。其中AdaBoost是集成学习的代表性算法之一,对于性能很好的分类器也能有效集成。然而,AdaBoost算法对于数据中的噪点很敏感,然而噪点在数据集中出现的非常普遍,因此实际问题中的性能不够理想。因此,本文提出了一种抗噪点的集成模型的算法改进思路,其核心思想在于:通过基于当前分类器的精度设置分配给样本的权重的上限,来抑制噪点样本对于整个训练过程的影响,最终改善集成学习在多噪点数据集中的性能。实验证明该算法在数据集规模较大或模型较复杂的情况下预测精度有非常明显的提升,适合对于深度学习的模型和数据集的集成。4.基于知识蒸馏生成高保真度的软决策树集成系统尽管可解释模型已经被用于模拟复杂模型的行为,但是由于生成的可解释模型在预测精度和保真度上都不足够高,很难令人信服可解释模型的解释规则能够模拟复杂模型。本文将上一部分的集成学习算法与可解释模型软决策树结合起来,使用知识蒸馏的方法生成软决策树,将表现不够好的软决策树作为弱分类器集成为性能优良的强分类器。其目的获得精度和保真度更高的软决策树系统,使得它能够更好地模拟复杂模型的行为。
其他文献
空间目标监视雷达与地基精密跟踪成像雷达是外层空间信息感知的重要手段,相较于二维逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)成像,其对空间目标观测形成的三维ISAR图像能够更加真实地反映目标散射点的实际三维分布结构,在判别空间目标类型、分析目标重要结构、推断目标功能属性方面发挥着不可替代的作用。空间目标监视雷达在实际工作过程中同时承担了搜索、跟踪、定轨
学位
目前为止,视觉是人类感知世界的重要方式之一。事件相机是一种生物启发式的视觉传感器,其工作原理与传统相机截然不同。传统相机按照固定帧频率拍摄图像;事件相机捕捉像素级的亮度变化,其输出具有稀疏性和异步性。受益于其独特的工作方式,相比于传统相机,事件相机拥有高时间分辨率、低延迟、高动态范围、低能耗等诸多优点,在高速运动、光照条件较差以及工作平台资源有限等具有挑战的环境下更具有性能优势。在消费电子、工业自
学位
随着限制性条件下人脸识别技术研究的不断深入研究,这项技术也愈加趋向于成熟,且准确率颇高。然而在非限制性条件下,由于光照、表情、遮挡、姿态等外界因素的不可控,会导致人脸识别的性能下降,其中姿态变化由于会带来面部的刚性形变,影响人脸的对称性与完整性,是人脸识别中遇到的首要瓶颈所在。在此背景下,本文针对姿态变化导致的人脸识别准确率下降的问题,研究从单一姿态的人脸图像中生成多姿态人脸图像,并设计了基于注意
学位
知识图谱作为一种结构化的信息,已被广泛应用于搜索引擎、问答系统等自然语言处理应用中。为了满足日益增加的世界知识,自然语言处理领域的研究者们致力于探索高效地自动获取世界知识的办法,那便是关系抽取技术。传统的关系抽取采用了管道式的抽取方法,首先识别出文本中的所有实体,再将实体两两组合,判别实体对所属的关系。管道式抽取方法忽略了命名实体识别和关系分类两个任务之间的紧密联系和相互作用,且实体识别的误差会传
学位
随着天基系统任务的功能需求越来越复杂、响应时间越来越短,基于传统卫星开发方法搭建的天基系统中卫星功能固化、软硬件过耦合、资源分配不均衡、卫星任务协同难度大、开发自动化程度低,应对新的任务难以提供智能和高效的解决方案。本文对面向任务的天基系统软件集成开发的关键技术开展了研究,主要研究内容如下:(1)针对卫星功能固化、软硬件过耦合的问题,对传统卫星软件体系架构进行优化,是软件集成开发的结构基础。基于轻
学位
在网络和分布式系统中,网络协议是实现节点间有序数据交互的关键。传统的三层以上协议多基于软件实现。但随着5G、TSN等新型通信技术的出现与发展,网络和分布式系统对数据处理性能提出了更高的要求,这促使硬件加速协议处理成为协议实现的重要方式。例如,微软、Xilinx将TCP卸载到硬件上提升吞吐量。伴随着大量新型通信技术的涌现,协议的复杂程度不断提升。在过去的工作中,硬件加速协议处理常采用有限状态机模型,
学位
对于卫星这一类小子样、高可靠性、长寿命的航天产品,有效的可靠性评估是确保航天器安全运行、航天任务顺利实施的重要基础。作为卫星可靠性分析的必要内容,卫星平台的剩余寿命(remaining useful life,RUL)预测往往面临试验数据少的问题,无法保证评估结果的准确性。本文针对工程应用的实际需求,基于贝叶斯理论,对融合卫星平台多源信息的系统级RUL预测方法进行分析讨论,具体从以下三个方面开展了
学位
轻量级分组密码作为现代密码学的重要部分,因其实现代价小、易于标准化、运行速度快、吞吐量大等特点,被广泛应用于物联网设备的安全机制中。故障分析作为分析轻量级分组密码的重要方法之一,攻击者通过激光、电磁场、时钟毛刺等方式向密码设备注入故障,获得错误输出,然后基于分析错误输出中包含的信息,即可用较低的代价破译密码算法。该攻击方式不仅容易实现,且攻击威力大,因此故障攻击可以有效检测物联网中密码算法的安全性
学位
联邦学习作为一种具有保护训练数据隐私特点的分布式模型训练方法受到了广泛关注。然而,已有研究表明,由于本地模型更新中不可避免的包含了训练数据的信息,可被攻击者利用,以此来窥探本地训练数据特征。本地化差分隐私机制是一类广受关注的数据隐私保护方法。然而,本地化差分隐私机制如何高效应用于联邦学习、对数据添加满足本地化差分隐私的扰动会对联邦学习性能(收敛性及训练精度)带来何种影响、以及扰动后的联邦学习系统抵
学位
食品快速检测工作越来越贴近广大老百姓的生活,这也是市场监管部门积极推进的一种食品安全监督管理的工作模式。在食品快速检测工作中,盲样制备作为前置环节,其盲样质量直接影响后续的检测结果。本文梳理分析了盲样制备工作中存在的一些问题,提出了改进措施与建议。
期刊