面向多目标的DNN模型诱导输入的生成研究及系统实现

来源 :江苏大学 | 被引量 : 0次 | 上传用户:hastenhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着社会的进步,计算机科学已经步入了人们的生活,因此,各种各样的智能系统被应用到人们的实际生活中,如自动驾驶汽车系统等。然而,这种系统的正确性和可预测性是至关重要的,尤其在角落案例的情况下。因此如何为深度学习(Deep Learning,DL)系统自动的生成测试输入成为软件测试领域研究的重点。为了将传统软件测试方法应用到DL系统,测试方法Deep Xplore被提出来,但是,该方法存在以下两个缺陷:第一,该方法在定义不同的DNN(Deep Neuron Network)模型对于同一个测试输入表现出的差异行为时,没有考虑不同DNN模型自身还存在着差异行为;第二,在做联合优化的过程中,仅仅提高神经元覆盖率是不能够充分的指导测试输入的生成,没有需要考虑DNN中每一层的神经元的覆盖率的情况。为了解决这两个缺陷,本文重新定义了不同DNN模型之间的差异行为,还引入了神经元覆盖系数来考虑隐层神经元的覆盖情况,最后,现了一个测试输入生成、分析原型系统并进行了实验验证。实验结果表明本文定义的差异行为以及神经元覆盖系数能够获得更具有多样性的测试输入。本文的主要工作如下:(1)本文重新定义了不同DNN之间的差异行为,然后又定义了神经元覆盖系数,提出了新的DNN模型的测试框架Deep Gradient。首先,本文在定义差异行为时是先将一组测试输入输入到被测DNN中,然后通过添加特定领域的约束条件,再次输入到被测的DNN中,利用两次获得的神经元输出的差值的绝对值来衡量不同DNN模型之间的差异行为。接着,为了考虑DNN模型隐层神经元的覆盖率情况,又定义了神经元覆盖系数的概念,这样可以使得获得的测试输入更具有多样性。最后,本文将测试输入的生成问题表示为一个三个目标的优化问题,通过构建损失函数再利用梯度上升算法求解该优化问题。本文进行了一系列的实验评估了该方法,发现通过重新定义不同DNN模型之间的差异行为和引入神经元覆盖系数,确实能够产生更具有多样性的测试输入。(2)为了解决Deep Gradient框架之下的三个目标的优化问题,本研究联想到计算机领域还有更直接的多目标优化算法,因此在Deep Gradient方法的框架之下提出了DEEP-NGSA方法,该方法的引入主要是避免多个超参数的调参问题,由于在调参过程中很难找到合适的参数去求损失函数的最值。因此,利用多目标优化算法直接优化差异行为,神经元覆盖率,神经元覆盖系数就更为直接。本研究通过一系列的实验评估了该方法,该方法在维持了Deep Xplore和Deep Gradient两个方法的效率之下,同样可以生成具有多样性的测试输入,符合我们预期的目标。(3)设计并实现了基于上述两个算法和RT、Adversarial Testing和Deep Xplore的DNN模型的测试输入生成的原型系统(DNNTESTING_SY)。本文介绍了DNNTESTING_SY的整体架构设计和测试流程,展示了测试原型系统的界面设计,并对DNNTESTING_SY的3个主要功能模块进行了详细的说明。调试后,DNNTESTING_SY能够实现自动化测试。
其他文献
辣椒疫霉菌(Phytophthora capsici)是危害自然界蔬菜产量的一种毁灭性病菌,可危害多种蔬菜和作物,给全世界蔬菜种植产区带来了巨大压力,开发新型安全的生物防治方法迫在眉睫。白屈菜红碱于常见植物白屈菜中提取得到,属于生物碱中的苯并菲啶季胺碱,对于其在农学上抑制植物病害发生发展的方面已有研究,而目前还未应用于卵菌病害的防治方面。本论文以辣椒疫霉菌为研究对象,从分离鉴定、白屈菜红碱对其体外
学位
自“人工智能+教育”的发展战略被提出,涌现出了一批优秀的数学领域智能教育产品,这些产品的底层都依赖于知识点标注精准的试题数据。然而,现有的知识点标注工作大多仍停留在手工标注阶段,不仅费时费力,而且易出现漏标、误标等现象。数学题目自动标注可提高知识点标注效率,具有推动社会生产力发展的积极意义,但此项工作还少有人研究。因此,如何利用数学领域知识特点,构建精准高效的数学题目自动标注系统,是本文研究的一个
学位
哮喘病是世界上最常见的慢性病之一,因其患病人数多且难以根治给社会造成巨大影响。血常规数据可以用来辅助诊断哮喘病,有效提高医生诊断效率。但血常规数据集正负样本比例失衡及特征冗余问题,会影响哮喘病预测模型精度。针对以上问题,本文研究基于改进的过采样算法解决数据集正负样本比例失衡问题;采用改进的特征选择算法进行特征提取;设计并开发面向哮喘病的辅助诊断系统。具体工作如下:(1)针对血常规数据正负样本比例失
学位
柔性作业车间调度(Flexible Job Shop Scheduling Problem,FJSP)是实现制造业高效率、柔性化、高品质和低成本的关键,具有重要的理论和实践意义。传统柔性作业车间调度只专注于单一目标,难以满足当前制造业的需求。多目标优化算法因可同时优化多个目标而被广泛用于解决柔性作业车间调度问题。当前基于多目标优化的柔性作业车间调度方法仍存在面对多个目标时调度方案多样性缺失、算法易
学位
自2008年中本聪的比特币白皮书发表以来,历经多年快速发展,区块链技术已经慢慢成为解决数据的存储安全、传输安全、点对点交易的财产安全等问题的最高频的解决方案之一。随着区块链技术广泛应用于各个行业,其软件架构更加复杂,随之而来的是一系列安全问题,如女巫攻击、双花攻击、自私挖矿等给行业和用户带来了巨大损失,因此如何解决区块链系统安全问题,成为一个值得研究的方向。模型检测是保障软件可靠性的一个有力工具,
学位
随着自然语言处理技术地发展,医疗问答受到越来越多的关注,多种医疗问答模型层出不穷。其中,使用医疗知识图谱的信息增强问答对表示的方法是一个新颖且值得研究的领域,能帮助模型在文本处理的同时考虑到医疗实体间的内在联系。现有的融合知识图谱的问答匹配模型将问句和答句及其实体通过注意力压缩成两个向量进行匹配,忽视了问答对之间细粒度的交互信息。此外,在真实场景下人们语言表达中经常出现冗余词和噪声词,影响问答匹配
学位
造血作用是一个重要的生物学过程,影响个体正常的生长发育。黑腹果蝇是生物学研究中重要的模式生物之一,具有容易饲养、体型小、子代多和遗传背景明确等优点。果蝇与哺乳动物造血系统在调节因子和信号转导通路之间存在相似性,因此已经成为研究哺乳动物造血疾病的理想模型。Spen蛋白具有调节细胞周期、神经元细胞命运和神经元突起延伸等功能。Spen家族蛋白从90 k Da到600 k Da大小不等,主要包含三个RRM
学位
帮助阐释世界的语义信息通常来自不同的模态,而信息时代可以更方便地访问文本、图像等多模态数据。因此,让人工智能处理多模态信息,建立能够处理和联系多种模态信息的模型,是人工智能领域一个潜力非凡的研究。近年来,利用深度学习的方法对多模态数据进行分析处理已逐渐成为一种趋势。但鉴于数据的异质性,研究者需要探讨如何构建共同的潜在空间来捕获模态间的语义相关性。因此,本文结合多模态数据的挑战及多模态数据集自身特点
学位
铁是生命必需的微量元素,广泛存在于细胞代谢过程中,是许多蛋白质和酶的辅基成分,细胞中多种生物反应过程均依赖于铁的辅助。线粒体是铁代谢的重要场所,线粒体转铁蛋白1(MFRN1)主要负责将细胞质中的铁转运至线粒体中用于血红素和铁硫簇的合成,并与其他铁蛋白一起维护铁稳态。铁稳态失衡会导致线粒体功能障碍,影响机体的正常生理功能,是恶性肿瘤细胞的代谢特征之一,可能与一些疾病的发病机制有关。因此,对线粒体铁代
学位
非洲猪瘟(African swine fever,ASF)是由非洲猪瘟病毒(African swine fever virus,ASFV)感染家猪和野猪引起的一种高度致命性传染病。其特征是发病过程短,感染后死亡率高达100%。非洲猪瘟于2018年传入我国并持续至今,对我国养猪业造成了严重的影响。由于目前尚无商品化疫苗和有效的治疗药物,只能通过严格的生物安全措施来防控非洲猪瘟。因此,探寻一种能够预防
学位