【摘 要】
:
卷积神经网络已经成为许多计算机视觉任务的重要组成部分,如图像分类、物体检测、图像生成等,然而近几年兴起的胶囊神经网络相比较传统的卷积网络来说,具有能够捕捉物体不同组成部分之间的空间层级关系的特点,因此在诸如旋转、缩放甚至重叠的物体识别上具有更好的分类精度.但是与传统的卷积神经网络一样,胶囊网络也容易受到对抗性攻击的影响,造成网络输出不可信的预测结果,这阻碍着神经网络在医疗、安防等关键领域的部署,因
论文部分内容阅读
卷积神经网络已经成为许多计算机视觉任务的重要组成部分,如图像分类、物体检测、图像生成等,然而近几年兴起的胶囊神经网络相比较传统的卷积网络来说,具有能够捕捉物体不同组成部分之间的空间层级关系的特点,因此在诸如旋转、缩放甚至重叠的物体识别上具有更好的分类精度.但是与传统的卷积神经网络一样,胶囊网络也容易受到对抗性攻击的影响,造成网络输出不可信的预测结果,这阻碍着神经网络在医疗、安防等关键领域的部署,因此研究胶囊网络的对抗鲁棒性和预测精度将能够促进其在实际生产生活中的应用.本文我们从两个方面研究胶囊网络,一方面我们针对胶囊网络的对抗鲁棒性,提出了基于Lipschitz常数约束的正则化方法,并利用对抗训练方法来训练一个更加鲁棒的胶囊网络.相比较其它改进模型而言,我们的方法计算简便,对胶囊网络没有结构上的变动,保留了原始模型的特点.实验结果显示,改进后的模型在MNIST、SVHN等数据集上实现了鲁棒性的提升,尤其是在Fashion-MNIST数据集上,当在较强的攻击算法下,相比较当前已有的模型,对抗样本的预测精度提升可达8%.另一方面,我们研究了胶囊网络的分类准确率问题.我们从胶囊网络本身的特点出发,将对比学习方法结合到网络的训练过程中,并利用胶囊网络的重构模块,将重构的样本做为正样本,来获得更丰富的增强样本,从而提高了网络的预测精度.相比较已有的方法而言,我们的模型结构简单,具有更好的泛化性.实验结果显示,在MNIST及EMNIST等数据集上取得了更好的预测精度.
其他文献
本篇报告是一篇关于机器翻译加译后编辑模式下的翻译实践报告。原文选自《泡沫灭火系统设计规范条文说明》的前两章。该文本是中国公司为援助柬埔寨消防建设,根据相关中国标准编写的文件,需要翻译成英文供柬埔寨相关部门作为该国国家标准借鉴使用。该项目旨在提高目标读者对消防规范的了解,并在翻译过程中提供有效的翻译策略。原文用词准确、严谨、逻辑性强,内容存在较多数字和表格,属于典型的信息型文本。在译后编辑过程中,通
目前,各种知识库中存储了海量的生物医学文本,其数量还在呈指数增长。这些文献是生物医学技术发展的结晶,通过信息抽取技术挖掘隐藏在生物医学文本中的有用知识是一个重要的研究课题。实体关系抽取是信息抽取的一个关键子任务,它在命名实体识别的基础上,把包含实体对的文本分类到预先定义好的关系类型中。目前,面向生物医学文本的实体关系抽取研究致力于通过构建深度学习模型来自动地从无结构化的生物医学文本中抽取出结构化的
随着司法体制改革的不断纵深发展,法律文书数字化的程度不断提高,网络上可获得的法律文本信息实现了指数级的增长。但不同种类的法律文本书写规范相异较多,难以通过规则直接进行文档理解和知识分析。因此越来越多的研究者将自然语言处理技术应用到法律文本,通过信息抽取将非结构化的文本转化为结构化的数据,促进了司法信息化发展,提高了司法效率。信息抽取包括命名实体识别、关系抽取和事件抽取,目的在于抽取出文本中的实体关
情感是人类心理最基本的组成部分之一,对人类的情感进行分析有助于判断个体的认知及行为,有着广泛的应用场景。由于人类实际上是结合多种信息去判断他人的情感的,那么采用多模态深度学习开展情感分析工作成为了理所当然的选择。虽然引入多模态信息提高了情感预测的性能,但与此同时也引发了诸多呈待解决的新问题。而这些问题,本质上都是多模态表示的问题。本文从多模态表示学习的角度出发,针对多模态情感分析中的一些难以解决的
本文研究了亚临界星型河渠网中非稳定流的多种能控性问题,并将其结论推广到星型拟线性双曲型方程网的精确能控性.本文首先得到了非稳定流在亚临界星型河渠网中其半整体C1解的存在唯一性,实现了仅在复结点施加控制或在复结点与部分简单结点任意分配控制个数时星型河渠网络的精确能控性.在此基础上,本文进一步推广,得到了由一般拟线性双曲型方程构成的星型网的半整体C1解的存在唯一性,并采取构造性的方法通过将控制全部施加
随着生物医学的快速发展,生物医学文献的数量也在逐年增长,生物医学文本已经成为目前最重要的科学研究资源。如何充分地利用海量生物医学文献,从中获取对生物医学发展有用的相关知识,为相关医学工作者提供有价值的信息,有着重要的意义。相比于使用搜索引擎输入关键词获得信息,智能问答系统允许用户直接以自然语言的形式描述自己的问题作为输入,可以筛选或生成精确又简明的答案,有着更好的用户体验。本文以生物医学智能问答为
本文主要研究如下由G-布朗运动驱动的随机微分方程(GSDE)的解的存在唯一性及稳定性,不稳定性和稳定化:x(t)=x0+∫0tf(s,x(s))ds+∫0th(s,x(s))d<B>(s)+∫0tg(s,x(s))dB(s),其中t ≥ 0,x(0)=x0∈Rn是初值,B(·)是一维G-布朗运动,<B>(·)是G-布朗运动B(·)的平方变差过程,系数f,h,g:R+×Rn→Rn.第一章介绍研究背景
文本风格是文本的重要特征,相比于文本格式、文本主题等,文本风格更加复杂,属于隐式特征。随着深度学习与自然语言处理的发展,有关文本风格的研究取得了不错的成果。目前的文本风格研究集中在文本情感风格、性别化风格等方面,而文本风格迁移任务目标,则是在保持文本主题不变的前提下,转换文本的表达风格,例如将消极表达转化为积极表达,或是将男性化表达转为女性化表达。文本风格迁移任务能够帮助人机交互系统更好地理解人类
图的控制集理论是图论中发展最快的领域之一,其在通信网络、计算机科学组合优化、编码理论等领域有着重要作用.验证码和定位码是与图的控制集概念密切相关的两类重要的码,在编码理论及现实生活中有着重要的理论和实践意义.确定图的最优r-验证码和r-定位码的界是很困难的,即使对于最简单的图,圈和路.事实上,这个问题是NP-完全的.因为图的验证码和定位码的最优界问题是NP-完全的,所以对这两种码的上下界的确定,极
在求解偏微分方程约束的最优控制问题上,传统方法主要借助有限元、有限差分等数值离散手段.虽然说传统方法具有很高的精确度,但是一般来说传统的求解方法都是基于网格的,这种局限性决定了传统方法只适用于简单低维的情形.由于深度神经网络采用的是无网格形式并且在近似高维函数时具有很强的非线性拟合能力,因此近年来使用深度神经网络代替传统的数值离散方法近似偏微分方程开始得到科学家的重视.但是,对于偏微分方程约束的最