【摘 要】
:
近年来,以机器学习为核心的人工智能技术正在不断渗透到工业、农业、医疗卫生等生产和生活的多个领域,并即将因此而掀起对人类社会影响深远的新一轮工业革命。机器学习在现实中的成功的应用案例层出不穷。然而,在这些实际应用中,现有的机器学习方法在某些方面的欠缺却越来越明显。由于已有的关于机器学习方法的研究主要关注其性能而很大程度上忽略了其可解释性,导致现有的机器学习方法由于可解释性的欠缺而在某些场景的应用受到
论文部分内容阅读
近年来,以机器学习为核心的人工智能技术正在不断渗透到工业、农业、医疗卫生等生产和生活的多个领域,并即将因此而掀起对人类社会影响深远的新一轮工业革命。机器学习在现实中的成功的应用案例层出不穷。然而,在这些实际应用中,现有的机器学习方法在某些方面的欠缺却越来越明显。由于已有的关于机器学习方法的研究主要关注其性能而很大程度上忽略了其可解释性,导致现有的机器学习方法由于可解释性的欠缺而在某些场景的应用受到限制。而对于具备可解释性的模糊系统,在已有的研究工作中也体现出性能与可解释性互相制约的问题。针对该挑战,本文聚焦于具备可解释性的模糊分类方法,试图探索提高其可解释性、分类性能和泛化性能的方案,从而促进机器学习方法在现实中更广泛的应用。本文的主要研究成果如下:(1)通过证明高阶Takagi-Sugeno-Kang(TSK)模糊分类器与可解释的0阶TSK模糊分类器深度集成的等价性,提出了一种新的可解释的高阶TSK模糊分类器Deep high-order TSK fuzzy classifier(DHO-TSK)的堆栈结构及其深度学习方法。DHO-TSK可以通过将可解释的0阶TSK模糊分类器以一种特殊的堆栈方式组装起来来构建。每个0阶TSK模糊分类器可以通过随机选择输入特征,从一个固定的模糊划分中随机分配一个模糊规则前件子集到每个选择的输入特征,然后将每个TSK模糊分类器的输出乘以一个随机选择的特征来学习。除上述坚实的理论等价性外,DHO-TSK中每个模糊规则的后件部分由于采用了栈式集成而变得可解释,且DHO-TSK中每个层的输出表达式变得可理解;其增强分类性能可以在一个特定的时间内实现分层深度学习方法;另外,DHO-TSK算法对特征的随机选择和模糊隶属度函数的选择都具有自适应性。(2)提出了一种新的设计方法,即fuzzy-knowledge-out概念及其诱导的宽度学习机制。类似于深度学习中的dropout概念,TSK模糊分类器中的fuzzy-knowledge-out概念对应于生物神经网络中知识的触发模式。理论分析表明,从一组完全可解释的模糊规则中提取模糊知识后建立的模糊分类器具有独特的泛化能力和避免联动自适应能力。因此,提出了一种以宽度学习方式构造的高可解释性0阶TSK模糊分类器集成方法,以实现增强的分类性能和高度可解释性。所得到的模型称为宽度学习TSK(wide learning TSK fuzzy classifier,WL-TSK),其中每个高度可解释的0阶TSK分类器作为WL-TSK的子分类器,通过fuzzy-knowledge-out构造,然后使用快速学习算法进行快速训练。由于所有子分类器中所有模糊规则的简单并集,即每个最终模糊规则的后件部分被视为具有相同前件部分的模糊规则的每个后件部分的一半或平均值的总和,这样一个集成结构的行为就像只有一个TSK模糊分类器一样。因此,该方法可作为TSK模糊分类器的一种新的设计方法。(3)将在TSK模糊分类器设计中关于dropout的工作,即fuzzy-knowledge-out,扩展到广义概念,即具有动态补偿的模糊规则dropout。这种扩展是由人脑中所有知识片段的非常复杂的触发模式所驱动的,即针对不同情况的二值或连续或二者组合的随机方式。理论分析表明,该广义概念能较好地封装模糊规则的各种随机丢失,更符合人类的认知行为,具有更强的泛化和抵抗协同适应的能力。基于这一概念,我们提出了一种TSK模糊分类器的宽度学习算法。(4)提出了一种新的0阶TSK模糊分类器知识对抗攻击模型。该模型是在训练可解释的0阶TSK模糊分类器时,从类似人类思维过程的角度出发,利用特殊知识对抗攻击的存在性。与基于输入或输出扰动的对抗性攻击不同,该模型不直接使用对抗性样本,而是考虑了可解释的0阶模糊规则在知识遗忘和/或知识偏差或兼具二者的对抗性扰动,以模拟人类思维过程中知识的稳健使用方式。通过动态正则化,该模型具有较强的泛化能力。针对0阶TSK模糊分类器,提出了一种新的知识对抗训练方法(Knowledge adversarial training method,KAT)。
其他文献
耕地后备资源调查评价,是落实推进最严格的耕地保护制度和占补平衡政策的重要基础性工作,是维护国家粮食安全“藏粮于地”的战略性保障之一。当前,全面构建新时代国土空间规划体系已在路上且持续推进,如何在国土空间规划体系下全面、准确地摸清全国补充耕地潜力状况,是一项需要尽快解决的重要工作。本研究在分析比较三次耕地后备资源调查评价工作的调查基础、对象、任务及成果等和评价原则、方法、单元及指标的基础上,从开展调
为贯彻国家交通强国战略,顺应行业数字化转型需求,满足自身高速公路运维管理"数字化、大数据、智能化"的发展方向,提升运营保障能级和精细化养护治理水平、确保设施安全,上海城投公路集团作为城投集团重要的业务板块之一,承担建设了"路桥智慧运维管理平台",通过新一代信息技术与高速公路运维管理的深度融合,打造了一套面向高速公路运维全流程业务的数字化解决方案。依托该平台,形成了大数据平台及路桥设施运维的全流程数
酱香型白酒发酵过程是一个人工干预下的半开放式传统固态发酵过程,其复杂的微生物群落除了受到环境微生物、原料、环境温度、环境湿度等外源因素的影响,还受到群落自身群落演替、代谢产物变化、自身生物热变化、含水量变化等内源发酵条件的影响。然而,目前对于如何判定发酵群落中核心功能菌群以及发酵条件如何影响群落结构和功能的相关研究还很缺乏。因此,本研究选择A、B两个厂区同时进行的典型酱香型白酒入池发酵过程,系统分
纤维二糖差向异构酶(CE,EC 5.1.3.11)与N-乙酰葡萄糖胺-2-差向异构酶(AGE,EC 5.1.3.8)、醛糖-酮糖结构异构酶Yih S和甘露糖结构异构酶(MI,EC 5.3.1.7)统称为AGE家族酶。大部分的CE仅表现差向异构活性,催化β1,4糖苷键连接的二糖的还原端葡萄糖基与甘露糖基间的相互转化。而来源于Caldicellulosiruptor saccharolyticus(C
监控管理综合平台是实现对火灾、环境、交通流等信息进行动态采集,对高速公路主线和隧道设备、交通运行状况等进行集成管理和联动控制等功能的系统,是高速公路监控的核心。而传统高速公路监控管理平台,业务系统繁多,数据不共享,图表等直观数据无法实现实时展示;设置控制平台分散,管理不集中;事件处置过程信息分散,效率低;无法对重点运营车进行监管。
移动传感器/执行器网络是在无线传感器/执行器网络基础上,升级为具有自主感知和智能控制功能的网络系统,近年来得到了广泛应用,也必将伴随人工智能的发展在未来发挥举足轻重的作用。利用移动传感器/执行器网络对时滞分布参数系统进行控制与估计,称为移动控制和估计。移动控制和估计相当于对时滞分布参数系统增加了一个维度,使其控制变得更为复杂和更具挑战性。本文利用泛函分析、算子半群理论、抽象发展方程理论、Lyapu
迭代学习控制作为智能控制领域的一个重要组成部分,广泛存在于工业过程中,它通过反复学习和纠错改善系统的控制性能,完成轨迹跟踪任务。传统的迭代学习控制方法往往只考虑时域范围静态迭代学习控制器的相关性能,导致算法设计方面存在一定的不足。本文基于二维模型,考虑系统内部信号,构造和更新控制器,根据工程中被控对象具有明显频域特性的实际情况,在频域范围内设计迭代学习控制器,研究其收敛性能,以达到提高系统整体性能
预测控制由于其处理多变量和约束的能力,在实际工业生产过程中得到了广泛应用,近年来由于可以考虑多样化经济指标,经济预测控制开始引起关注。但是,随着现代工业过程日趋大型化和复杂化,建模难度增加、预测控制在线计算负荷增大以及地理分散,都给集中控制带来巨大挑战。分布式预测控制结构实现了将大型系统分割为多个子系统分别控制,并且通过网络通信兼顾整体系统的性能优化。但同时,其动态性能受到内外部不确定因素影响:一
对于结构复杂的多变量工业过程,找到合适的辨识算法获得数学模型,是过程分析和控制系统设计的基础.多变量系统维数高参数多,使得辨识算法的计算量大,减小算法计算量是多变量系统辨识急需解决的问题.本文针对有色噪声干扰下的多变量系统,结合辨识新技术提出了高效的耦合递推参数估计算法.论文的具体研究内容如下.(1)针对同时存在参数向量和参数矩阵的多变量方程误差自回归滑动平均系统,将其分解为多个只含有参数向量的单
双线性系统广泛存在于实际工业过程中,如流体热交换、核裂变等都可以用该类系统来描述.论文考虑实际中存在的一些不确定因素,如状态不可测、时延等,研究双线性状态空间系统的参数与状态联合估计方法,具有重要的理论意义和实际价值,主要研究内容如下.1.针对双线性状态空间系统的状态估计问题,借助系统的特殊结构,将其看作线性时变参数模型,基于Kalman滤波原理,推导了双线性系统的状态估计器.此外,通过极小化状态