模糊TSK系统的深度集成研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:delicious_bupt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,机器学习随着人工智能的火热得到了如火如荼地发展,在推荐系统、机器翻译、语音识别等领域得到了广泛而成功应用。但是,随着应用场景的不断扩大,数据的规模和形式也变得复杂,多样化的数据场景,例如含有噪音特征和噪音标签的训练数据等,给传统的机器学习方法带来了巨大的挑战。在有监督机器学习中,经典的神经网络和TSK模糊系统在面对这些复杂的数据场景时,往往会遇到如下问题:由于技术的限制,采集到的数据不可避免的含有噪音或不确定数据。当使用这些含有噪音和不确定信息的数据进行学习建模时,得到的模型往往泛化性能较差;其次,采集到的原始数据,不可避免的会被工人标注错,或不能确定其类标。如何对错误的类标进行矫正,也是一个亟需要解决的问题。针对上述问题,本文将在现有经典机器学习的基础之上,通过构建不同的集成分类器,以期得到能够解决在复杂数据场景下的建模方法,主要研究成果如下:(1)提出了一种基于模糊划分和模糊加权的集成深度信念网络FE-DBN,用于处理大规模复杂数据的分类问题。首先通过模糊聚类算法对输入数据空间进行模糊划分,将训练数据划分为多个子集,然后利用多个不同结构的DBN独立的对各个子集并行进行训练,凭借DBN强大的神经表达能力逐层去掉各子集中原始数据的不确定信息,最后基于模糊理论思想,将每个分类器的结果进行模糊加权。根据集成原理,FE-DBN可提高DBN的泛化性能,并加速训练时间;(2)提出了一种新型的集成TSK模糊分类器EP-TSK-FK,首先通过并行学习的方式组织所有零阶TSK模糊子分类器,然后每个子分类器的输出被扩充到原始(验证)输入空间,最后通过提出的迭代模糊聚类算法(Iterative fuzzy C-means clustering algorithm,IFCM)作用在增强验证集上生成数据字典,从而利用KNN对测试数据进行快速预测。EP-TSK-FK具有以下优点:以并行学习方式训练其所有零阶TSK模糊子分类器;在EPTSK-FK中,每个零阶TSK子分类器的输出被扩充到原始(验证)输入空间,以便以并行方式打开原始(验证)输入空间中存在的流形结构。因此,根据堆栈泛化原理,可以保证提高分类精度;和其它按顺序训练的分层结构和Boosting结构模糊分类器相比,EPTSK-FK以并行方式组织所有的子分类器,因此运行速度可以得到有效保证;由于EPTSK-FK是在以IFCM&KNN所获得的数据字典的基础上进行分类的,因此具有强鲁棒性。理论和实验验证了模糊分类器EP-TSK-FK具有较高的分类性能、强鲁棒性和高可解释性;(3)提出了一种称为DBN-TSK-FC的新型模糊深度分类器,使之能同时利用模糊表达强大的不确定性处理能力和基于DBN的神经表达的突出抗噪能力对数据进行分类。在所提出的分类器DBN-TSK-FC中,通过在原始数据集上使用经典的模糊聚类算法FCM(fuzzy c-means clustering algorithm FCM),从而形成模糊规则的前件部分,并作为原始数据集的模糊表达;而基于DBN的神经表达则是通过在现有的DBN学习过程中只对训练数据应用相同的无监督预训练,然后将对应的DBN结构中顶层的所有隐层节点的神经表达作为模糊规则的后件变量。以这种方式,通过将后件参数的学习问题转化为线性回归问题,从而利用最小学习机LLM(Least Learning Machine)求得后件参数的最优解,可解释的模糊表达和基于DBN的神经表达被进一步集成以快速形成相应的模糊规则。因此,从模糊规则的角度来看,DBN-TSK-FC本质上是一种新型的TSK模糊分类器,它使DBN的行为在所提出的分类器中是可以解释的。标准UCI数据集的实验结果验证了所提出的分类器DBN-TSK-FC的有效性;最后将DBN-TSK-FC成功应用于AAL(Ambient Assisted Living)中的室内用户移动预测中;(4)在第3章基于模糊聚类和KNN的集成TSK模糊分类器EP-TSK-FK基础上,提出了一种改进型具有标签抗噪能力的集成TSK模糊分类器EW-TSK-CS。在EW-TSKCS中,每一个子分类器TSK-noise-FC在原始零阶TSK模糊分类器目标函数的基础上,增加了两个约束,分别对应不确定标签和错误标签,即标签噪音。在EW-TSK-CS的决策阶段,由于我们在此只考虑二分类问题中的标签噪音问题,因此选用FCM&KNN。每一个子分类器的输出被当做验证数据的增强特征从而打开原始数据空间中的流行结构,从而保证了所提出的EW-TSK-CS的高效性。在实验部分,我们在UCI数据集上模拟真实众包环境中的标签噪音矫正问题,验证了所提出的EW-TSK-CS的性能。最后在电力价格数据集上展示了集成模糊分类器EW-TSK-CS的高可解释性。EW-TSK-CS具有2个非常重要的特征:1)每一个子分类器都是TSK模糊分类器TSK-noise-FC,且EW-TSK-CS并行训练所有的子分类器,没有中间变量的存在,因此保证了EW-TSK-CS具有高可解释性;2)每一个子分类器的目标函数中考虑了标签噪音的存在,因此EWTSK-CS具有较强的标签噪音抗噪能力。
其他文献
目的:为政府及医院管理者把握医院安全管理细节、促进质量改善提供参考。方法:深入研究和分析美国卫生保健研究和质量局(AHRQ)《医疗质量评价指标体系(2020年版)》与国内《三级综合医院评审标准实施细则(2020年版)》中患者安全评价指标具体内容,并提出思考和建议。结果:由AHRQ发布的预防质量指标(PSIs)共17项普通指标和1项综合评价指标;由国家卫生健康委发布的《三级医院评审标准(2020年版
纳米抗体具备特异性强、亲和力高、稳定性好、免疫原性低和易于生产等特点,已被广泛应用于开发新的肿瘤免疫治疗策略和靶向药物。然而,纳米抗体不具有传统抗体的Fc结构,因此其不能通过直接激活抗体依赖细胞介导的细胞毒作用(Antibody-dependent cell-mediated cytotoxicity,ADCC)和补体依赖的细胞毒作用(Complement-dependent cytotoxici
实际生产过程既有时间的状态连续演化,又有受离散事件驱动的随机跳变,对于此类受时间和事件共同影响的随机Markov跳变系统,由于存在不同模态下的随机跳变,使得其状态估计问题具有挑战性。在现有研究结果中,一般是对跳变系统的状态变量进行一阶矩和二阶矩估计,即均值和均方估计。然而,在实际系统中,有时仅考虑状态的一阶矩和二阶矩信息难以满足要求,甚至会导致估计结果不够精准。本文引入统计论中的累积量生成函数研究
在工业控制领域,非线性特性广泛存在于各类实际控制系统中.对具有非线性特性的控制系统的参数辨识问题是控制器设计过程中的重要环节,但由于非线性系统的结构相对于线性系统更为复杂,使得常见的针对线性系统的参数辨识方法无法直接应用到非线性系统的辨识中,因此针对非线性系统的辨识方法的研究具有较为实际的意义.本文主要针对一类具有块结构输入非线性系统,利用极大似然辨识方法进行研究.论文的主要工作如下:1.针对非线
酵母代谢产生的醛类物质不仅会带来不良的风味,也会加速啤酒老化,影响成品啤酒的质量。因此,啤酒中的醛类物质含量应当受到严格控制。乙醛作为啤酒中含量最多的羰基化合物,降低其在啤酒中的含量一直是研究的重点之一,更是清爽型啤酒关注的焦点。目前啤酒酵母的育种技术已经取得了一定的进展,但仍存在靶向性差、效率低等问题;而另一方面,对酿造过程中啤酒酵母乙醛代谢调控的认知不足使得低乙醛啤酒酵母选育策略匮乏。为此,亟
在机器学习与计算机视觉领域的各种任务中,对数据表示方法的要求正逐渐提高。人们希望用一种体积紧凑且判别性高的模型来对蕴含庞大信息的数据进行表示,同时这种表示方法还应当尽可能地对各种变化情况具有鲁棒性。在这样的背景下,研究者们逐渐把注意力从传统的欧氏空间转移到了非线性流形上。近年来,计算机视觉界对黎曼流形的关注已经大大增加,并出现了一大批重要的应用,包括人脸识别,动作识别,聚类,视觉跟踪以及运动分组与
近年来,越来越多的天然聚合物和合成聚合物被用于纳米纤维复合材料的生产,具有广泛的应用前景。纤维素基复合材料由于其优异的细胞粘附性、高孔隙率和表面体积比、优异的力学性能、延展性、渗透性、可降解能力和生物相容性等性能而受到人们的广泛关注。细菌纤维素(BC)作为一种微生物多糖,是自然界生产的最强细胞外生物可降解聚合物材料之一,具有较高的强度和模量,纤维直径在20-100纳米之间,具有高结晶度、超细网状纤
学位
非公立医疗机构是公立医疗机构有效的医疗资源补充,为满足患者能及时、就近、便利看病和解决看病难问题发挥了积极的作用。非公立医疗机构分为营利性质和非营利性质两类。由于非公立医疗机构创办时间有先后,规模大小不同,医疗设备配置及先进程度不一,医疗水平参差不齐,各非公立医疗机构投资人办医院的理念不同及管理水平差异,医疗技术良莠不齐,故医疗收费项目、标准也千差万别,并存在不同程度的收费乱象。如何加强对非
期刊
思政教育是当下培育人才最为重要的一个领域,为了能够让学生们充分地认识到思政的重要性,每个教师也是在课堂上融入了思政教育。对于应用型本科院校里的成本会计专业的学生更是要多注意思政的教育,毕竟思政教育是做人、做会计的根本。本文以应用型本科院校的成本会计课程为例,分析了成本会计中思政教育的重要性以及存在的问题,并提出了改变原有的教学模式、提高教师的自身道德素质等完善思政教育的方法,以此来提高学生们的思想
分布参数系统的状态同时依赖于时间和空间,因此是一类无穷维的动力系统,其广泛应用于工程、社会、生态、环境等领域.研究基于传感器/执行器网络的分布参数系统控制问题具有重要的理论意义和应用价值.本文在传感器/执行器网络环境下,针对n-维空间上的扩散系统,研究利用移动智能体协同控制,以提高系统的控制性能.针对n-维耦合分数阶反应扩散系统,研究利用传感器/执行器网络对系统进行边界控制的方法.主要研究工作如下