新型层次结构模糊分类学习方法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:handan0918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能技术在人类生活中的各个领域都得到了广泛地应用。特别是机器学习技术在分类、聚类以及回归等众多知识任务中都取得了突破性进展。其中,分类是目前机器学习中重要的研究方向之一,它广泛应用于语义解析、图像识别、文本分类以及辅助医学诊断等实际应用场合。Takagi-Sugeno-Kang(TSK)作为人工智能的一个重要研究分支已被应用到多个领域,怎样提高它的分类性能和增强可解释性仍然是一个十分具有挑战性的工作。然而在面对新兴的应用场景时,通常面临以下挑战:(1)仅随机提取原样本中的部分特征,如何保持分类器的分类性能和强的可解释性,同时还要适用于大样本分类;(2)在保证整个分类器分类性能的前提下,提高各个训练块的泛化能力;(3)如何增强模糊分类器的避免过拟合能力;(4)如何解决现有层次模糊分类器在解释中间层输出和模糊规则方面存在的不足问题。为了解决传统分类器在处理上述应用场景中所面临的问题,本论文主要从分类角度对经典的模糊分类器进行改进,以期得到令人满意的分类效果。具体工作如下:(1)第一部分为第二章节,主要探讨了基于局部特征信息的层次模糊分类问题。为了进一步增强层次模糊分类器的分类性能和可解释性,该小节在栈式结构原理的基础上提出了一种层次TSK模糊分类器。所提出的层次模糊分类器利用栈式结构逐块构建,每个基训练块由一个零阶TSK模糊分类器组成。根据栈式结构原理,当前基训练块的预测结果的随机投影所获得的训练集经过随机变化又作为下一个基训练块的输入。对于所提出的层次模糊分类器中,每个基训练块中的隐含层由具有可解释性的模糊规则表示,这些模糊规则又是通过随机划分、随机规则组合来进行特征选择的。根据固定的五个模糊划分,源数据集作为相同的输入空间被映射到每一个独立的基训练块中。每个基训练块的输出层又可以通过最小学习机(LLM)快速学习。由此,所提出的层次模糊分类器可以很好地适用于大样本数据集分类。最后,通过实验也证明了所提出的层次TSK模糊分类器具有良好的分类性能和可解释性。(2)第二部分为第三章节,主要探讨了基于优化训练特征的层次模糊分类问题。针对现有层次模糊分类器在解释中间层输出和模糊规则方面存在的不足,该小节提出了一种既具有良好分类性能又具有较高可解释性的层次结构TSK模糊分类器。为了增强分类性能,所提出的层次TSK模糊分类器中的每个基本训练单元通过一种特殊的叠加方式组织在一起。这种训练方式使得原始训练样本的所有输入特征再加上前一个训练单元的输出构成优化的训练空间,该优化的训练空间又作为下一个训练单元的输入。这些优化特征基本上可以打开原始输入空间的流形结构,从而可以实现增强的分类性能。在设计各个基本训练单元时,利用最小学习机快速获得模糊规则后件的解析解,提高训练效率。每个模糊规则则是通过随机选择输入特征,随机选择所选的输入特征所对应的固定的高斯隶属度函数而生成。这种方法生成的模糊规则具有可解释性。实验结果也展示了所提出的层次TSK模糊分类器具有增强的分类性能和高可解释性。(3)第三部分为第四章节,主要探讨了基于训练块内集成组合的层次模糊分类问题。该小节提出了一种可解释的TSK模糊分类器的分块组合方式,同时实现了良好的分类性能和强的可解释性。作为一种特殊的层次模糊分类器,该分类器采用逐块叠加的方法建立。每个基本构建块由多个零阶TSK模糊分类器组成,这些零阶TSK模糊分类器同时采用负相关学习的方法进行分块训练,提高了整个基本训练块的泛化能力。利用栈式泛化原理,当前基本训练块的输出随机投影到下一个基本训练块,再结合当前训练样本,目的是增强层次模糊分类器的泛化能力。构造这种特殊层次结构的目的在于保证所有基本训练块都可以在相同的输入/输出空间、当前训练样本以及上一个训练块的随机投影输出中进行训练。在输入层中,使用当前训练样本的目标输出,而不是使用上一个训练块的随机投影输出。基本训练块中的每一个TSK模糊分类器都由可解释的模糊规则组成,而这些规则又是通过随机选择输入特征和随机将固定模糊划分中的模糊子集分配给每个选定的输入特征而生成的。最终的实验结果证明了该层次TSK模糊分类器确实具有明显的分类优势。(4)第四部分为第五章节,主要探讨了基于受限玻尔兹曼机RBM且避免过拟合的层次模糊分类问题。本节提出了一种新的层次TSK模糊分类器,该分类器具有良好的分类性能、较好的可解释性和避免过拟合性能。与以前的深度TSK模糊分类器不同,本小节所提出的层次TSK模糊分类器将若干个零阶TSK模糊分类器作为其基本训练块,然后将它们组织成一个层次结构,使当前基本训练块的输出加上以前基本训练块的相应输出尽可能地近似为它们的原始输出。为了保证所提出分类器的可解释性和快速学习,本小节通过将原始输入空间投影到原始特征集对应的随机选择的子集上,每个基训练块都有自己的输入空间和短模糊规则,其前件通过随机选择特征生成。本小节选取了五个具有简明语言解释的高斯隶属度函数,并用最小学习机LLM快速学习其相应的后件参数。作为层与层叠加的一种替代方案,本小节所提出的层次TSK模糊分类器主要从生物学的角度设计的。因为它有一个可靠的理论基础,即在层次TSK模糊分类器中,每一个基本训练块的训练都可以从广义受限玻尔兹曼机(RBM)中等效地理解。这种训练模式在理论和经验上都证明了深度受限玻尔兹曼机(RBM)的优越性。本小节首次证明了所提出的分类器在训练这样的层次模糊分类器中所起的决定性作用。理论分析表明,所构建的层次TSK模糊分类器具有明显的避免过拟合现象的能力。最后,实验也证明了该层次TKS模糊分类器在分类性能、可解释性和避免过拟合方面的有效性。这也意味着本小节所提出的TSK模糊分类器为设计深度TSK模糊分类器提供了更灵活和有利的选择。
其他文献
实际生产过程既有时间的状态连续演化,又有受离散事件驱动的随机跳变,对于此类受时间和事件共同影响的随机Markov跳变系统,由于存在不同模态下的随机跳变,使得其状态估计问题具有挑战性。在现有研究结果中,一般是对跳变系统的状态变量进行一阶矩和二阶矩估计,即均值和均方估计。然而,在实际系统中,有时仅考虑状态的一阶矩和二阶矩信息难以满足要求,甚至会导致估计结果不够精准。本文引入统计论中的累积量生成函数研究
在工业控制领域,非线性特性广泛存在于各类实际控制系统中.对具有非线性特性的控制系统的参数辨识问题是控制器设计过程中的重要环节,但由于非线性系统的结构相对于线性系统更为复杂,使得常见的针对线性系统的参数辨识方法无法直接应用到非线性系统的辨识中,因此针对非线性系统的辨识方法的研究具有较为实际的意义.本文主要针对一类具有块结构输入非线性系统,利用极大似然辨识方法进行研究.论文的主要工作如下:1.针对非线
酵母代谢产生的醛类物质不仅会带来不良的风味,也会加速啤酒老化,影响成品啤酒的质量。因此,啤酒中的醛类物质含量应当受到严格控制。乙醛作为啤酒中含量最多的羰基化合物,降低其在啤酒中的含量一直是研究的重点之一,更是清爽型啤酒关注的焦点。目前啤酒酵母的育种技术已经取得了一定的进展,但仍存在靶向性差、效率低等问题;而另一方面,对酿造过程中啤酒酵母乙醛代谢调控的认知不足使得低乙醛啤酒酵母选育策略匮乏。为此,亟
在机器学习与计算机视觉领域的各种任务中,对数据表示方法的要求正逐渐提高。人们希望用一种体积紧凑且判别性高的模型来对蕴含庞大信息的数据进行表示,同时这种表示方法还应当尽可能地对各种变化情况具有鲁棒性。在这样的背景下,研究者们逐渐把注意力从传统的欧氏空间转移到了非线性流形上。近年来,计算机视觉界对黎曼流形的关注已经大大增加,并出现了一大批重要的应用,包括人脸识别,动作识别,聚类,视觉跟踪以及运动分组与
近年来,越来越多的天然聚合物和合成聚合物被用于纳米纤维复合材料的生产,具有广泛的应用前景。纤维素基复合材料由于其优异的细胞粘附性、高孔隙率和表面体积比、优异的力学性能、延展性、渗透性、可降解能力和生物相容性等性能而受到人们的广泛关注。细菌纤维素(BC)作为一种微生物多糖,是自然界生产的最强细胞外生物可降解聚合物材料之一,具有较高的强度和模量,纤维直径在20-100纳米之间,具有高结晶度、超细网状纤
学位
非公立医疗机构是公立医疗机构有效的医疗资源补充,为满足患者能及时、就近、便利看病和解决看病难问题发挥了积极的作用。非公立医疗机构分为营利性质和非营利性质两类。由于非公立医疗机构创办时间有先后,规模大小不同,医疗设备配置及先进程度不一,医疗水平参差不齐,各非公立医疗机构投资人办医院的理念不同及管理水平差异,医疗技术良莠不齐,故医疗收费项目、标准也千差万别,并存在不同程度的收费乱象。如何加强对非
期刊
思政教育是当下培育人才最为重要的一个领域,为了能够让学生们充分地认识到思政的重要性,每个教师也是在课堂上融入了思政教育。对于应用型本科院校里的成本会计专业的学生更是要多注意思政的教育,毕竟思政教育是做人、做会计的根本。本文以应用型本科院校的成本会计课程为例,分析了成本会计中思政教育的重要性以及存在的问题,并提出了改变原有的教学模式、提高教师的自身道德素质等完善思政教育的方法,以此来提高学生们的思想
分布参数系统的状态同时依赖于时间和空间,因此是一类无穷维的动力系统,其广泛应用于工程、社会、生态、环境等领域.研究基于传感器/执行器网络的分布参数系统控制问题具有重要的理论意义和应用价值.本文在传感器/执行器网络环境下,针对n-维空间上的扩散系统,研究利用移动智能体协同控制,以提高系统的控制性能.针对n-维耦合分数阶反应扩散系统,研究利用传感器/执行器网络对系统进行边界控制的方法.主要研究工作如下
近年来,机器学习随着人工智能的火热得到了如火如荼地发展,在推荐系统、机器翻译、语音识别等领域得到了广泛而成功应用。但是,随着应用场景的不断扩大,数据的规模和形式也变得复杂,多样化的数据场景,例如含有噪音特征和噪音标签的训练数据等,给传统的机器学习方法带来了巨大的挑战。在有监督机器学习中,经典的神经网络和TSK模糊系统在面对这些复杂的数据场景时,往往会遇到如下问题:由于技术的限制,采集到的数据不可避
尽管实际工业系统中存在许多可测变量,但也经常出现一些变量不可得到的情况.论文利用辅助模型来估算这些不可测变量,研究一类存在未知变量的多变量输出误差系统的辅助模型递推辨识算法及其收敛性问题.选题具有理论意义和学术价值,主要工作如下.(1)针对白噪声干扰下的多元输出误差系统,运用辅助模型辨识思想,分别推导了基于分解的辅助模型随机梯度算法和辅助模型最小二乘算法,借助于随机鞅理论分析了算法的收敛性问题.进