主动学习算法及其在软测量建模中的应用研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:windFWF1992
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在工业生产过程中为了保证产品质量需要对某些主导变量进行实时监测与控制,然而受技术或环境条件的限制,使得主导变量难以通过硬件传感器检测获得。软测量技术凭借低成本、响应迅速和抗干扰能力强的优点成为了控制领域的研究热点,并在复杂工业过程中得到了广泛的应用。但在实际生产过程中经常出现有标签样本数量稀少,专家对无标签样本化验标记代价昂贵的情况,这使得建立的模型难以达到理想的预测精度。针对上述问题,本文对主动学习算法展开研究,通过制定合适的样本选择策略,主动选取出最能够提升当前模型性能的样本,将其与软测量建模相结合后,能够有效地缓解模型对于有标签样本数量上的依赖。本文的主要研究内容与创新如下:(1)针对工业过程中因有标记样本缺乏而导致模型预测精度低的问题,提出一种基于协方差矩阵的主动学习算法。通过有标签样本确定高斯过程回归模型参数,以无标签样本构成的协方差矩阵行列式的值作为评价指标,在挑选出高质量无标签样本的同时,衡量样本间的相似性,避免样本的冗余标记。通过数值仿真和青霉素发酵过程的应用仿真,验证了所提算法能够在提升模型预测精度的同时,显著降低人工标记成本。(2)针对传统的主动学习算法中,因样本选择策略单一而造成挑选出的无标签样本信息量不足的情况,提出一种基于双层优选策略的主动学习算法。从样本的不确定性、差异性和代表性三个角度出发,通过建立不同预测模型对无标签样本的信息量进行评估,根据样本间的分布信息,提出新的评价指标用于无标签样本的第一层优选。在第二层优选中,利用最远优先遍历算法去除样本间的冗余信息,使得优选出的样本在具备信息量的同时,彼此之间差异性较大,标记后对模型精度的提升更为有利。通过工业过程数据的应用仿真,验证了算法的有效性和性能。(3)为进一步提高模型的预测精度,提出一种结合高斯混和模型的主动学习策略,并进行半监督回归建模。一方面,利用辅助变量与预测误差的关系构建高斯混和回归模型,根据模型的预测方差挑选出不确定性较高的无标签样本进行标记,以扩充有标签样本集;另一方面,利用马氏距离选取出与有标签样本空间结构相似的无标签样本作为候选样本,在协同训练过程中,对候选样本集中置信度较高的样本进行伪标记,并建立最终的预测模型。将所提算法应用于工业硫回收过程中硫化氢浓度的软测量,实验结果表明,所提算法在模型预测精度方面得到有效提升,说明了将主动学习与半监督学习相结合的可行性和有效性。
其他文献
<正>中办、国办印发的《关于进一步深化税收征管改革的意见》中提出“建立健全以‘信用+风险’为基础的新型监管机制”,这无疑是一次税收监管方式的重大变革,是实现从无差别管理向信用与风险管理、经验管理向大数据管理转变的关键举措,能大幅提高税法遵从度和社会满意度,明显降低征纳成本,充分发挥税收在国家治理中的基础性、支柱性、保障性作用,
期刊
目的:探究低电压区对房颤射频消融术后复发的影响,分析基本临床资料、超声参数、心电图参数和血液化验指标对低电压区的预测价值。方法:纳入了于2020年8月至2021年6月在中国医科大学第一附属医院行房颤射频消融术的患者。所有患者在入院后完善了采血化验、经胸心脏超声、经食道超声心动图以及动态心电图检查。手术过程中通过电压标测得到每位患者的低电压区面积以及低电压区占总心房面积的百分比。患者出院后定期接受门
学位
人体姿态估计是计算机视觉领域的重要研究方向之一,目标是定位出图像中关键点的位置并连接成对应的人体姿态,是行为识别、行人重识别和行人检测等高级视觉任务的基础与前提。近年来深度学习和卷积神经网络的快速发展推动着人体姿态估计的研究,使之在智能监控、人机交互、运动分析等领域有着广泛应用。但是在实际应用中人体姿态估计仍然存在一定的问题和挑战,一方面,复杂场景下人体交互带来的遮挡和姿态扭曲等问题影响模型性能,
学位
近年来,随着钢铁工业的持续发展,我国的粗钢产量已经位居全球首位。然而,我国钢铁企业的节能水平与世界顶尖企业还有一定差距,企业吨钢综合能耗大于发达国家,节能提升空间大。为了更好地应对能源短缺的问题,需要从各个方面挖掘节能技术,提高能源利用效率。多介质能源优化调配技术作为钢铁企业系统性节能的重要手段,能够实现能源的产生、输送、转换和储存的统一管控,对钢铁企业能源系统节能降耗具有重要意义。本课题以多目标
学位
通过实地调研和对内部控制主要岗位负责人的半结构式访谈,文章深入探讨了案例单位层面和业务层面内部控制的现状以及内部控制信息化系统的构建和实施路径。在总结经验的基础上,从进一步实现内部控制信息化系统的全业务过程控制、加快推动内部控制信息化向纵深发展、借鉴其他单位的先进经验并引入专家论证等方面提出优化建议。
期刊
随着科学技术的不断发展,人们在日常生活中产生的数据呈指数式增长,如何对这些数据进行有效分析、挖掘出其中隐藏的信息,就十分重要。聚类分析是一种在数据挖掘中常用的工具,属于无监督机器学习。聚类分析的目的是将数据分成多个由相似对象组成的簇,同一个簇内样本点之间具有较大的相似性,不同簇之间具有较大的差异性。国内外专家学者已经针对不同的情况提出多种聚类算法,是一个热门的研究领域。由于基于密度的聚类方法具有可
学位
温室作为现代农业中重要的生产设施,为作物生长提供了合适的环境温度,提高了单位土地面积的作物产量。但在大多数的农业生产中,对温室环境的控制往往依赖种植经验,难以全面考虑温室温度分布的异质性,无法达到最佳的气候状况。温室微气候受到温室结构材料、外界气象条件和内部作物状况等多种因素的影响,其复杂的形成机理使得气候参数空间分布产生较大的差异。确定温室微环境的空间异质性对现代农业的精准调控具有重要意义。在温
学位
柔性结构系统由于其轻量化、高速度、低能耗、操作灵活等特性在航天航空、海洋油气开发、工业生产等领域内广泛应用.然而,由于柔性材料本身刚度较小,易在环境扰动的影响下产生振动,不仅影响工作精度及效率,甚至可能存在安全隐患.因此,分析柔性结构系统的动力学模型,研究振动抑制的控制方法,具有重要意义.本文旨在研究柔性结构系统的典型模型Euler-Bernoulli梁系统的振动控制问题.针对外界干扰、输入约束、
学位
Akkermansia muciniphila是一种肠道黏液降解菌,中文名为嗜黏蛋白阿克曼菌(也称“AKK菌”),被认为是潜在的“下一代益生菌”。大量研究表明AKK菌与宿主的健康、代谢和免疫等方面有着密切的联系,其丰度的变化与肥胖、糖尿病、高血压等诸多疾病显著相关。因此,通过调控人体内AKK菌的丰度来预防或治疗肥胖及其相关代谢紊乱成为一种有潜力的治疗手段。目前针对人体内AKK菌的调节方法主要是口服
学位
离散制造系统中积累了丰富的工艺知识,其具有多源、异构、高冗余等特点,使得离散制造系统中的工艺知识发现和推理过程变得困难重重。现有的研究多是注重在知识发现和推理目标函数的优化上面,没有充分考虑推理优化过程中的特征复用,海量工艺数据利用不完善。本文从工艺知识表示出发,提出基于工序编码的典型加工路线聚类方法,挖掘工艺路线之间的内在隐式关系,并在聚类结果的基础上提出基于知识图谱的知识推理模型,对文本输入信
学位