【摘 要】
:
软测量是指通过建立易于测得的过程变量与目标变量间的数学模型,对目标变量进行预测的一种测量方法。而受当前传感设备老化、零漂噪声等因素影响,真实工业场景下获取到的工业数据往往包含大量的弱标签数据和少量的有标签数据。传统的直接标定方法存在一定的局限性,带来更高的成本甚至额外的噪声信息,而直接利用弱标签数据会使得原有的软测量模型包含了噪声信息从而使得预测不准确的问题,而仅仅使用少量的有标签数据则会限制模型
论文部分内容阅读
软测量是指通过建立易于测得的过程变量与目标变量间的数学模型,对目标变量进行预测的一种测量方法。而受当前传感设备老化、零漂噪声等因素影响,真实工业场景下获取到的工业数据往往包含大量的弱标签数据和少量的有标签数据。传统的直接标定方法存在一定的局限性,带来更高的成本甚至额外的噪声信息,而直接利用弱标签数据会使得原有的软测量模型包含了噪声信息从而使得预测不准确的问题,而仅仅使用少量的有标签数据则会限制模型的鲁棒性。如何合理利用弱标签数据,在不额外获取更多的有标签数据的前提下提高传统模型进行软测量的准确性是本文研究的重点。文章面向工业过程中的不准确监督软测量问题,从模型的数据增强以及模型架构的角度展开研究,重点解决了无偏噪声下的不准确监督问题,有偏噪声下的不准确监督问题两种不准确监督数据的利用问题,并主要提出了能够用来改进传统机器学习模型无偏噪声下表现的模型框架,主要研究内容包括:(1)针对工业数据包含无偏噪声问题。本文针对性提出了一种基于KDE的标签可信度评价手段,并由此引入一种基于集成神经网络的可信度估计网络模型(INNs Wo R)用于评价数据标签的噪声大小。此模型能够有效提取不准确标签数据中的无偏噪声信息,并赋予相应的权重,能够用于指导下游模型的训练过程。(2)针对传统机器学习在弱标签数据下表现不佳的问题。文章提出了基于集成神经网络的可信度估计网络-基模型的流程架构,通过使用上游INNs Wo R所学习到的不准确标签信息可信度信息来指导下游模型的训练,并给出了多层感知机(MLP)、支持向量回归(SVR)、偏最小二乘回归(PLS)在该流程架构下的效果提升结果,证明了所提出的流程架构的强大的生命力与适配性。(3)针对工业数据包含有偏噪声问题。本文提出一种基于双通道的神经网络(BCNNs)方法,通过冻结不同通道使得不同数据通过不同组合通道传播,同时更正损失函数的定义以及训练的交替进行,并证明BCNNs在最终预测效果上有所提升,为后续的有偏噪声处理提供一定的解决思路。
其他文献
作为工业控制系统的重要设备,工业机械臂广泛地应用于医疗、航空、电子等领域。随着工业化和信息化的紧密结合,工业控制系统中各个设备间互联互通,开放性和灵活性大幅增加,在提高产品生产效率的同时也引入了新的安全威胁,其中工业机械臂由于信息安全防护措施薄弱,极易遭受面向硬件、软件和通信过程等攻击,因此研究工业机械臂的异常检测方法对于保障工业机械臂和工业控制系统平稳运行具有重要意义。近年来已有部分工作对机械臂
绝缘栅双极型晶体管(Insulated Gate Bipolar Transistor,IGBT)作为最热门的功率半导体器件之一,被广泛应用于智能电网、航空航天、轨道交通和新能源汽车领域,获得了电力电子装置“CPU”的称号。随着IGBT的飞速发展和成熟,IGBT的栅极驱动技术也越来越受到关注和重视。由于IGBT的栅极存在较大的寄生电容,并且IGBT的导通电压相对较高,使用微控制单元(Microco
随着音频硬件技术的进步,录音装置越来越普及,并且呈现出小型化、隐蔽化的趋势,在方便快捷地录制音频的同时也对隐私信息安全产生了巨大的威胁。例如录音笔这类具有高隐蔽性的小体积录音设备被广泛使用,人们可能在毫不知情的情况下被记录私密的谈话内容,从而泄漏个人隐私、商业情报甚至国家机密。由于隐藏录音设备通常难以发现,当下对防窃听技术的需求愈发迫切。为解决隐藏录音设备带来的隐私安全问题,本文围绕防窃听技术进行
工艺设计组件(Process Design Kit,PDK)是包含晶圆代工厂(foundry)完整工艺制造信息的数据文件系统。PDK技术能将工艺信息直观、准确的传递给IC(Integrated Circuit)电路设计工程师,大大降低了电路设计行业的门槛,提升了电路设计的效率。因此,使用PDK技术协助IC电路开发的模式已成为当前芯片设计的主流方案。但随着集成电路产业的发展,对于PDK技术的需求空前
药物发现过程从新药设计到上市后的临床监测包括数个阶段,周期长、代价大且可能在各个阶段以失败告终。人工智能可为该过程的诸多环节降本增效,进而提高结果质量。分子性质预测作为药物发现早期的基本任务之一,旨在尽早剔除性质与预期不符的分子,只允许最有价值的分子进入后续环节。药物被批准上市后,临床用药时不仅需要考虑药物自身的性质,还需考量药物间相互作用的对药物有效性和安全性的影响。由于药物分子自身结构以及药物
在无损数据压缩中,相比于字典编码,熵编码能够获取到更好的压缩效果。熵编码基于数据的统计信息,常用的算法有霍夫曼编码(Huffman)、算术编码AC(Arithmetic Coding)。循环神经网络RNN(Recurrent Neural Networks)是一种为序列数据设计的统计模型,在训练后能够计算出符号出现的伪概率,结合算术编码,可以对序列数据进行有效的压缩。现在较为成熟的压缩算法中,所使
图是由顶点和连边构成的数据结构。近年来,图数据受到学术界和工业界的广泛关注。中国信息通信研究院将大规模“图计算平台”列为“2022大数据十大关键词”之一。社区是图中稠密的子结构,它反映了图中相似个体的局部性特征和关联关系。例如,蛋白质网络中的社区体现了生物系统的组织和功能,社交网络中的社区体现了用户社群结构等。社区检测对理解图的结构至关重要。按是否包含查询点,研究者将社区检测划分为两个子问题:(1
随着工控系统和传感器技术的发展,应用了传感器的工控系统越来越多,在传感器让工控系统的运行变得更加便利的同时,传感器暴露出来的安全隐患也越来越多,针对传感器的安全研究也愈发重要。电磁干扰攻击是一类比较常见的针对传感器的攻击,目前,大部分利用电磁干扰攻击传感器的研究针对的都是模拟传感器,针对数字传感器的安全研究非常稀少,然而数字传感器在市场上也占据了很大的比重,如果数字传感器遭到不法分子攻击,将会对人
[目的]准确评估区域碳储量的时空分异,分析其地形梯度效应及对土地利用的脆弱性,对区域“双碳”目标的实行具有重要意义。[方法]以武汉城市圈为例,采用InVEST模型借助GIS平台评估区域碳储量的时空分异特征,并基于DEM数据运用地形位指数探讨碳储量的地形梯度效应,再利用潜在影响指数揭示碳储量的脆弱性。[结果](1)武汉城市圈2005—2020年总碳储量先减少后增加,在空间分布上呈现中西低、南北高态势
生态网络构建是国土空间生态修复的重要内容,可以有效遏制栖息地破碎的负面效应。本研究提出一种改进的生态网络分析框架,包括基于“形态-质量-功能”3个维度识别生态源地、将可以表征人类活动的兴趣点数据与生境风险评估模型结合构建生态阻力面、运用电路理论提取生态廊道3个方面。以武汉城市圈为研究区,分析生态网络关键点和网络结构特征,并将基于兴趣点与生境风险评估模型的生态阻力面构建方法与传统地类赋值法和传统生境