基于信息扩散的虚拟样本生成技术研究

来源 :北京化工大学 | 被引量 : 3次 | 上传用户:yangfanyuanhang1020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据的来临促进了数据驱动建模的萌芽与成熟,不计其数的数据在不同领域里迸发和累积。然而样本发生概率低、获取成本高,致使可用于建模研究的有用样本数量有限。数据驱动模型的性能好坏关键在于训练样本的数量,造成模型在小样本集上学习能力不佳、泛化能力不强和精度较低的根源在于小样本数量缺乏、分布不平衡或者不均匀。如何解决小样本问题以建立稳健且精确的模型至关重要、刻不容缓。当前处理小样本问题一般有两种途径:一是直接借助相关理论和知识,例如灰色理论和机器学习;二是通过间接的手段扩充原始小样本集,譬如向其添加虚拟样本。为了生成合理的虚拟样本,本文提出了一种基于整体趋势扩散技术和蒙特卡洛的虚拟样本生成方法,用于增强模型在小样本集上的性能。所提方法运用整体趋势扩散技术估计样本扩散的扩展区域,同时用三角隶属函数推估样本的分布趋势,创建三角概率分布模型,然后采用蒙特卡洛方法抽取虚拟样本,有效填补样本的信息空白,用于提高极限学习机的性能。通过两个工业数据集:多层陶瓷电容器(multilayer ceramic capacitors,MLCC)和精对苯二甲酸(purified terephthalic acid,PTA)数据集对该方法进一步验证。实验结果表明,所提方法是一种有效的、可靠的且先进的虚拟样本生成方法。
其他文献
近年来,随着利率市场化改革和互联网金融海量交易的冲击,中小型商业银行和外资银行也步步紧逼,给传统的国有银行带来了危机感,国有银行员工的流动性随着金融业的竞争压力和不断涌现的发展机遇而越来越强,离职率正在不断攀升。面临着人才的快速流失,国有银行的当务之急就是稳定人才,降低离职率。青岛地区金融市场种类繁多、交易量活跃,某国有银行青岛A分行(以下简称A分行)是极具代表性的国有银行,近几年来离职率逐渐上升
众所周知,非线性光孤子动力学及其操控在非线性光学、光信息处理中具有重要的研究价值和现实应用。早些年,有关光孤子脉冲压缩的研究,人们往往利用绝热方法。近年来,本课题组提出了量子绝热捷径技术的概念,用以加速量子绝热的慢过程,并广泛应用于原子、分子和光物理。本论文将利用量子绝热捷径技术研究非线性光纤中光孤子动力学的快速非绝热操控,取得的成果如下:(1)以单模光纤中的非线性薛定谔方程为模型,对系统的增益/
RNA是以DNA为模板转录形成的一条单链分子。它既是信息分子,又是功能分子,除了作为遗传物质传递信息外,RNA在基因表达、信号传导等生命活动中也有着重要的催化和调控作用。结构的多样性决定了功能的多样性。然而,以PDB中蛋白质已有的结构数量为基准,RNA的结构还不足1%,这与RNA结构柔性所导致的研究方法缺乏直接相关。另一方面,随着生物学的发展,结构研究已经不再局限于静态结构,对于柔性单链的RNA而
战后日本接受美国占领军的民主化改革,民主政治正式取代以天皇为中心的封建君主专制政治,政党政治成为日本的政权组织形式。这期间,伴随着大大小小的企业如雨后春笋般出现,这些代表企业利益的商人团体需要发出自己的声音,保障和维护自身利益,需要与立法和行政机关沟通交流,政商互动关系就此出现。拥有不同观念立场的商人为争取有限的公共资源,不断尝试去影响国家政策的制定和决策过程。为了获得利于自身发展的优惠政策,商人
随着互联网技术的高速发展,信息数量激增,因此科研人员需要花费更多的时间来寻求合适的合作者,这在一定程度上制约了科研工作者在学术上的创新与发展。为科研人员找到合适的合作者进行推荐,能够有效促进知识的交流与创新,节省科研人员发现合作者的时间,最终对学者科研水平的提高和科研成果的增加都有很大帮助。本文研究内容主要包括以下方面:首先,针对现有半同步标签传播算法在标签更新过程中出现的随机性问题,提出一种基于
中邮人寿保险股份有限公司自2009年成立以来,仅用9年便跻身全国寿险公司前列,这主要得益于“自管+代营”的特色模式及渠道的鼎力支持。本文正是在“自营+代管”特色模式的背景下,积极探索公司保险团队及渠道团队的优劣,旨在充分整合邮政企业资源优势,强化“自营”、“代管”两个条线团队成员队伍建设,全面提升团队综合销售能力,解决邮政企业因“双定”形成的理财经理团队缺乏及高端客户流失问题,与此同时通过优化团队
通过对光束做适当的相位调制,可在自由空间中观察到自加速光束(或称弯曲光束)——一类具有弯曲传输轨迹的光束。“自加速”的概念最先提出于量子力学领域,在2007年才引入到光学领域。由于具有自愈性、无衍射性和自弯曲性,自加速光束被广泛应用于粒子操控、诱导等离子通道和控制放电过程等方面。自加速光束的快速发展也促进了其它领域(如物质波、声波和水波等)里弯曲传输波包的实现。以艾里光束为代表的传统自加速光束本质
1992年Allen等人关于近轴标量光束轨道角动量的开创性工作【Phys.Rev.A 45,8185(1992)】把光学角动量变成了这些年来光物理的一个重要研究热点。差不多在同一时间Jordan和Hall关于方位角偏振光束的理论研究工作【Opt.Lett.19,427(1994)】又开创了矢量光束这个研究领域。1998年Berry通过对近轴光束自旋角动量的研究【Proc.SPIE 3487,6(1
随着工程实际对结构优化设计要求越来越高,近年来也有越来越多商用CAE软件加入了拓扑优化模块,但由于其开放性问题,难以快捷兼容不断推陈出新的拓扑优化理论,越来越不能满足工程对结构多样化和个性化的需求,在某些方面这些商业软件可能存在滞后性,有时并不能及时对接需求。本文基于高开放性和高扩展性的SiPESC科学计算平台,针对一种新的拓扑优化算法,移动可变形组件法(Moving Morphable Comp
随着移动互联网的快速发展到现在的5G正式商用,标志着万物互联时代的正式开启。可穿戴设备作为物联网应用的焦点,迎来了广阔的发展空间。目前市场上的智能穿戴产品多工作于体