基于集成策略的半监督小样本学习方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:yanghao_haohao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
得益于深度学习技术的发展,基于这一技术的各类方法在模式识别、自然语言处理等领域中取得了傲人的应用成果,极大地推动了智能算法的应用落地进程,但基于深度学习理论的各类方法取得良好泛化性能的一个重要前提是使用大量带标注的样本对模型进行训练,因此构建一个性能优良的深度学习模型需要付出较高的人力和时间成本。事实上,人类具备快速学习新事物的能力,对于一个未曾见过的全新事物,人类往往能够在有限的几次观察中快速抽象出该事物的重要特征,并能够准确识别该事物的新实体。受此启发,研究者们开始尝试通过少量带标注的样本构建泛化性能优良的模型,小样本学习问题也就此诞生。小样本学习任务要求使用少量带有标注信息的待识别类样本构建性能优良的分类器模型,本文针对小样本学习任务展开详细分析,并深入研究了影响小样本学习模型性能的关键因素,最终从样本特征分布、样本数量和集成学习三个角度提出创新方法。本文的主要研究内容如下:1.阐述小样本学习问题的来源和研究意义,介绍小样本学习中所涉及的基本方法和理论,详细分析各类经典的小样本学习方法的设计思想,总结构建小样本学习方法的基本流程。2.针对经典的小样本学习方法当中特征提取器的非线性映射能力较弱的问题,提出定向特征偏移网络,该网络能够将样本对应的原始特征向对应的原型估计进行偏移,从而实现同类样本聚集在对应类原型估计周围的效果。经实验证明,该网络能够有效减小同类样本特征之间的类内距离,从而降低分类难度,提升模型的分类准确率。3.为解决定向特征偏移网络中存在的原始类原型估计稳定性和准确性低的问题,提出两种在特征空间中进行数据增强的特征增强方案。结合这两种特征增强方法,定向特征偏移网络中的原始原型估计的稳定性和准确性将得到提升,从而间接提升特征偏移的质量,并最终影响整体模型的分类效果。实验证明,两种特征增强方法都将有效提升模型的最终分类效果。除此之外,由于半监督定向特征偏移网络模型中存在诸多随机计算过程,这与集成学习方法的要求相符,因此还将尝试使用集成策略构建用于解决小样本学习问题的集成模型。实验证明,集成学习方法在小样本学习问题当中行之有效。
其他文献
【目的】旨在分析散发性前庭神经鞘膜瘤NF2基因突变类型或基因状态对肿瘤临床生物学行为的影响及潜在机制,从而更为深入探讨NF2基因病理状态在肿瘤发生和发展中的作用,并提供
多自由度非正交系统(如:工业机器人、太空机械臂、柔性测量机等)以其高效灵活、高精度、高稳定性等特点在各领域(工业制造、空间站建设等)得到大量应用。工业机器人是最具典
现代科学在生物信息、地球科学等领域都以工作流的形式模拟分析现实生活中的活动,云计算的迅速发展为部署这种大规模工作流提供了很好的计算平台,异构云环境中如何有效地实现
物理压力测量在可穿戴电子、机器人等领域非常重要。采用柔性压力传感器阵列可以监测人体与外界环境之间的物理压力,也可以作为柔性机器人皮肤,感知机器与外界环境之间的物理
本课题我们拟通过研究缺氧诱导因子-1α(hypoxia-inducible factor-1α,HIF-1α)与长链非编码RNA(long noncoding RNA,lnc RNA)中的ANRIL(antisense non-coding RNA in the I
目的:检测Sp1在NK/T细胞淋巴瘤(NK/TCL)细胞株中的表达特点,探讨Sp1对肿瘤细胞侵袭的作用及其可能的调控机制。方法:RT-PCR、Real-time PCR、免疫荧光和蛋白印迹技术测定NK/T
近年来工业4.0概念逐渐兴起,数据共享是其重要特征,这对工业现场信息互联技术提出了很高要求。为此,OPC基金会提出了新一代工业互联技术统一架构OPCUA,它是一种安全、可靠、
我国《刑法修正案(八)》以及《刑法修正案(九)》均废除了若干法定最高刑为死刑的罪名,这离我国废除死刑的目标又近了一大步。但是,依据中国国情,在一定的时期内立法上仍然会
作为一种即传统又常见的经济型犯罪,职务侵占罪一直活跃在司法机关的视线中。但由于社会的跨越式发展和不断变化,对于现实中许多犯罪行为以职务侵占罪认定时,总是遇到许多疑
脑机接口(Brain-Computer Interface,BCI)作为多学科交叉应用的新兴研究技术,受到等众多领域的青睐,比如,神经科学、人工智能、模式识别。脑机接口是一种全新通信技术,可以不