基于聚类引导和语义扩展的零样本学习方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:dashunyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来机器学习技术已取得长足的进展,广泛应用于图像识别、分类等领域。基于机器学习解决图像识别通常需要大量有标注的样本用于训练模型,但现实中会存在一些稀有或细粒度对象类难以获取训练样本的情况,零样本学习(Zero Shot Learning,ZSL)应运而生。零样本学习旨在解决训练集和测试集没有类别交集的情况下对测试集的正确分类问题。为了区分起见,零样本学习中通常称训练集为可见类样本集或可见类训练集,测试集为未知类样本集或未知类测试集。零样本学习通过迁移已知类的知识到未知类,实现未知类样本识别,迁移的知识必须能把可见类与未知类关联起来,通常假设所有可见类和未知类共享语义空间,并且语义空间与特征空间相关。映射域漂移是制约零样本学习性能提升的一个关键问题,导致该问题主要原因是从特征空间到语义空间的映射是基于可见类学到的,因此学习到的映射应用于未知类从特征空间到语义空间的投影很可能产生偏差。为了解决映射域漂移问题,研究人员提出了面向零样本学习的语义自编码器,不过受限于语义向量的表达能力以及样本与语义向量之间的多对一对应关系,该方法仍有待改进。本文以语义自编码器(Semantic Autoencoder,SAE)为基线模型,研究了基于聚类方法扩充辅助样本以及对语义向量进行扩展,应用于SAE增强了ZSL的图像分类能力。本文还借鉴了DAP(Direct attribute prediction)方法的思想,提出了一种基于注意力的语义向量学习网络(Attention-based Attribute Learning network for ZSL,AALN)。具体地,本文工作主要包括以下三个方面:1、提出基于扩充样本的零样本学习。在传统SAE零样本学习方法中,直接基于训练样本集学到的映射函数预测测试样例的语义向量,进而进行分类。由于同类的多个样本对应一个语义向量,而如果测试样本是噪声点或者离群点,势必产生分类错误。因此提出基于辅助样本的零样本学习方法,即引入无监督聚类算法,限定测试样本的搜索范围,再根据聚类原型、聚类后类内k近邻特征融合和基于k近邻的投票方法改进SAE,提升零样本分类性能。2、提出基于语义相似度性的语义向量扩展。经典的SAE中,每类的语义向量由人工标注的属性值构成,这种语义向量不能有效区分相似类。为了判别地描述各语义向量,描述原语义向量之间的关系是必要的。借鉴人类的认知过程,本文提出基于语义向量预聚类和语义向量相似度的语义扩展方法,类间判别性描述信息的引入提升了SAE的零样本图像分类性能。3、提出基于注意力的语义向量表示学习网络,DAP方法通过监督学习得到属性向量每一维的后验概率,对属性向量的每一维单独进行预测。但每个样本的特征对单一的属性值的预测是存在冗余的,通过为每个样本特征计算注意力向量,提取样本特征针对语义向量每一维的贡献,从而提升直推式零样本图像分类方法的性能。
其他文献
近年来,随着微电子封装技术要求的提高以及高新技术的不断更新,传统微电子制造封装设备技术面临巨大挑战。其中,封装技术要求的提升对高动态工况下封装设备的静动态稳定性、精度等各方面性能都有严峻的考验。本文针对运动平台系统研发过程中的相关问题,设计搭建了基于宏微复合运动方式的XYθ运动平台系统。文章对该运动平台系统总体结构进行分析,包括对运动平台开展动力学分析、振动耦合解耦方法研究等。基于平台的相关分析研
在党的十九大上,党中央提出了要实施“乡村振兴”战略,彻底解决农业不发达、农村不兴旺、农民不富裕的“三农”问题,消除农村贫困,实现中华民族伟大复兴。贫困是我国决胜全面建设小康社会、全面建设社会主义现代化强国的道路上所迈不开的问题。我国现阶段的贫困基本都集中在农村,而农村的贫困人口主要集中在中国的西部地区,包括西北地区农村。西北地区因为地理和历史等种种原因,贫困现象依然严重,特别是在残疾人、农村留守老
目的:为了提高外源基因在杜氏盐藻(简称盐藻)细胞中表达量,本论文从建立新型的盐藻自转化方法、采用细胞穿膜肽介导、联合细胞核定位肽应用等策略,进行外源基因对盐藻细胞的转化工作,力求提高外源基因的表达量。在获得高表达藻株的基础上,对转化株的遗传稳定性进行分析,最终制备高表达外源基因遗传稳定的转化盐藻藻株。方法:利用盐藻自身能够适应不同盐浓度的特性,当高盐浓度(1.0M)瞬时变为低盐浓度(0.1M)时,
中国经济的高速发展提高了居民的生活水平,这也使得人们在生活娱乐方面的消费观念越来越强,这种消费意识的改变为第三产业的兴起奠定了坚实的基础。而第三产业的兴起也使得文化传媒企业得到了越来越多的重视。文化传媒行业作为新兴产业,具有诸多独有特点,比如消费群体广泛,经营模式多样,政府政策导向等。同时,文化传媒行业所具有的流动资产以及无形资产规模庞大,固定资产所占比重较小,高风险的生产经营模式以及未来收益不确
本文以聚已内酯二元醇与异佛尔酮二异氰酸酯等主要原料反应,制得聚己内酯型聚氨酯丙烯酸酯低聚物(PCL-PUA)。通过控制两步反应的原料和合成工艺得到低聚物,应用于光固化3D打
类风湿关节炎(rheumatoid arthritis,RA)是一种自身免疫性疾病,其基本病理改变为滑膜炎、血管翳形成,临床上部分RA患者膝关节可受累,在炎症基础上易早发骨和软骨退行性改变,出现膝关节骨性关节炎(Knee osteoarthritis,KOA),导致患者生活质量下降。传统方法均不宜评估RA患者膝关节早期退行性病变。肌骨超声(musculoskeletal ultrasound,MS
本次同声传译实践的语料来自第四届全国“2019大学生阅读推广高峰论坛”中王余光教授发表的主题为“经典阅读与人文精神”的演讲。本次同声传译中发言人的讲话风格偏口语化,语料题材以记叙和议论为主,内容涵盖较多历史故事和人物事件,以及大量的文化特色词,需要口译员具备扎实的历史文化知识储备。同时,语料涉及的部分年代数字给本次同声传译实践增加了难度。此外,语料中对历史事件的记叙和带有个人观点的议论需要口译员能
随着二维材料的出现,人们发现二维材料在电学、光学以及力学领域拥有众多其体材料所不具备的优异特性。与传统的共价键有所不同,二维-三维(2D-3D)范德瓦尔斯异质结(vdWHs)结合了
在蛋白质分离纯化领域,组氨酸标签应用十分广泛,当前已有很多方法用于分离纯化携带组氨酸标签的重组蛋白,但这些方法通常都有一些局限性,如吸附材料制备复杂、吸附量低、成本较高或分离纯化过程繁琐等,因此,开发简单高效的组氨酸标签蛋白分离纯化方法具有重要意义。利用简单的制备方法,本研究分别获得了螯合镍离子的柠檬酸钠包裹的磁性四氧化三铁纳米粒子(nano magnetite coated by sodium
在我国经济社会快速发展的今天,商业综合体的发展也在其中扮演着越来越重要的角色。特别是在一些一二线城市,商业综合体的数量几乎成为了城市经济活力的衡量指标,并且这一趋势也已经向三四线城市快速蔓延。经济快速发展的同时,人们的工作效率和生活节奏也在不断地加快,因此人们更渴望能在工作休息之余在物质生活、精神娱乐方面得到一站式的满足,而大型商业综合体的建设正是这一社会需要的必然产物。然而只有数量的增长只是短时