面向数据不规则分布的深度特征学习研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:xaly001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是人类获取信息的直接来源。随着互联网、移动智能设备和社交媒体等技术的迅猛发展,人们可以轻松地获取到大量的图像资源,与单一的小规模学术集不同,人们实际获取的大规模数据往往呈现出多模态,不均衡的分布,甚至是无标签的。本文将这类分布统一称为数据的不规则分布。数据的不规则分布问题广泛存在于学术研究以及实际生活中,尤其是随着近些年深度学习的迅速发展,为图像特征学习提供了强有力的研究途径,获得了计算机视觉等相关研究领域的高度关注,被广泛应用于学术界以及工业界。结合以上两点,针对数据不规则分布的深度特征学习具有显著的理论研究价值和强烈的实际应用需求,本文展开研究了数据不规则分布常见的三个问题,即数据呈现长尾分布问题,数据呈现多模态分布问题,以及训练域和测试域分布不对齐的问题。1)针对长尾分布问题,本文提出了两种方法:可学习的尾部数据扩充方法,Feature Cloud;基于模型抖动信息的的尾部数据扩充方法,MBJ。本文提出将头部类丰富的类内多样性迁移至尾部类来缓解尾部类类内多样性不足的问题。具体地,在特征空间中扩充尾部类的分布,使其具有与头部类相似范围的分布。将一个尾部特征向量替换为一簇特征向量,称之为Feature Cloud。实验结果显示,Feature Cloud在长尾表征学习以及分类学习任务上获得了国际领先水平的性能表现。本文提出利用历史模型之间的抖动信息来丰富尾部数据的多样性。模型在每次迭代后,参数会不断发生变化,产生权重向量的抖动(weight jitter),对应地,给定一张图像,两个历史模型产生的特征向量也是不同的,即会产生特征向量的抖动(feature jitter)。本文认为这些抖动信息为尾部数据的扩充提供了可靠的信息,为此,本文利用存储器将这些抖动信息进行收集,来为尾部数据提供额外的样本多样性。实验结果显示MBJ在长尾表征学习以及分类学习任务上获得了国际领先水平的性能表现。2)针对多模态分布问题,本文提出了一种利用存储器做增强的单方向度量学习方法,称为MAUM。方法包含两部分:单方向度量学习和基于存储器的增强方法。MAUM首先学习多个模态下的专属类代理,接下来利用模态专属类代理去拉近它对立模态的特征向量。进而,本文将由于模型漂移现象产生的多个模态专属类代理进行存储来增加它们的多样性,这为单方向度量学习提供了额外的困难正样本。实验结果表明,MAUM不仅在模态衡均衡情况下获得了国际领先水平的性能表现,在模态不均衡问题上也获得了额外的鲁棒性。3)针对训练域和测试域分布不对齐的问题,本文提出了一种多域图像风格迁移的无监督域适应方法,称为IPGAN。IPGAN首先将源域的图像风格转换为多个目标子域的图像风格以此来减少它们之间的分布差异,并且保证转换后的图像具有与原始图像一致的身份信息。接下来利用风格转换后,具有标注信息的源域数据训练模型并将其应用到目标域中进行测试。实验结果表明IPGAN获得了非常具有竞争力的性能表现。
其他文献
计算机视觉作为新一代人工智能的重要领域,它的蓬勃发展会对国计民生产生重大的积极作用。计算机视觉领域的核心要务是效仿人类视觉系统让计算机理解数字图像或视频中的视觉内容。当下计算机视觉领域中一些视觉认知任务已经取得了长足的进步,诸如图像识别和实例检测等任务。然而孤立地识别和检测实例并不能充分地理解图像中的场景内容,实例与实例之间丰富的关系对理解图像的场景内容也至关重要。因此本文关注于如何探索视觉信号中
功能梯度磁电弹材料作为一种新型复合智能材料,兼具压电材料与压磁材料的优良特性,且材料属性沿空间某方向呈梯度连续变化,内部界面不明显,优化了材料内部的应力分布,具有传统层状复合材料无法比拟的力学性能。功能梯度磁电弹材料最大限度地降低了不同材料之间的性能差异,且其具有优良的多物理场耦合效应,因此,该材料在信息技术、航空航天技术、微机电技术等高新尖技术领域得到了广泛的应用。为进一步发挥功能梯度磁电弹材料
非辐射电磁源最早是在量子力学和天体物理学中被提出来的,然而由于缺乏合适的研究体系,在很长一段时间内它在光子学领域并没有得到太多的关注。随着近二十年来超构光子学的快速发展,超材料和超表面表现出对电磁波强大的调控能力,同时得益于相关理论的提出,人们逐渐发现具有非辐射特性的光学模式在捕获入射光、增强局域电场强度、调控远场散射以及调控微纳米尺度的非线性效应等方面具有非常大的潜力。超表面,特别是具有增强光与
氢能源是未来发展的重要方向之一,电解水制氢是最清洁、最可持续的制氢方式。目前,电解水制氢最有效的电催化剂仍是贵金属基催化剂,而贵金属价格昂贵,储量有限,因此不利于大规模应用。相比之下,非贵金属电催化剂价格低廉、资源丰富且环境友好,有望成为贵金属材料潜在的替代者,实现电解水制氢的大规模工业生产。然而,非贵金属电催化剂的活性不高,因此高效非贵金属电催化剂的设计研究,仍是一项颇具挑战性的工作。本论文通过
金纳米粒子(AuNPs)在化学、生物传感、催化、光电子学、治疗学和诊断学等领域展现出广泛的应用前景。AuNPs的光学、电子和催化特性以及胶体稳定性都受到AuNPs表面配体的影响。聚合物配体不仅可以在不同溶剂中的稳定AuNPs,还可以调控AuNPs的刺激响应自组装和表面图案化,降低AuNPs在血液中的蛋白质吸附,提高AuNPs的生物相容性、血液循环时间和肿瘤递送效率。常见的聚合物通过巯基基团与金表面
自Brookhart在1995年发现了阳离子的α-二亚胺钯和镍催化剂后,后过渡金属催化的烯烃聚合与共聚合受到了越来越多的关注。此后,研究人员发展了大量基于后过渡金属的催化剂和聚合方法,其中有很多性能优异的催化体系,如α-二亚胺钯/镍体系、水杨醛亚胺镍体系、膦磺酸钯/镍体系和膦酚镍体系等。然而,现有的钯/镍催化剂仍然存在一些问题,比如活性低、热稳定性差、制备的聚合物分子量低以及共聚单体插入率低等。这
新兴通信技术以及超大规模集成电路线路板正朝高频、高速方向发展,对基板、层间和模组件低介电材料提出越来越高的要求。然而,传统线路板金属图案化和树脂固化成型配套工艺较为复杂,同时随着特殊应用领域以及异形器件的发展,低介电载板和层间介质也越来越需要具备异形化定制能力。因此,具有可光固化性能的低介电树脂与光刻、3D打印技术相兼容从而实现低介电和图案化集成。基于此,本论文以单/双硅杂环丁烷和苯并环丁烯(BC
激光冲击强化技术通过对材料表层进行高压力、超快速、非接触的激光精准加工,从而调控材料表层残余应力分布、诱导表层梯度微观组织结构,进而实现材料疲劳性能的显著提高,在未来航空抗疲劳制造领域应用前景广阔。然而,目前对于激光冲击诱导金属材料表层微观组织特征及梯度结构的形成仍缺乏深入的理解、复杂工程结构表面残余应力调控技术仍缺乏充分的研究、激光冲击诱导表层残余应力分布与疲劳性能的内在关联仍不十分明晰。本文采
爱库存作为库存电商新生市场中的开拓者和独角兽企业,虽然拥有先行者优势,但其存在商业模式易被模仿、私域流量渠道难以管控等问题,制约了企业发展。因此,本文首先通过对爱库存公司渠道运营现状进行分析,发现其在运营中暴露出的薄弱环节和关键问题,如品牌宣传力度不足、渠道管理混乱、渠道规模发展缓慢等。其次,通过德尔菲法和层次分析法,建立库存电商渠道评价体系,用以分析影响库存电商渠道增长的关键因素,如传播能力、销
精神分裂症被定义为一种关于症状、病程和结局的异质性临床综合征,与其他社会心理障碍具有共同的表现,诊断界限不明确,缺乏客观的生物学诊断指标,从而导致对其诊断不够准确而且难度较大。精神分裂症患者往往需要终身治疗,但早期诊断、早期治疗可能在严重并发症发生之前有效控制相关临床症状,并有助于改善其长期预后。目前使用生物标志物诊断和预测精神疾病的治疗反应仍是一个挑战,探索能够为早期诊断、鉴别诊断提供客观证据的