【摘 要】
:
近几年人工智能在图像识别上拥有了越来越多的应用,但是依然存在很多挑战,长尾分布问题就是目前存在的最流行的挑战之一,长尾分布的数据让模型对头部类别的效果远远好于对尾部类别的效果。目前用于解决长尾分布问题的多专家学习中存在着以下两个问题:第一就是在多专家学习策略中,多个专家之间的部分专家会存在间距很近的情况,导致多个专家学习到的知识总和就更少。第二就是现有的多专家网络中的每个专家所学习的知识是不可控的
论文部分内容阅读
近几年人工智能在图像识别上拥有了越来越多的应用,但是依然存在很多挑战,长尾分布问题就是目前存在的最流行的挑战之一,长尾分布的数据让模型对头部类别的效果远远好于对尾部类别的效果。目前用于解决长尾分布问题的多专家学习中存在着以下两个问题:第一就是在多专家学习策略中,多个专家之间的部分专家会存在间距很近的情况,导致多个专家学习到的知识总和就更少。第二就是现有的多专家网络中的每个专家所学习的知识是不可控的,就不能对特定的任务和测试数据做出优化。为了解决第一个问题,本文通过实验证明了问题的存在,然后通过分析问题产生的原因,提出了多专家差异化学习方法。通过把距离最近的部分专家的距离拉开,让每个专家学习到的内容的差异更大,从而让多个专家学习到更多的内容。为了解决第二个问题,本文首先通过计算每个专家在头部类别和尾部类别的准确率来证明了问题的存在,然后根据对结果的分析,提出了基于特征补偿多专家学习方法。本文将特征补偿的策略引入到多专家学习网络中,通过设计特征补偿系数让其中部分专家学习到和训练数据集同分布的知识,让另外的专家学习到经过训练数据集均衡后的知识,并且每个专家学习到的数据均衡的程度不同,在特定的测试集上面我们可以通过调整训练时各个专家的权重来达到更好的效果。本文提出的两个方法在相关的开源长尾数据集CIFAR100-LT、ImageNet-LT、INaturalist2018和Places-LT上做了相关的实验,实验结果表示所提出的两个方法是有效的。通过分析实验结果证明多专家差异化学习能让多个专家的间距变得更均匀,从而让多个专家学习到更多的知识,从而让模型具有更好的效果。基于特征补偿的多专家学习能让模型学习到更加可控的知识,能让部分专家学习到和训练集同分布的知识,让部分专家学习到将训练数据分布平衡后的知识,从而能在训练时更有针对性的赋予各个专家不同的权重。
其他文献
“烟荷包形铜钺”是我国川渝地区春秋战国时期特有的一种代表性器物,对于进一步阐释极具特色的巴蜀青铜文化具有重要意义。本文以四川成都青白江区五里村战国墓葬群出土的19件铜钺为研究对象,对其分类后进行了铸造成型工艺分析,金相观察及合金配比分析,铅同位素比值分析等系列实验。研究结果发现:从铸造成型方式来看,此批铜钺均使用双面范进行浇铸,并且存在使用石范的可能性,通过X射线无损检测系统发现内部型腔具有多种形
跨学科主题学习是以培养学生综合运用所学知识和方法解决实际问题为目标展开的学习方式,具有学科性、境脉性、协作性和融合性等特征。在数学教学中,教师可以通过确立真实性主题、梳理结构化内容、解构递进式任务,围绕大概念的理解展开整合性评价,逐步培养学生的核心素养。
为进一步发挥地理研学旅行的综合实践育人价值,本文围绕“区域发展”主题,融合历史、政治、美术等学科,提出基于跨学科主题的地理研学旅行策略。本文选取湖北省黄石市国家矿山公园为研学地点,从研学主题、研学目标、学科融合、研学路线、研学活动、研学内容、研学评价等七个方面进行案例设计,为基于跨学科主题学习的地理研学旅行的设计提供一种新的思路与方法。
西河滩遗址是我国西北地区发现的新石器时代晚期聚落遗址,也是有关四坝文化内涵的遗址,文化遗存丰富,记录着酒泉地区史前文化、人居环境、聚落形态、人群迁徙、文化交流等各方面信息,具有非常重要的历史价值。首先做好遗址保护是最基本、关键的问题,全面保护遗址本体和景观风貌,再者深入挖掘西河滩遗址的历史、科学和艺术价值,通过开发利用有效实现遗址的社会经济价值,使遗址保护利用与当地发展和民生改善相协调。大遗址保护
脑肿瘤具有高发病率且易致死,是严重危害人类健康的疾病之一,由神经胶质细胞癌变引发的胶质瘤则是最常见的颅内脑肿瘤。随着医学成像技术、高性能计算机及深度学习算法的不断发展,医学图像处理在脑肿瘤疾病的诊断治疗方面发挥着越来越重要的作用。核磁共振成像(Magnetic Resonance Imaging,MRI)是医学上最重要的成像手段之一,其成像环境无电离辐射且是非侵入性的,同时还具有成像分辨率高,软组
心律失常自动识别对于心律失常的及时诊断与治疗具有重要的临床意义。识别心律失常的一个重要依据就是其在心电图(Electrocardiogram,ECG)上的异常表现。但由于心律失常的类型较多,且不同类之间的ECG异常表现会重复或具有很高相似性,使得已有的基于机器学习的心律失常识别方法对于多类心律失常的识别效果不理想。在上述背景下,本文提出了两种新的基于深度学习的心律失常自动识别方法。首先,本文分别提
在临床上,脑电图是研究脑科学的重要工具,也是评价脑功能状态的一个指标,它广泛应用于神经系统疾病以及精神疾病的诊断评估。如今分子生物学和神经影像学等技术快速发展,涌现出许多新的技术,推动了临床诊断以及神经科学领域的研究,但神经电生理技术在探讨脑功能的活动规律及各种疾病的辅助诊断等方面仍有其特有的优势。全麻是通过麻醉药物使中枢神经系统产生暂时抑制的模式。临床表现为全身痛觉消失、失去记忆、肌肉松弛,其基
青铜文物为历史文明的研究提供重要的物质支撑,在基本建设考古前置背景的影响下,青铜文物的出土量日益剧增,随之而来的现实问题便是对于脆弱青铜器的保护研究有待进一步的突破。脆弱青铜器的研究与保护离不开大量的实物标本以及科学的分析检测,鉴于器物脆弱易损的特点,所采集的脆弱青铜器标本更显得尤为珍贵,如何提高标本的利用率,如何科学的存储、管理、利用标本以及进行相关的科学研究,是本研究的重点思考方向。本文的主要
我国西部地区拥有丰富的水资源、有大量的水利水电工程建设,大部分区域都以农林、畜牧业为主要经济产业,径流预测对该区域经济发展规划非常重要。传统径流预测多是基于成熟的水文循环模型,但是径流值的影响因素非常多,各因素之间存在复杂的关系,其预测准确率高度依赖其他因素。而近年来较为热门的机器学习模型又很少结合气象因素等特征,只基于径流值本身的数据规律来进行预测,所以预测效果还有提升的空间。基于以上的问题,本
从第一款数据库管理系统——Integrated Data Store(IDS)的诞生到如今数据库市场的百花齐放,短短几十年,数据库领域发生了翻天覆地的变化。究其背后的原因,在于PC和移动设备市场的欣欣向荣以及21世纪的信息大爆发。近年来,随着新一轮的数据增长,各种非结构化数据占比不断增加,互联网信息数据的网状形态愈发凸显,而埋藏在网状结构下各种有价值信息的挖掘也成为人们关注的焦点。图数据库相较于关