基于抑制偏见样本的视觉问答研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:wrx5428167
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于计算机视觉和自然语言处理在近年来的快速发展,其衍生任务及交叉任务也成了目前的研究热点。视觉问答任务则是其中的典型之一,其目标在于依靠指定的图像及其对应的自然语言问题来预测答案。然而大多数现存的视觉问答模型在回答问题时强烈依赖于语言偏见,即模型往往倾向于拟合训练时出现过的问题和答案对。当训练数据和测试数据的答案分布不同时,视觉问答模型的表现就会强烈下降。这种行为使得研究者们无法判断模型性能的提升是由于网络结构的优化还是因为语言偏见的影响,同时也导致模型很难应用于真实的场景中。目前这个任务的主要挑战是:要求视觉问答模型充分理解问题和图像的内容,拉进视觉和语言两个模态间的距离,以及在训练样本存在偏见的情况下,克服语言偏见对其产生的不利影响,以根据图像内容预测消除偏见后的答案。现存的集成模型的方法聚焦于整合多个消除偏见的模块来缓解语言偏见,却牺牲了模型回答问题的能力。另外,现有的平衡数据的方法在生成训练数据时会引入新的偏见信息,无法从根本上消除偏见的影响。为了解决上述问题,本文提出了一个抑制偏见样本的视觉问答模型。该模型由两个模块组成,分别是数据分类模块和偏见惩罚模块。数据分类模块利用语言偏见的表现形式和语义空间的相似性,将训练样本分为偏见样本与无偏见样本;偏见惩罚模块通过禁止偏见样本对问题表示的反向传播来强制模型学习无偏见的特征空间,然后利用设计的相似度损失函数来动态的改变得到的损失,降低偏见样本的作用。本文通过在VQA数据集、VQA-CP数据集和VQA-CE数据集上进行实验,并通过具体的实例和统计分析与当前的基准模型进行对比。结果表明,基于抑制偏见样本的视觉问答模型能够在不伤害模型回答问题能力的情况下,缓解语言偏见对模型的影响。不同于平衡数据的方法,采用抑制偏见样本的方法不会引入新的偏见信息。这些发现将为视觉问答中的语言偏见提供一定程度的解决思路,进一步推动这项任务的发展。
其他文献
随着三维点云的快速发展,点云配准技术广泛应用在三维重建、三维地图构建、车辆自动驾驶、无人机巡检等领域。三维点云可通过三维激光雷达采集,由于激光雷达扫描视角的限制,被测物体或场景的完整三维点云的获取需要先利用激光雷达从多角度扫描得到多个部分重叠的三维点云,再将部分重叠的三维点云进行配准。在重叠区域小的情况下,点云配准技术仍存在难以提取特征、配准精度较低等问题。如何快速、精确地实现低重叠率点云的配准具
学位
足腿式机器人较传统轮履式机器人,因其高通过性与灵活性的优势愈发成为研究热点,同时也面临行走机构及运动控制更为复杂的制约。对于足腿式机器人本体机电系统实现与运动控制策略的研究,常因缺乏必要测试条件与基础实验数据,难以准确设定与评估机器人运动性能,使整机平台的设计迭代过程增加非必要成本。本文围绕足腿式机器人单腿性能测试展开研究。针对于中轻型足腿式机器人单腿系统测试需求,论证并确定测试平台构型设计、有效
学位
通过强化政治引领凝聚方向,做到围绕中心;强化问题导向凝聚共识,做到提振信心;推进工作创新凝聚力量,做到下移重心;建设统战文化凝聚人气,做到温暖人心;完善体制机制凝聚智慧,做到共筑同心。基层统战工作这“五心工作法”推进了凝心聚力和协同创新,为基层统战工作筑牢了共同思想政治基础,构建了新时代高校基层统战工作推进发展的新格局。
期刊
我国幅员辽阔,能源分布不均,负荷中心往往与能源中心相距较远。因此,具有输送容量大、线路损耗低等优点的高压直流输电技术(High Voltage Direct Current,HVDC)被广泛应用于新建输电工程中。但高压直流输电系统输送距离长,且线路经过环境较为复杂。相关数据表明,将近一半的直流系统故障发生在高压直流输电线路上。直流输电线路故障对系统的安全可靠运行造成了巨大威胁,因此十分有必要对高压
学位
地质灾害造成的破坏力非常大,对于地方发展和百姓生活产生了严重的损失。地质灾害风险调查评价的目的是减少地质灾害的发生,针对地质灾害进行有效的研究,得到详细的地质灾害数据信息,在未来的灾害治理、灾害预防中得到更好的效果。地质灾害风险调查评价方法比较多样化,通过科学的评价体系以及明确的评价指标,掌握地质灾害的发展趋势和发生机制,减少地质灾害造成的损失,为人类社会发展给出更多的保障。
期刊
世界能源结构的快速转换和全球生态环境的高质量发展使太阳能发电站的建设变得极为重要。选址决策作为电站建设的前期工作,是保证项目顺利推进的关键。然而,目前太阳能发电站的选址方法计算较为复杂且决策结果的经济性不够突出,同时选址过程对影响因素的考虑仍不够全面。基于此,本文对太阳能发电站的选址进行了深入研究,提出了一个太阳能发电站多准则决策选址模型,建立了一个计及人为影响因素的选址指标体系。本文的具体内容如
学位
单相脉宽调制(pulse width modulation,PWM)变换器因具有能量可双向传输、功率因数高、电流谐波污染小等特点,被广泛应用于可再生能源发电、电力机车牵引、有源电力滤波器等场合。目前,单相PWM变换器常用的控制策略是基于坐标变换的矢量控制。然而,矢量控制在动态性能和控制方法复杂度方面还有改善的空间。因此,本文以单相PWM变换器为研究对象,以优化电流控制方法为目的展开研究。全文主要内
学位
燃料电池因其发电效率高、对环境无污染和安装限制少的优点成为分布式发电的优先选择,广泛应用于并网发电系统中。三相燃料电池并网发电系统通常采用两级式拓扑结构,前级DC-DC变换器用于将较低的燃料电池输出电压升压,后级DC-AC逆变器用于将升压后的直流电转换成交流电接入到三相电网中。针对三相燃料电池并网发电系统的研究,往往认为其运行于理想平衡的电网下,此时的控制目标为稳定的直流电压和高质量的并网电流。然
学位
<正>患者,男,18岁。2020年9月5日初诊。主诉:头发变白6年余。因学习压力增大逐渐出现白发,当地医院诊断为“早老性白发病”,口服B族维生素、复方甘草酸苷片及药酒外擦均未见明显好转。刻诊:两鬓、顶部、枕部皆可见明显白发,干枯,形壮,性急,汗多,手足心热,心烦口渴,小便黄赤,大便干结,舌红少苔、舌尖芒刺,脉弦数。中医诊断:少年白发,证属血热伤阴,治宜清热凉血,滋阴乌发。予刺血治疗,取穴:神庭、上
期刊
采用开关电感结构的Boost型变换器具有更高的增益和效能,在光伏、燃料电池等领域受到广泛的研究和应用。然而变换器在运行时输入电压、负载电阻、开关频率、电感电容等参数的变化,系统会出现分岔、多倍周期、混沌、共存吸引子等非线性动力学现象,这类非线性动力学行为会引起变换器低频振荡不稳定、电路性能劣化等问题,将严重影响系统的性能,使系统失去控制,甚至崩溃。因此,本文以开关电感结构Boost型变换器为研究对
学位