【摘 要】
:
对于视觉语义嵌入这一任务,现有的方法往往以双极化的方式对待查询样本与候选样本之间的相关性。对于模型而言,这些候选样本只能被看作为与查询样本完全相关或者完全不相关。其中,所有的“不相关”候选样本都会在嵌入空间中被以相同的边距均等地推离查询样本,而它们与查询样本之间实际上多样化的相关性则被完全忽略。这一实践忽视了数据之间相对的区分性信息,并且会在检索任务中带来次优的排序结果,以及更差的用户体验。尤其是
论文部分内容阅读
对于视觉语义嵌入这一任务,现有的方法往往以双极化的方式对待查询样本与候选样本之间的相关性。对于模型而言,这些候选样本只能被看作为与查询样本完全相关或者完全不相关。其中,所有的“不相关”候选样本都会在嵌入空间中被以相同的边距均等地推离查询样本,而它们与查询样本之间实际上多样化的相关性则被完全忽略。这一实践忽视了数据之间相对的区分性信息,并且会在检索任务中带来次优的排序结果,以及更差的用户体验。尤其是在长尾查询场景中,候选数据库中不一定存在一个完美的匹配,此时这一实践带来的劣势会更加明显。针对这一问题,本文(1)首先引入一个用于建模查询样本和候选样本之间的相关性的连续变量,并提出根据这样的连续变量学习一个连贯的视觉语义嵌入空间。在一个连贯的视觉语义嵌入空间中,具有更高相关性的样本会被映射到离查询样本更近的位置,而相对具有更低相关性的样本会被映射到更远的位置。然而在实践中,采集具有这样连续变量的大规模数据集并不现实,因此本文提出通过转换跨模态相似度问题为单模态相似度问题来得到近似结果;(2)同时,通过扩展现有的三元组损失函数所对应的的不等式为一个更加一般化的不等式链,本文提出一个新的阶梯损失函数,并用于实现在嵌入空间中可变的推离边距。其中,不等式链的每个部分均被转化为绞链损失函数的形式并最终组成阶梯函数;(3)本文也基于肯德尔排序相关性系数提出一个新的的连惯性分数指标,用于更加妥当地衡量那些不完全相关候选样本之间的排序结果质量。该指标克服了此前相关工作中所采用的K召回指标忽视非真值候选样本,从而不能合理体现整体排序质量的问题。该方法已经在多个常用的视觉语义数据集,包括Flickr30K和MS-COCO上进行了大量的实验验证。实验结果显示该方法的性能相对现有最好方法有着大幅提升,在保持高的召回率指标的同时,大幅提高了连贯性分数。定性的可视化结果也显示本文所提出方法对用户体验的提升效果。可以预期,本文提出的方法在常规和长尾查询场景下均可提升检索结果排序质量以及用户体验。
其他文献
频发的食品安全、商品假冒伪劣问题使消费者对商品流转信息的关注度日益提升,商品溯源系统作为商品质量的保障之一,得到了广泛的关注和应用。商品溯源系统面临着数据易被捏造篡改、可信度低的问题。使用区块链技术能够保障商品溯源系统中的数据难以被篡改。如何将区块链技术与商品溯源系统结合,在保障数据安全的同时尽量提高数据查询速度,减少冗余数据存储,是本文的研究点。针对商品溯源系统中存在的数据易被篡改、捏造的问题,
现阶段我国经济虽然增长迅速,许多建设取得很大的成就,但与之对应也付出了巨大代价,资源和环境被严重破坏,二者之间的矛盾日趋尖锐。这种情况是经济结构与增长方式不合理导致
会展业作为新兴的第三产业蓬勃发展,已经成为世界经济的重要组成部分。与传统产业相比,会展业有许多突出优势,如高效益、无污染、拉动经济能力强、社会影响力巨大等等。为响应澜湄合作机制,D公司发起举办澜湄合作博览会。展会采用政府引导,市场化运作的运营方法,目前遇到了招展困难等现象。本文以澜湄合作博览会为研究对象,从展会促销这一方向展开研究,以目标营销战略理论和促销理论为理论基础,并通过访谈调查发现提炼展会
数字全息术将传统光学全息术和数字图像处理技术相结合,可以记录和显示物体的三维信息,在众多领域中得到了广泛应用。由于激光源具有高相干性,照射到光学粗糙表面的物体上,造成散射光的随机干涉,形成散斑噪声,不同于非相干的加性噪声,散斑噪声是一种非常难处理的乘性噪声,散斑噪声的存在严重影响了重建图像的质量,因此,散斑噪声的去除在数字全息领域必不可少。本文首先对散斑噪声的成因进行了研究,由散斑的统计特性可知,
随着社会发展,生态环境问题日益受到人类重视.近些年来,学者们通过研究基于实际情况建立的生物种群模型,获得生物种群的发展变化规律,所得结果为保护稀有物种,管理生态资源,维护生态平衡提供了关键性策略,具有重要实际意义.本文基于实际建立了几类有脉冲、时滞和扩散等因素影响的生物种群模型,利用脉冲微分方程理论、Mawhin重合度理论、李雅普诺夫泛函和一些分析技巧,研究系统解的存在性、全局吸引性、持久性等动力
知识表示学习(KRL)旨在将知识图谱所包含的实体和关系嵌入进张量表示空间当中,从而在表示空间中完好地保存图谱的语义和结构信息,该技术广泛应用于自动问答、信息检索等各式各样的领域中。然而,先前工作的嵌入式表示学习结果往往是通过同质学习策略所获得的,即在学习过程中平等地对待每个实体和每个关系,从而忽略知识图谱所固有存在的不平衡性与异构性。因此,知识表示学习算法需要针对知识图谱的复杂结构进行改善,算法学
厌氧颗粒污泥具有活性强、结构稳定和沉降性好等特点,不仅能够保持反应器内具有较高的污泥量和良好传质效果,还可促进反应器的快速启动及高效稳定运行。为了快速培养颗粒污泥,本文在自制高传质内循环厌氧反应器中、对接种污泥进行预处理及在高负荷启动、高提升负荷的工艺条件下,研究了反应器启动特性、颗粒污泥形成及特性、颗粒污泥对反应器重新启动的影响、新建乳品废水厌氧反应器启动运行及颗粒污泥的形成,结果表明:1、厌氧
我国煤炭产量位居世界首位,2020年统计数据显示,煤炭原煤产量超过38亿吨,达到38.4亿吨。相比于巨大的煤炭生产量,煤炭需求量却严重不足,产能过剩问题突出。煤炭企业为了抢占市场份额,谋取利润,竞相为客户提供信用政策,即采取赊销的方式结账。一方面,赊销政策是激烈市场竞争中增加销售收入的必要手段;另一方面,随着赊销政策使用频率的激增,应收账款占资产比重与日俱增,把控风险对企业来说越来越重要。因此,如
树木年轮是包括林学、生态学、树木年代学在内的许多学科领域重要研究对象之一,但现有的商业年轮测量与分析软件价格十分昂贵;另一些免费软件缺乏图形用户界面、兼容性差,这
随着科技的发展,智能结构在航天航空的应用越来越广,因其自身阻尼较低的特点,对其在受外干扰下产生的振动进行控制具有非常重大的意义。智能结构是集驱动、传感、控制器及结构一体化的智能系统,特别是压电作为驱动元件的智能结构。智能材料可以对外界的压力,电等物理量的刺激做出响应,使自身发生形变,并把这些作用转换成电能,从而利用这种驱动特性来抑制智能结构的振动。本文以压电陶瓷和柔性悬臂梁结合而成的智能悬臂梁为研