基于对抗式数据增强的深度文本检索重排序

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户：yap1711

【摘要】

：

在信息检索领域的排序任务中,神经网络排序模型已经得到广泛使用.神经网络排序模型对于数据的质量要求极高,但是,信息检索数据集通常含有较多噪音,不能精确得到与查询不相关的文档.为了训练一个高性能的神经网络排序模型,获得高质量的负样本,则至关重要.借鉴现有方法doc2query的思想,本文提出了深度、端到端的模型AQGM,通过学习不匹配查询文档对,生成与文档不相关、原始查询相似的对抗查询,增加了查询的多样性,增强了负样本的质量.本文利用真实样本和AQGM模型生成的样本,训练基于BERT的深度排序模型,实验表明,

【作者】

：

陈丽萍任俊超

【机构】

：

东北大学理学院

【出处】

：

计算机系统应用

【发表日期】

：

2021年7期

【关键词】

：

神经网络排序模型稠密表征信息检索对抗式数据增强生成模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于北斗的城市垃圾清运系统

为建设更美好的市容市貌,降低运输车辆的空车率,实现源头追溯与全流程透明化管理,结合目前通用的软件开发方式与数据库技术,给出了以智能化,绿色为主的城市垃圾清运系统.该系统以北斗定位数据为基础,辅助以高德开放平台来进行设计开发.系统的开发采用基于PHP语言的ThinkPHP框架以及B/S架构设计模式,客户端采用Ajax和Web技术等方式实现数据的传输和展现.该系统旨在为用户提供车辆实时位置查询、车辆历

期刊

北斗定位车辆运输PHP语言轨迹数据数据采集

融合双注意力与多标签的图像中文描述生成方法

图像描述是目前图像理解领域的研究热点.针对图像中文描述句子质量不高的问题,本文提出融合双注意力与多标签的图像中文描述生成方法.本文方法首先提取输入图像的视觉特征与多标签文本,然后利用多标签文本增强解码器的隐藏状态与视觉特征的关联度,根据解码器的隐藏状态对视觉特征分配注意力权重,并将加权后的视觉特征解码为词语,最后将词语按时序输出得到中文描述句子.在图像中文描述数据集Flickr8k-CN、COCO

期刊

图像描述图像理解图像中文描述注意力机制图像多标签

智能防御的私有云打印系统

针对打印服务中普遍存在的易受攻击、数据泄密等安全风险以及它的安全等级完全依赖外部环境的信息安全建设的特点,提出一种基于智能防御的私有云的安全打印架构.该架构以私有云技术为基础采用虚拟打印技术为打印服务提供统一的透明的访问接口,并结合身份验证和打印安全策略对打印业务流进行监控管理,同时应用一种端末的网络访问控制策略实现打印输出端在网内的安全隔离,以达到按需访问和智能防御的目的.Jmeter进行系统压测和hping3进行安全性测试的结果表明,在没有遭受攻击时,提交作业和作业输出这2个业务流分别在400并发用户

期刊

私有云虚拟打印打印安全管理智能防御

多维医疗影像数据管理系统

由于医疗领域数据的专业性、复杂性、多样性,人工智能技术在医疗领域发展过程中存在样本数据缺乏的问题.本文针对算法研究人员设计并开发了多维医疗影像数据管理系统,系统包括数据预处理模块、数据管理模块以及数据可视化模块,能够半自动化的生成具有分类标签的医疗影像数据,对影像数据进行高效管理,并且对系统中数据的分布特点以图、表的形式进行可视化展示.

期刊

医疗影像数据计算机断层扫描数据可视化模态数据清洗

基于UVM的AMBA总线接口通用验证平台

根据摩尔定律的发展规律,集成电路的规模越来越大,单颗芯片可集成的电路越来越复杂.在一个SoC芯片的研发周期中,前仿验证工作随着芯片功能复杂程度验证难度增加,导致前仿验证时间不可控,如何在有限时间内可靠的、高效地完成复杂芯片验证工作是目前面对的问题.针对这一问题,本文定制一个基于UVM方法学的AMBA总线接口通用验证平台,该平台结构具有可扩展性、验证激励具有随机性、验证结果具有可靠性,能够支持AMBA-APB、AMBA-AHB、AMBA-AXI接口类型的待测模块的验证工作.针对目标可以快速地搭建验证平台,减

期刊

验证AMBAAPBAHBAXIUVM

基于RISC-V的服务器管理控制器FPGA原型设计

服务器管理控制器是云计算装备关键部件之一,目前主要基于ARM架构开发,ARM较高的授权费推高了控制器设计成本,不利于SoC相关产品的迭代和升级.RISC-V是近年提出的一种开源的处理器架构,与ARM同属精简指令集,具有模块化、可扩展等诸多特点.本文采用RISC-V开源处理器BOOM核心,设计实现了一种基于RISC-V处理器的服务器管理控制器FPGA原型系统.该系统基于Xilinx的Virtex Ultra Scale 440 FPGA进行了原型构建,完成了实际应用场景下的功能测试和CoreMark测试,结

期刊

RISC-V服务器管理控制器

基于申威1621函数库的断流水指令替换方法

基础数学函数库是高性能计算机中最基础、最核心的底层软件之一,它的性能直接决定了上层计算程序的运行效率.现版本的国产申威基础数学库中部分函数使用rfpcr和wfpcr指令导致流水线中断,降低了函数的性能.针对这个问题,本文结合函数的功能和指令特性,提出指令段功能等效替换方法.实验表明,运用该方法,使得函数性能平均提高27.83%.

期刊

数学库流水线性能指令等效替换

基于Logistic混沌映射优化的君主蝶优化算法

君主蝶优化算法(Monarch Butterfly Optimization,MBO)是2015年提出的一种模拟君主蝶的迁徙行为的元启发式算法.通过对MBO的研究发现其在处理高维问题时易陷入局部最优与迁移算子产生的子代受父代影响过大的问题,本文提出新算法,Logistic混沌映射君主蝶优化算法(Monarch Butterfly Optimization with Logistic Chaotic Map,LCMMBO),使用Logistic混沌映射扰动最优解以增强其跳出局部最优的能力,优化了迁移算子中子

期刊

君主蝶优化算法高维混沌映射

基于编解码网络的人脸对齐和重建算法

针对现有的三维人脸重建模型复杂度较高和对多种人脸姿态重建效果不佳的问题,本文提出了一种可以在不同人脸姿态条件下,有效地实现人脸对齐并从单张二维人脸图片重建出三维人脸的卷积神经网络.首先设计了由密集卷积网络模块和转置卷积模块构成的编解码网络,并在损失函数中引入图像结构相似度评价,构造新的损失函数,通过训练神经网络得出模型,模型实现了人脸对齐和三维人脸重建任务.在AFLW2000-3D数据集上验证性能

期刊

编解码网络密集卷积网络损失函数三维人脸重建人脸对齐

融合多种策略的改进粒子群算法

为有效解决粒子群优化算法(Particle Swarm Optimization,PSO)容易陷入局部极值及进化后期收敛速度慢、精度低等缺点,提出了一种融合多种策略的改进粒子群算法(Improved Particle Swarm Optimization,IPSO).该算法包括以下4点改进:(1)采取分组控制策略,按适应度值将种群分为优解组和劣解组,优解组进行遗传交叉操作,劣解组进行变异操作;(2)精英策略用来更新种群,根据适应度值从经过交叉和变异操作后的种群及初始种群中选出前一半粒子作为新种群;(3)改

期刊

粒子群算法分组策略精英策略概率控制

基于对抗式数据增强的深度文本检索重排序

与本文相关的学术论文