基于对抗学习的地图搜索引擎查询改写

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:pjlkj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在搜索引擎中,用户错误拼写和错误输入一直以来都是一个严重的问题,因此,在搜索引擎技术发展的早期,查询改写就是一个具有较高重要性的模块。查询改写模块接收用户的错误查询字符串,通过一系列模型或者算法预测用户的真实意图,并改写为正确的查询字符串,这一模块对于保障搜索引擎的使用体验,提高搜索转化率至关重要。对于滴滴出行等基于位置服务的APP,往往都通过一个地图搜索引擎来实现订单下达,然而,地图搜索引擎中的查询改写和通用网页搜索中的查询改写存在较大的不同。基于地图检索的实际业务特点,我们创造性地提出了异地干扰问题和查询-文档标题语义隔阂,这两个问题在地图检索中广泛存在,而且现有的查询改写方案都没有对这两个问题进行改进。在当前流行的Seq2seq查询改写模型的基础上,我们设计了一种新型的双注意力机制,用于解决异地干扰问题。这一机制是对传统的注意力机制的扩展,允许模型在平行语料对齐之外,学习当前的错误查询和正确查询分别和城市条件的关联性,并且使用可学习的权重将两种注意力打分进行融合。我们同时设计了一系列更加常见的对比方案,证明了我们设计的双注意力机制的有效性。另外,为了解决查询-文档标题语义隔阂问题,我们还设计了一种对抗训练机制。其中,与传统的对抗训练采用分类模型作为判别器不同,我们创造性地采用了语义匹配模型作为判别器,这帮助我们为Seq2seq模型引入了额外的监督信息,实现了传统生成对抗网络所不能实现的功能,并且我们的语义匹配模型借鉴了当前更为先进的Transformer结构。另外,为了解决对抗训练中文本数据不可微且稀疏性强的问题,我们采用了策略梯度和蒙特卡洛树采样等强化学习技术,实现了模型的端到端训练。在滴滴出行的真实线上数据的测试证明,我们的方案能带来非常可观的提升,同时和其他baseline方案的对比说明,我们的方案对异地干扰和查询-文档标题语义隔阂问题解决的更为彻底。
其他文献
1,6-共轭加成反应是一种可以增长碳链的有机化合反应,而对醌甲基化物(p-QMs)由于其独特的分子结构,是该类反应最理想的底物之一。不对称二芳基甲烷衍生物是很多具有生物活性分子的核心骨架,如二芳基甲基硫醚衍生物显示出潜在的抗肿瘤和抗疟活性;不对称三芳基甲烷衍生物是一种有趣的结构基序,被广泛用于药物,功能材料和有机合成中。本文利用p-QMs作为母体结构单元与不同亲核试剂,如硫酚、β-酮酸以及2-萘酚
硝基苯酚是最常见的水体污染物之一,开发高效的硝基苯酚还原反应催化剂已成为十分迫切的需要,而负载型纳米钯催化剂是用于催化硝基苯酚还原反应的常用催化剂。本文采用氮气辉光放电等离子体还原法,分别以石墨烯、镁铝水滑石和二硫化钼为载体,合成出一系列的负载型纳米钯催化剂。通过XRD、TEM、FT-IR、Raman、XPS等手段对催化剂结构、形貌和表面组成进行了表征,并将上述合成出的催化剂应用于催化硝基苯酚还原
随着大数据业务的不断发展和人工智能及5G技术的广泛应用,数据规模已呈爆炸式增长,如何对数据进行高效处理已成为亟需解决的问题。量子计算利用了量子叠加性和纠缠性处理计算任务,在解决特定问题上具有明显加速优势。近年来,将量子计算应用于经典机器学习算法中,以谋求量子加速效应,从而更高效地处理数据已成为研究趋势。但目前国内外对量子机器学习算法的研究大多为理论推导,很少涉及对实现算法的量子电路的研究。因此,本
近年来,我国越来越多的人选择自主创业,新创企业在我国经济繁荣发展的过程中发挥着重要作用。国家和政府为鼓励创业出台了很多创业扶持政策,创业活动非常活跃,然而创业的结果并不理想。创业失败主要是因为创业者对创业实践的规律认识不够,在多变的创业环境中没有创业知识与资源的支撑很难识别到创业机会,创业机会识别作为创业的起始阶段对整个创业过程发挥重要作用,创业者无法识别创业机会就无法对机会进行深入开发,针对这一
近年来,伴随着可穿戴电子器件日益增长的需求,可拉伸电子技术得到了巨大的发展。可拉伸电子器件超越了传统器件在机械性能方面的限制,极大的拓展了传统电子器件的应用范围。在这一系列的新型电子之中,基于功能导电液体的液态电子器件展现出了独特的优势。导电液体由于其良好的流动性及变形能力,能够在承受扭转、拉伸及弯曲等多种应力应变,并且在重复变形时依然保持稳定的电学连接,体现出其出色的耐久性及可靠性。多种功能导电
信息技术的发展给当今世界带来“知识爆炸”,随着教育信息化的发展,在线学习在教育教学中得到了普遍的应用。人工智能在计算机领域所蕴含的庞大潜力将会给在线教育领域带来新的活力,很大程度上推进个性化学习的发展,将“自适应学习”成为可能,为传统教育以及在线学习带来辅助和补充作用,在互联网层面确保每个人都可以拥有平等的受教育的机会,优质的教育资源,终身学习的能力。因此,本文以关联主义学习理论、有意义学习理论和
1.铜催化环丁酮肟酯开环重排及开环炔基化反应的研究近年来,越来越多的研究表明,可以通过使用廉价铜替代铑、钯、镍等过渡金属的方式来实现C-C的断裂。进一步的研究表明,铜也可以代替铱、钌等作为光诱导反应催化剂从而实现C-C、C-N、C-O以及C-S的交叉偶联。在此,我们在探究铜催化C-C键活化实现环丁酮肟酯开环重排反应的同时又提出了 一种新的实现C(sp3)-C(sp)交叉偶联方法,包括C-C键的断裂
2016年,教育部提出将“思想品德”教材名称更改为“道德与法治”,新编教材不管是知识内容还是结构编排,都比旧版教材更能凸显新课标的教育理念和学习方式。而“探究与分享”栏目是人教版初中《道德与法治》教材所占比例最大的新增栏目之一,是对教材正文内容的辅助及延伸,为教师开展探究活动提供了丰富的教学资源,所以,运用好此栏目对培养学生的学科核心素养,提高课堂教学实效性具有重要意义。通过对相关文献的研读分析,
知识产权指向的客体是智力成果---各种类型的作品。互联网时代大背景下,发达的网络技术让各类信息知识低成本传播,造成相关产权人的权益流失。知识侵权现象由原来的作品人之间演化到普通互联网用户之间。传统方式下原创人以法律作为保护自身知识资产的单一维权途径已不再高效,当前产权交易多以第三方托管的形式存在,而第三方中介在为买卖双方提供接口的过程中会出现数据沉淀、缓存原创者作品的行为,进而出现数据新鲜度不足和
面临国内国际复杂多变的经济形势,承载我国政府宏观经济调控和具体经济产业政策落实职能的税务部门之重要性越发突出。而作为税务部门的行政管理中枢的秘书机构,也面临着新的要求和挑战。2018年机构改革完成了国地税部门合并和一系列内部机构职能改革,我国税务部门秘书机构的设置及职能也随着发生新的变化,进入一个新的时期。新时期税务部门的秘书机构因其面临的经济税收形势、所在的机构背景、承担的行政职能而呈现出一系列