融合知识表示学习的个性化搜索方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:blackhorse1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展使得信息规模呈爆炸式增长,信息检索已经成为人们从海量数据中高效获取信息的重要方式。其中,个性化搜索作为信息检索中的一个重要任务,已经成为提高信息检索水平、提升用户检索体验的关键步骤,在工业领域得到了快速发展。个性化搜索作为搜索引擎发展的必然趋势,已经成为各大搜索引擎企业提高搜索准确率、提升搜索服务质量的重要手段。目前,个性化搜索在学术领域也受到了广泛的关注。首先,在个性化搜索的研究领域缺乏被广泛认可的公开数据集。出于隐私保护、信息安全以及商业机密等原因,拥有海量查询日志资源的搜索引擎无法公开原始数据。已公开的查询日志数据集普遍存在缺失关键信息的问题,例如缺失统一的用户标识符、缺失查询内容或文档内容。其次,模糊查询具有歧义性和重查询行为的识别已经成为阻碍个性化搜索技术发展的关键问题。(1)本文通过分析现有的查询日志,选取大规模数据集AOL查询日志作为构建个性化搜索数据集的数据源,提出了基于AOL查询日志的个性化搜索数据集构造方法。为了解决大规模数据处理中存在的处理效率低和空间不足的问题,提出了改进的BM25算法,提高算法效率超过6倍。基于该方法构建个性化搜索基准数据集AOL4PS,通过对该数据集的统计分析以及与现有数据集的对比,阐明了该数据集在个性化搜索任务中的适用性和优越性。(2)为了解决模糊查询具有歧义性的问题,本文提出了融合知识表示的个性化表示方法,通过融合词嵌入中的语义信息和知识表示学习中的结构化信息,对查询进行个性化表示,学习查询级的用户兴趣特征。进一步,为了解决重查询行为的识别问题,本文提出了动态融合个性化表示和查询序列编码的个性化搜索方法(PRQSE),通过循环神经网络编码用户历史查询行为,建模包含时序信息的序列级用户兴趣特征,并通过双层注意力机制捕获基于查询级和序列级的用户重查询行为。(3)为了验证本文提出的PRQSE模型的有效性,在AOL4PS数据集上与主流的个性化搜索方法进行对比实验,实验结果显示PRQSE模型在多个指标上都显著优于现有的个性化搜索模型。这表明本文提出的模型能够有效融合词嵌入信息和知识表示学习中的结构化信息,实现对查询的个性化表示,对用户历史行为的编码,和对用户重查询行为的有效识别,从而提升个性化搜索效果。
其他文献
交通拥堵是各大城市面临的一个日益严重的问题,快速准确的交通状态预测和识别技术能够为交通管理提供信息支持,帮助驾驶员合理规划出行时间,避开拥堵路线。本文主要对交通状态预测和交通状态识别展开研究,主要研究工作为:(1)阐述交通状态判别指标以及国内外交通状态等级划分,确定本文选用平均速度和交通拥堵指数作为交通状态预测指标,依据从百度地图智慧交通平台中采集的北京市城市道路路段平均速度和交通拥堵指数数据,结
据教育部网站消息,全国政协第三十一次重点关切问题情况通报会1月13日举行,通报会围绕深化新时代教育评价改革有关情况进行交流讨论。教育部党组成员、副部长宋德民通报教育评价改革情况,全国政协副主席陈晓光、刘新成出席会议,全国政协常委、提案委员会主任李智勇主持会议。宋德民表示,教育部把深化教育评价改革作为重点攻坚任务,作为"龙头之战""最硬的一仗",成立专门工作组,
期刊
非人源性唾液酸N-羟乙酰神经氨酸(N-glycolylneuraminic acid, Neu5Gc)是红肉中潜在的致癌性因子。唾液酸转移酶是涉及转运其前体物质的关键酶之一。大鼠用不同浓度的山奈酚(kaempferol,KA)和槲皮素(quercetin,Qu)灌胃,并模拟宰前对Neu5Gc合成影响的结果表明,不同浓度的KA、Qu对大鼠体内肌肉组织、肝和肾中Neu5Gc的含量均有一定的影响,最大抑
随着语文课程改革的不断深入推进,小学语文教学不仅要重点突出学生学习的主体地位,还要进一步重视学生自主学习能力的培养,确保学生主动积极参与语文学习,从而实现由教师被动的教学转变为学生主动地学习。培养学生良好的语文自主学习能力,促进学生听说读写、理解、表达等发展,不仅对语文的学习大有裨益,还能够对一个人的终身学习能力发展都产生良好的促进作用。因此,语文教学要体现学生的学习主体性,注重学生自主学习
期刊
高速列车制动盘是列车实现调速、停车的重要安全部件,制动盘盘体与盘毂采用紧固件连接。由于制动盘服役时承受交变的热机载荷作用,使得制动盘紧固件的受力状态复杂,螺栓断裂事故时有发生。本文针对动车组轴装制动盘螺栓断裂问题,采用试验和模拟仿真相结合的方法探究制动盘螺栓断裂的原因和影响因素,进一步提出预防螺栓疲劳失效的结构改进建议。本文主要研究内容和结论如下:(1)开展了断裂螺栓的宏观和微观失效机制研究。通过
岩土材料是天然材料,具有较强的不确定性。由于岩土材料参数的不确定性,尤其是其空间变异性,使得岩土体参数的精确表征变得尤为困难。如何准确描述岩土材料的不确定性和空间变异性,对岩土工程的安全性和经济性都有着至关重要的意义。本文针对实际工程中的岩土体不确定性精确表征方法进行研究,所做的工作及取得的结论如下:1、提出计算抗剪强度指标的可靠度方法,并利用现有的试验数据,采用三种方法计算、比较抗剪强度指标。结
近年来,由于多智能体系统的分布式协同控制在土木工程、工业和军事领域等领域有着广泛应用价值,众多学者开始对诸如一致性控制、包含控制、编队控制等控制问题加以研究。与传统的控制方法不同,迭代学习控制可以通过对以前迭代数据的记录和学习来处理具有高度不确定性的动态系统,使得系统在固定时间间隔内实现较高的跟踪精度。然而这往往需要较大的沟通成本,因此本文研究的是高阶多智能体系统(MASs)基于事件触发的迭代学习
“高桥占比”是我国高速列车平稳运行的重要措施和保障,然而,列车所致桥梁振动以及桥上行车安全平稳性影响不断凸显的原因是列车的行车速度的不断提高,尤其加载频率与桥梁的自振频率相同时会导致桥梁共振,很大程度会危及行车安全和桥梁结构安全。同时,作为常见的随机激励的轨道不平顺会使桥梁发生共振时的响应具有随机性。研究该问题若使用单一轨道不平顺空间域样本会给计算结果带来的不确定性,而多样本计算虽比前者精确但是低
轴箱轴承是动车组关键的走行部件,其复杂的服役环境、恶劣的工况导致轴箱轴承在服役过程中存在多种失效形式。轴承滚道面剥离作为轴承失效的主要形式,占据轴承总失效的70%以上。本文以动车组轴承钢及轴箱轴承为研究对象,运用仿真模拟与实验相结合的手段,开展轴箱轴承的滚动接触超高周疲劳裂纹萌生和初始扩展研究。首先开展了轴承钢超高周疲劳实验研究。采用旋转弯曲疲劳试验机,进行了轴承钢的疲劳实验。绘制了轴承钢的S-N