基于排序学习算法的智能检索系统

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:war3mx1017
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文旨在解决数据资产管理系统中信息检索效率低、检索结果准确率低下的痛点,基于排序学习算法构建智能检索系统,提升检索结果和用户请求的相关性。对排序学习算法理论进行研究,对常用的排序学习算法进行相关优化,将分类问题扩展到文本排序问题之上,定义相关的目标函数及损失函数,使用机器学习的方法来提升检索结果的准确度。基于垂直分布式搜索引擎技术及排序学习算法构建智能检索系统,通过相关性工程提升检索请求转化的效率。实验表明本系统可以在优化检索速率的基础之上,提升检索语句与返回结果之间的相关性和检索的准确度。
其他文献
经验风险最小化(Empirical Risk Minimization,ERM)旨在学习一组模型参数来尽可能地拟合已观测到的样本,使得模型具有基础的识别能力.除了ERM,权重衰减(Weight Decay,WD)对于进一步提升模型的泛化能力,即对未观测样本的精准识别也非常重要.然而,WD的具体形式仅仅是在优化过程中不断缩小所学习的模型参数,这很难与提升泛化能力这个概念直接地联系起来,尤其是对于多层深度网络而言.本文首先从计算学习理论(learning theory)中的鲁棒性(robustness)与泛化
随着互联网技术的快速发展,出现了基于IP的语音传输技术,给人们带来方便的同时也带来了许多安全隐患,如不法分子利用VoIP压缩域语音传输协议传送秘密信息.因此,针对基于G.729A编码的基音隐写算法和互补邻居顶点的量化索引调制音频隐写算法,本文提出了一种基于手工特征提取与结果融合的卷积神经网络音频隐写分析算法.通过将手工提取特征与卷积神经网络相结合,可以实现在VoIP压缩域同时对基于基音的隐写算法和互补邻居顶点的量化索引调制音频隐写算法进行有效检测.实验结果表明,在同时对基音隐写算法和互补邻居顶点的量化索引
受制于传统施工工艺的缺点,狭小的坝顶空间安装防浪墙压顶石一直是施工中的技术难题,而包夹叉车安装防浪墙压顶石施工工法成功解决此技术难题.以山东省邹平市新建辛集洼水库施工一标段为例,详细阐述了包夹叉车安装防浪墙压顶石施工工艺的流程、叉车改装操作要点、质量控制、安全控制,并对其效益进行了分析.
针对化学实验场景下深度相机难以探测试管等透明物体距离,继而引起机械臂难以获取化学试管在空间中的三维坐标的问题,提出通过改进的深度学习算法YOLOv3 Tiny检测试管上的贴纸标签以获取透明化学试管的三维空间坐标;针对不同化学试管无法分类的问题,提出通过深度学习算法CTPN+BLSTM+CTC Loss识别标签上的文字信息对试管进行分类。本文采用深度相机、单目相机与搭载ROS系统的六轴机械臂为实验平台,在TensorFlow上训练化学标签检测模型与文字检测识别模型。通过在机械臂搭载的树莓派上的ROS系统进行
根据用户信息进行资质审查是金融领域的一项重要业务,银行等机构由于用户数据不足和隐私安全等原因,无法训练高性能的违约风险评估模型,从而无法对用户进行精准预测.因此,为了解决数据不共享情况下的联合建模问题,本文提出一种基于联邦学习的决策树算法FL-DT(Federated Learning-Decision Tree).首先,构造基于直方图的数据存储结构用于通信传输,通过减少通信次数,有效提升训练效率;其次,提出基于不经意传输的混淆布隆过滤器进行隐私集合求交,得到包含各参与方数据信息的联邦直方图,并建立联邦决
光学相干层析成像(optical coherence tomography, OCT)是一种高分辨率成像技术,可以采集到手指表面皮肤下的多层深度信息,即指纹层析结构.将指纹层析结构高质量地重构为亚表面指纹图像,不仅可以解决因表面成像导致的低质量指纹图像问题,而且可以实现与现有传统指纹识别技术的无缝连接.本文首次提出一种基于深度学习的亚表面指纹重构方法.首先以HDCRes-34为基础网络,根据皮肤结
针对传统的短期电力负荷预测模型存在的预测精度不高和滞后性的问题,本文提出一种基于卷积神经网络、长短时记忆网络和注意力机制下的混合神经网络模型来进行预测。利用卷积层对多维的电力数据影响特征进行提取,过滤筛选其非重要影响因子,完成电力数据相关特征的映射变换,再通过长短时记忆网络层的循环,对时序性电力数据特征选择性提取,最后利用注意力机制添加重要特征的权重,经Adam算法优化后输出电力负荷预测的结果。依靠GPU强大的算力支撑来解决预测数据时的实时性问题,凭借多融合神经网络的手段来提高其预测精度。经由算例验证,所
以禁忌搜索算法为基础,对栅格地图搜索过程进行建模,提出一种能够利用经验知识的改良禁忌搜索算法,为航向指引、水源探测、灾后搜救等领域的智能辅助工具实现提供算法参考。对禁忌搜索算法的关键优势进行分析,提出以正六边形为单元的地图栅格划分方法,将问题建模为禁忌搜索可求解的最优化问题。以沙漠水源搜索为实例,选取多个沙漠元素作为水源探测相关指示参数,进行仿真实验。实验表明,本文所提出的方法可以在10000以内
针对现阶段UWB室内定位的测距过程中易出现通信冲突且标签功耗高的问题,提出一种改进的DS-TWR算法。该方法通过一种基于Hash算法的时隙分配方法计算标签和基站的时隙,使每个标签和基站都有唯一时隙,以减少通信过程中标签冲突现象;同时不同于传统TOA测距流程,该方法设置一个主基站,标签只需与主基站进行通信,而从基站只需要进行监听;通过DS-TWR算法来实现标签与主从基站之间的测距过程,最终完成室内定位。实验结果表明,该改进方案可以有效地减少定位通信次数,假设定位基站有N个,改进算法的通信次数约为传统DS-T
推荐系统已经在开发者社区Stack Overflow以及知乎、百度知道等热门问答社区发挥了重要作用,也即将成为海川化工论坛提高问答效率的关键技术。海川化工论坛作为国内最大的化工问答社区,问题不能得到及时有效的解答主要由于2大难点:稀疏性和冷启动。本文提出一种融合DeepFM与矩阵分解的混合推荐方法。算法以DeepFM作为辅助算法,矩阵分解作为主算法,通过结合用户的个人特征与问题的自身特征为论坛中的新问题推荐合适的回答者,可有效解决社区中的问题冗余。通过计算测试集的均方根误差与平均绝对误差,进一步验证本文提