大规模并行排序学习算法研究

被引量 : 0次 | 上传用户:gsjsk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎可以帮助用户查找相关的信息,搜索引擎返回的搜索结果决定了搜索引擎的质量,因此,如何获得最优的搜索结果,以使得用户得到与自己所请求的数据最相关的结果就显得尤其重要,排序学习的出现为解决这一问题提供了新的思路,它可以通过对用户所要检索的信息进行必要的排序,按与用户的请求的相关度输出相关信息。虽然传统的排序学习算法可以很好地解决小规模文本的排序问题,然而由于互联网行业的快速发展,互联网信息总量不断地膨胀,传统的排序学习算法无法有效实时地处理大规模数据,因此,本文使用两种并行编程模式分别对排序学习算法进行加速。本文的主要研究内容如下:(1)选择OpenCL(Open Computing Language)并行计算模型来加速本文算法,同时介绍了排序支撑矢量机算法(Ranking Support Vector Machine,RSVM)以及序贯最小化算法(Sequential Minimal Optimization,SMO)的相关知识并详细分析SMO算法的具体步骤,根据GPU(Graphic Processing Unit)硬件架构的特点分析串行算法,设计了相应的并行算法流程,对算法中的可并行部分采用OpenCL进行编程加速,实验结果表明与串行排序支撑矢量机算法相比,并行排序支撑矢量机算法的加速性能最高提升了90多倍。同时为了验证OpenCL程序的可移植性,将OpenCL并行程序移植到多种异构设备中,并对基于OpenCL的并行排序学习算法在各个设备的性能差异进行了详细分析。(2)将基于OpenCL的并行排序支撑矢量机算法扩展到多GPU下运行,同时对多GPU实施过程中的同步问题进行了详细分析,运用一种有效的同步方式减少了多个设备之间的同步开销,在多GPU上运行的结果表明并行算法的加速性能相对于单GPU又有了进一步的提升。(3)利用多线程并行编程模式OpenMP(Open Multiple Processing)将排序支撑矢量机算法并行化,并在多核CPU和Intel MIC(Many Integrated Core)上进行实验,结果表明基于OpenMP的并行排序支撑矢量机算法在多核CPU与MIC上都取得了优异的加速效果。同时比较了基于OpenCL和OpenMP的并行排序支撑矢量机算法在多核CPU与MIC上的性能,分析了两种编程模式的差异。
其他文献
在无分支配电线路无通道保护的基础上提出了有分支配电线路无通道保护。该保护利用故障发生和被保护线路一端断路器动作跳闸所造成的故障相和非故障相电流的变化 ,同时利用这
广西的经济在近年不断的加速发展,但是据资料显示部分企业对战略的规划及制定均没有引起足够的重视,在快速扩张的市场上企业想取得长足的发展,取得较好的经济效益,促进本行业
当今许多艺术门类都提出建立具有中国传统艺术特色审美的问题,中国古典舞也在其列。针对这一课题,简要阐述中国古典舞的艺术审美取向的形成和发展,展现中国古典舞的圆之美、
连拱隧道是随着我国公路建设的迅速发展而出现的新型大跨度隧道形式,其线形流畅,占地面积少,空间利用率高,不仅避免了洞口路基或大桥分幅,与洞外线路连接方便;同时在适应地形
采用FLAC数值模拟及1:200的相似材料模拟,详细研究了安家岭北帮露井联采下内排土压脚回填前后露天边坡及在该边坡下布置的井工巷道围岩的应力场及位移场变化规律,并重点分析
本文通过研究了有关人力资源管理的国内外相关基本理论和中国民办高等教育及西安外事学院人事管理现实状况,针对性对所存在的问题进行重点分析,并试图构建起西安外事学院教师
计量方法在法学研究中的运用是指以一定的法学理论和统计资料为基础,综合运用数学、统计学与计算机技术,以建立数学模型为主要手段,研究具有数量关系的法律现象。计量方法在
为了得到一种性能优异的低温固化复合陶瓷涂层,以石墨烯和多壁碳纳米管(CNTs)为增强相,与氧化铝、氧化锌、氧化锆和氧化铬按一定比例制成骨料,加入催化剂氧化铁,与粘接剂混合
近几年,石墨烯学术和产业界的许多专家学者已经针对石墨烯卓越的特性及广阔的应用前景,进行了细致、精彩的研究和解读。在此,笔者仅就北京碳世纪科技有限公司(以下简称"碳世纪")
秘书职业化程度制约着秘书为领导、为组织服务的水平。本文分析了影响我国秘书职业化进程的社会环境因素和秘书职业专业化的因素,从建立良好的职业社会环境、完善秘书学科体