到时差计算中并行相关算法实验及性能分析

来源 :物联网技术 | 被引量 : 0次 | 上传用户:tanner007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:针对震动波波速成像过程中遇到的海量数据处理问题,提出了分布式实现到时差相关运算,提出了在MapReduce框架下到时差计算的程序设计思路,并在hadhoop环境下进行测试。测试结果表明使用MapReduce作为海量传感器数据的处理框架是可行的;在进行并行的到时差相关运算时,hadoop集群运算所需时间受待计算数据量和data node个数的影响,待计算数据量越大,或data node个数越少,运算所需时间越长,但这两组关系均非线性;平均Map时间与待计算数据量和data node个数无关,仅与Map函数的执行内容有关。
  关键词:到时差;分布式矿震监测;MapReduce框架;hadoop集群;计算用时
  中图分类号:TP391 文献标识码:A 文章编号:2095-1302(2015)02-00-04
  0 引 言
  对于煤矿井下的地震勘探来说,其探测的尺度相对于一般的地震勘探来说要小得多,为了实现小尺寸地质结构的探测,传感器的布置相对来说要更密集些[1]。随着传感器布置密度的提高,地震勘探系统采集到的数据量将随之增加,在使用单机进行处理的情况下,到时差的计算及后续的反演计算用时将随之延长[2],这对系统的实时性是极为不利的。
  针对待处理数据量激增的情况,本文基于MapReduce并行计算系统引入数据处理过程,以实际的震动数据为例,测试并分析了并行计算系统计算到时差的用时与待处理数据量、计算用时和集群节点之间的关系。本文的主要贡献在于:
  (1)提出了到时差计算中相关算法的并行实现思路。
  (2)测试并分析了并行相关算法的性能及影响因素,给出了进一步改进的思路。
  1 背景知识与问题描述
  1.1 煤炭井下震动波波速成像原理
  震动波波速成像原理如图1所示。
  当介质均匀时,可以认为震波沿直线传播,此时,可以通过测量震波到达各传感器的到时差来计算介质的平均速度[3]。当介质不均匀时,认为震波的传播路径将按照斯奈尔定律在不同介质的分界面上发生改变,假设图1中各方格速度为v1·vn,震动波波速成像体现为寻找到一组最佳的v1·vn组合,使得通过射线追踪方法计算得到的震波理论到时与实测到时之间的误差最小[4]。
  图1 震动波波速成像原理
  各传感器间到时差的测量可以通过对不同传感器接收到的震动信号的相关计算来实现,实现的方法如下:
  假设传感器c1接收到的震动信号为序列x(n),传感器c2接收到的震动信号序列为y(n),定义信号x(n)与信号y(n)的互相关函数为:,该式表示rxy(n)在时刻m时的值,等于将x(n)保持不动而y(n)移动m个采样周期后两个序列对应相乘再相加的结果。从互相关函数的定义式可见,当c1和c2接收到的为经过同一路径到达的震波,在不考虑不同频率衰减的情况下,相关法测得的到时差精度仅取决于采样周期。
  1.2 分布式矿震监测系统
  分布式矿震监测系统结构如图2所示:
  系统工作过程如下:矿震传感器通过授时子网保持各传感器之间的高精度时钟同步,经测试,时钟同步精度小于1μs。矿震传感器在采集到震动信号以后将震动信号及接收到信号的时间通过数据传输子网发送到数据中心进行处理,用户通过因特网访问数据中心即可对采集到的震动信号进行查看[5]。
  图2 分布式矿震监测系统
  矿震传感器使用ADI公司出品的AD7606芯片作为A/D转换器,支持8通道同步采样,采样分辨率为16 b,最高采样率可达200 kSPS。由于分布式矿震监测系统以以太网作为数据传输通路,因此,在网络带宽允许的前提下,矿震传感器的布置个数不受限制。
  1.3 MapReduce框架
  MapReduce框架的工作流程如图3所示:
  图3 MapReduce框架的工作流程
  在MapReduce框架中,用户需指定Map和Reduce函数的工作内容[6]。Map函数读入输入的键值对(Key/Value),然后根据用户的需要完成指定的工作,处理完成后,Map函数将结果保存为一系列的中间键值对[7]。Reduce函数合并所有具有相同键值的中间键值对,按照用户的需求完成指定工作后将结果输出给用户。
  从MapReduce框架的工作流程中可以看出,Map函数之间和Reduce函数之间均是并行执行的,因此,MapReduce模型的数据处理能力仅受限于Map和Reduce的个数,当待处理数据量增大时,可以通过增加Map和Reduce的个数来提高集群的运算能力。
  1.4 问题描述
  从震动波波速成像的过程可见,提高网格划分密度将提高反演的精细度和质量,而随着网格划分密度的提高,要使v1 vn能够收敛到唯一解,则需要提高穿过网格的射线密度[8]。提高射线密度的方法有两种思路,一是保持矿震传感器数量不变,提高震动的次数,二是保持震动次数不变,提高矿震传感器的数量。显然,在实际情况下,当震动次数一定的时候,提高矿震传感器的数量是唯一可行的方法。
  矿震传感器数量的提高意味着传感器之间道间距的缩小,随着道间距的缩小,震波到达传感器的到时差也相应缩小[9],因此,各传感器节点间到时差的测量精度也应该相应提高。从1.1中的分析可知,相关法的到时差测量精度取决于采样周期,因此,若要实现高精度的时差测量,应降低采样周期亦即提高采样频率。
  显然,当信号的采样频率提高时,在保持传感器数量和采样分辨率不变的前提下,信号所需要的传输带宽将相应提高,举例如下:
  假设某煤矿井下布设的单分量矿震传感器数量为100个,信号的采样频率为1 kSPS,即到时差的测量精度为1 ms,则信号传输所需的最小带宽可计算如下:   图10 1 100行数据平均执行时间
  1 100行数据平均执行时间的变化率如图11所示:
  图11 1 100行数据平均执行时间变化率
  显然,对于相同的运算量来说,data node数的增加将降低平均执行时间,加快执行速度,但节点数和平均执行时间的关系并非线性的,随着节点数的增加,平均执行时间的下降速率是减小的。
  3.2.4 节点数与平均Map时间
  在3.2.3的实验中平均Map时间与节点数的关系如图12所示:
  图12 平均Map时间与节点数的关系
  可见,平均Map时间不受节点数的影响,此外,比照3.2.2中的平均Map时间可以发现,两次实验中的平均Map时间基本一致,这说明平均Map时间与运算量、节点数无关。
  4 结 语
  本文针对震动波波速成像过程中遇到的海量数据处理问题,提出在分布式条件下实现到时差相关运算的思路并以此思路为基础完成相关实验,从实验结果来看,可以得到以下几点结论:
  (1)到时差相关运算的并行实现可分成两个步骤实现,首先将待计算序列转化为待计算序列对,然后将所有待计算序列对送入并行计算系统即可得计算结果。但是在具体实现时应注意的是,如果直接将待计算序列按照本文所述方法进行转化的话会造成待计算序列对体积的急剧膨胀,不利于提高计算的速度。
  (2)在进行并行的到时差相关运算时,hadoop集群运算所需时间受待计算数据量和data node个数的影响,待计算数据量越大,或data node个数越少,运算所需时间越长,但这两组关系均非线性。对于某一次具体运算来说,当待计算数据量小于集群最大并行计算量时运算所需时间最小。
  (3)平均Map时间与待计算数据量和data node个数无关,仅与Map函数的执行内容有关。
  参考文献
  [1] 左国平. 地震记录初至拾取方法对比和研究 [D].北京:中国地质大学, 2006.
  [2] 张凌云. 高密度电阻率勘探反演的非线性方法研究 [D].太原:太原理工大学,2011.
  [3] Xiang Z, Ce Y. Fast n-point correlation function approximation with recursive convolution for scalar fields[C]. IEEE 3rd International Conference on Cloud Computing Technology and Science (CloudCom 2011), Los Alamitos, USA: IEEE Computer Society,2011.
  [4] 靳朋飞, 曹菡, 余婧,等. MapReduce模型下Voronoi图栅格生成算法[J]. 计算机科学与探索,2013(2):160-167.
  [5] 贾宝新. 矿震监测的理论与应用研究 [D]. 阜新:辽宁工程技术大学,2013.
  [6] 刘义, 景宁, 陈荦,等. MapReduce框架下基于R-树的k-近邻连接算法[J]. 软件学报. 2013,24(8):1836-1851.
  [7] Afrati F N, Ullman J D. Optimizing joins in a map-reduce environment[C]. 13th International Conference on Extending Database Technology: Advances in Database Technology, Lausanne, Switzerland: Association for Computing Machinery,2010.
  [8] 顾汉明, 周鸿秋, 张学强. 初至时间的自动拾取[J]. 物探与化探. 1992(2):120-128.
  [9] 黄翼坚. 多井源距VSP速度分析及逆时偏移 [D].西安:长安大学,2010.
  [10] Joshi S B.Apache hadoop performance-tuning methodologies and best practices[C]. 3rd Joint WOSP/SIPEW International Conference on Performance Engineering, Boston, United states: Association for Computing Machinery,2012.
其他文献
摘要 当今时代信息技术发展迅速,影响广泛,教育教学行业对于信息技术的应用也日益频繁,微视频作为信息技术发展下的重要产物,其对于教师的教育教学具有重要的意义和价值。初中道德法治与法治课堂教学时间有限,对教师课堂教学实效性要求高,因此,教师切实提升自身的综合素质和专业素养,切实运用和发挥好微视频的作用,这对于初中道德与法治课堂教学的长足进步与提升助益颇多。笔者通过对当前微视频在初中道德与法治课堂运用现
摘要 《生死攸关的烛光》这篇课文讲述的是第二次世界大战期间,法国一家母子三人机智、勇敢地保护装有情报的半截蜡烛的英雄事迹,歌颂了法国人民崇高的爱国主义精神。  关键词 教学准备;多媒体课件  中图分类号:G622 文献标识码:A 文章编号:1002-7661(2020)01-0202-01  《生死攸关的烛光》这篇课文讲述的是在第二次世界大战期间,法国一个普通家庭母子三人为了保护隐蔽在半截蜡烛中的
摘要 在新一轮基础教育改革理论指导下,全面实施素质教育,说的是不能只注重文化课的学习,还要在文化课学习的同时,渗透思想品德教育。所谓的“先成人再成才”,就是要求在教育教学过程中重视素质教育。  关键词 课堂;小学语文;同时传递;教学方式;上思想和文化  中图分类号:G424.21,A 文献标识码:A 文章编号:1002-7661(2020)06-0194-01  党的十六届六中全会会议决议指出:“
摘 要 本文着重论述了在数学教学中怎样培养学生的创新思维。高中数学教师要通过创设情境、发散思维等多种途径,培养学生的创新思维,提高数学教学效果,实现有效、高效教学。  关键词 创新思维;创设问题;质疑  创新是一个民族进步的灵魂,是一个国家兴旺发达的根本动力。杰出人才的创新能力开辟着人类的未来,个体的创新能力开辟着个体的未来。创新的核心是思维,爱因斯坦从科学创造的角度指出:提出一个问题往往比解决一
摘要:习水县习酒镇历史以来就有种植高梁的习惯,是出产优质酒用高梁的最佳适宜区,本文对习酒,高梁种植密度进行试验分析。  关键词:习水县;习酒镇;高梁密度  中图分类号:S318文献标识码:A    1 基本概况  1.1 习酒镇位于习水县南部的赤水河岸,国土面积80.9平方公里,实有耕地1407.6公顷,其中旱地 540公顷,占总耕地的38.4%,社会经济以农业为主。  1.2 自然条件:习酒镇域
摘 要:今年两会,全国人大代表和政协委员纷纷建言献策,共提交议案489件、提案6069件,物联网产业仍然牵动各方神经,纷纷将其产业发展写进议案和提案。 温家宝总理在十一届全国人大五次会议所作的政府工作报告中指出,要加快产业结构优化升级,大力培育战略性新兴产业……  关键词:物联网提案;全国两会;产业结构;战略性新兴产业    在今年的两会中,全国人大代表、政协委员纷纷建言献策,共提交议案489件
摘 要 区域游戏是孩子们最喜欢的活动,他们在游戏中不仅能得到一种满足感,还能从游戏中得到解决现实生活中一些实际问题的办法。以便以后在各种活动中能遇事冷静,有条不紊,并认真妥善地处理好每一件事情,和同伴友好相处,体验合作的乐趣,感到生活的快乐。  关键词 大班幼儿;合作能力;区域游戏;策略  《指南》中对于5-6岁幼儿的年龄特征指出:合作意识逐渐增强,他们会选择自己喜欢的玩伴,也会逐渐明白公平的原则
摘 要 创建电子相册是小学生感兴趣的内容,并且与丰富多彩的生活相联系。实践证明,贴近学生的生活的教学内容能让学生把学到的知识真正运用到解决生活实际问题中去,从而实现“用中学,学中用”的目的。创建电子相册教学,激发了学生创作的欲望,培养了学生的操作能力。  《创建电子相册》是小学信息技术教材中五年级内容,这一部分内容的学习需要学生有一定的计算机操作基础,将学过的知识整合起来,创建一个好看的、属于自己
中国银联12日联合20余家商业银行在京共同发布“云闪付”,更加安全、更为便捷的移动支付时代正式开启。今后出门除带银联卡,可以通过手机“云闪付”一挥即付。  “云闪付”作为以非接触支付技术为核心的银联移动支付新标志,涵盖NFC、HCE、TSM等各类支付创新技术应用。此次率先亮相的“云闪付”产品基于全球领先的HCE(主机模拟卡片)和Token(支付标记)技术,实现了移动支付安全性与便利性的最佳结合,代
23日下午,清远举行了市政府常务会议,会议传达全省经济和信息化工作会议精神并提出了贯彻意见,记者从会上获悉,清远将推动信息化发展,加快建设智慧城市。优化工业制造,今年力争全市工业技改投资增长10%;深化產业共建,广清产业园佛冈汤塘片区争取今年正式动工;深化产业共建,广清产业园佛冈汤塘片区争取今年正式动工。