川庆物探:IT运维能力决定“找油”能力

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:nmhnhjcf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  “凭经验找油”的时代一去不返,今天的石油勘探项目都是“从数据中找油”。通过地震波法采集相关的地质数据,再对这些数据进行相应的分析、解释获取准确的油藏信息,已成为石油勘探业高效“找油”的关键保障。
  不管是机群监控,还是管理都可以更便捷、更高效,虽然还不能自动调配资源,但通过可视化的运维,进行资源调配时完全可以有的放矢,机群的整体工作效率明显提升。
  ——川庆物探研究中心计算所主任工程师郭玲
  在这个人人关注大数据的时代,对海量数据进行处理有着强烈需求的企业很容易被视为大数据技术应用的潜在用户,IT界似乎更关心那些涉及大数据的新技术如何为这类用户带来价值。但事实上,目前真正困扰这类用户的IT难题,往往根本不需要用大数据这样超前的技术去解决。用简单易用的技术去满足这些被长期“忽略”的需求,其用户价值未必不如那些尚不成熟的大数据技术可观。
  在处理海量数据上,一直有强烈需求的石油勘探行业,正流行着各种关于云计算、Hadoop的技术普及潮流。但在川庆物探研究中心计算所主任工程师郭玲看来,这些前瞻的新技术,目前与石油勘探行业业务应用的结合点并不十分清晰,是否能够提升“找油”能力也还有待考量。真正影响整个行业“找油”能力的是企业的IT运维管理能力,而这个难题,却常常被IT厂商忽视。
  “糖果”带来的计算压力
  技术的进步让“凭经验找油”的时代一去不返,今天的石油勘探项目都是“从数据中找油”。通过地震波法采集相关的地质数据,再对这些数据进行相应的分析、解释获取准确的油藏信息,已成为石油勘探业高效“找油”的关键保障。
  对石油勘探项目而言,除了存储海量数据的设备外,最关键的IT资源就是计算资源。因为采集上来的地质数据往往数量庞大,而且需要通过地震资料处理类软件和地震资料解释类软件经过复杂的运算才能完成数据分析工作,这两类软件分别用于地震数据的处理(包括去噪、反褶积、动静校正、速度分析、叠加、偏移、反演、地震监测)和地震数据的解释,其所需要的运算量相当庞大。“在我们这个行业,采集上来的原始数据经过地震资料处理类软件或解释类软件的复杂运算,通过矩阵的变化,迭代后会产生更庞大的数据量。但处理结果输出时,又需要进行大量计算,最后变成与原始数据体量规模类似的数据。”郭玲告诉记者,地质数据在整个处理过程中,体量的变化就像一个“糖果”:两端小,中间大,数据处理的每个过程,对计算资源的需求量都非常大。
  为了保障勘探项目的顺利进行,为各项目组提供服务,川庆物探研究中心计算所投资建设的高性能计算平台有2000多个计算节点,近4万个CPU,每个CPU的核数超过了1万。硬件上的投入看似已经到位了,但当项目繁忙、需要很多应用软件同时在高性能计算平台上运行的时候,系统的稳定性就会出现问题。
  “我们应用的处理软件种类有十几种,解释软件有二三十种,对于分配给不同软件的计算资源、内存是否够用,是否有因CPU过热导致系统出错等问题,因为无法‘透视’相关信息,我们很难搞清。计算节点太多了,没有可视化的工具,我们只能通过Linux系统提供的一些字符命令查看某些计算节点的状况,全靠手工调整资源,管理效率极低,根本无法保证业务软件能够100%正常运行。”这种状况带来的直接影响是,计算所不得不为这些软件预留出更多的计算资源以备不测,以“资源浪费”换“保险”。郭玲直言,项目忙的时候,计算资源常常不够用,但实际上有很多资源被闲置浪费了,完全可以分配给其他软件使用。所以,在计算平台构建起来不久,如何让计算平台上运行的软件所占用的计算资源的情况直观地显示出来,成为了他们当时最需要解决的运维难题之一。
  破解第一个运维难题
  川庆物探研究中心计算所的高性能计算平台的规模并不算小,但按照郭玲的话说,项目忙的时候,计算资源依旧捉襟见肘。从长远发展的角度看,计算资源也是非常有限的资源。为了解决这个问题,他们咨询了不少IT运维管理软件厂商,最后发现并行科技的Paramon和Paratune运维软件和他们的需求相对匹配,破解了他们的第一个运维难题。
  “过去,最影响计算平台效率的是看不见这些资源的状态,更看不见它们与应用的关系。我们需要更直观的方法去查看、了解所有计算资源的状态,并分析、统计这些计算资源是否被充分利用,空闲的资源能否被分配给其他软件,在用的资源是否正常运转,出问题的资源在哪儿,是否需要调整。”郭玲表示,让所有计算资源的状态实现可视化是IT运维的基础,所以运维软件必须要能直观反映出机群整体及节点服务器部件的运行情况,帮他们快速衡量出软件对硬件的实际需求,准确、高效地建立软件与硬件之间的对应关系。
  “CPU、GPU的相关数据,温度、利用率、内存都可以直观看到,用了这些运维管理工具和过去有很大不同。现在,不管是机群监控,还是管理都可以更便捷、更高效,虽然还不能自动调配资源,但通过可视化的运维,进行资源调配时完全可以有的放矢,机群的整体工作效率明显有所提升。”她说,现在还可以在运维平台上查看应用运行特征的状态分析,为软件系统优化提供了客观的基础数据,保证了软件优化的正确性和高效性。
  有可视化、图形化的运维平台做保障,实现系统预警就有了基础。虽然目前计算资源的调度工作依旧只能依靠手工实现,但至少他们可以知道问题出在哪儿,哪些资源已经超负荷,而哪些资源还被闲置。 “现在可以相对轻松地监控运行在计算平台上的应用能否顺利完成,了解什么时候分配给应用的计算节点已达到峰值。如果当前CPU利用率较低,就可以将要运行的软件加载上去,提高平台的处理效率。如果某个应用占用了10个节点,我们可以清晰地看到这10个节点的运行状态、内存占用状态等。”郭玲表示。
  在项目忙的时候,郭玲和她的同事们不会再手忙脚乱了。
  机房管理将决定“找油”效率
  “机房管理的自动化是我们迫不及待想解决的问题。”在郭玲看来,像川庆物探研究中心计算所这样,承载地学研究、勘探数据分析等任务的石油勘探行业的研究所或计算中心都面临着同样的难题。随着数据规模不断增长,计算压力逐渐变大,计算所的规模也在扩大。光川庆物探就有三个数据中心,两个在成都,一个在新疆,需要管理的硬件、软件的数量越来越多,管理人员的数量却没有增加,手动管理已不现实。要想确保业务顺利开展,所有的可监控的业务都应该做到提前报警,并做好监测预案。
  郭玲强调,在这个行业,最耽误不起的是时间。现在项目进度快、压力大,配合项目完成数据处理和解释的时间都是有严格规定的,一旦出现问题或丢失数据,只能靠投入更多的时间、人力、物力去弥补,用户就“不答应”。如果不能保证项目的进度,每一年计算所对IT投入的规划就必然会受到质疑。
  从整个行业目前机房运维的状况来看,自动化程度还非常低。运维管理软件只能做到“半自动”,计算、存储资源的控制、调度还是要手动操作。“川庆的三个数据中心现在也只能各管各的,远程监控还没有实现。实际上,我们更希望在这个领域多做研究,实现机房统一、远程、自动化的管理,让投资的硬件、软件资源的利用率更高,保障业务、为业务服务。”
其他文献
云计算、大数据、移动互联网、物联网和社交化等五大技术已成为IT产业趋势。作为企业级计算厂商,我们认为IT对于企业的最大价值在于推动业务创新,帮助企业向新一代企业转型。  四大企业IT应用趋势  从企业创新转型的角度看,上述五大技术通过对企业业务形态的改变,形成了未来五年企业的四大应用趋势。  一是传统企业面向互联网转型将释放更大的能量。中国互联网行业已仅次于美国。但甲骨文认为,中国传统行业的互联网
某研究机构的统计数据显示,53.7%的用户因担心安全问题而不使用网络支付,24%的用户曾经因为遭遇木马和钓鱼网站遭遇资金损失,21.4%的用户遭遇过隐私信息被截留……   当看到这些数字,你是否会对网络支付心生疑虑?当你在享受电子商务带来的便利时,可曾想过自己的隐私正在遭受前所未有的冲击?相关数据显示,2011年,超过1亿的用户曾遭遇过网络购物陷阱,带来的直接经济损失超过150亿元。   当前
近日,IDC最新发布的调查报告显示,2012年第一季度全球PC出货量为8711.1万台,与2011年同期相比,增长3.2%。惠普以18.0%的市场份额居首,联想位列第二,市场份额为13.4%。全球前五大PC品牌是惠普、联想、戴尔、宏碁和华硕。
购买软件之后没有及时安装,随着时间的流逝,软件贬值或者丢失,造成资金的浪费。   随着硬件的淘汰而被丢弃,企业需要时再去购买,造成软件资产的浪费和资金浪费。   软件分发到各终端安装后,由于员工的正版软件保护意识不高,序列号被泄露,正版软件失去了应有的价值。   购买软件后不清楚软件服务期限,咨询服务的时候软件服务期已经过期。   企业没有统一的软件资产管理系统,该买多少软件、买什么软件企
本报讯 12月7日,我国首份《中国互联网金融发展报告(2013)》发布。  这份报告是由中国电子信息产业集团有限公司所属中国电子投资控股有限公司联合人民银行金融研究所、中国社会科学院、浙江大学、南开大学、南京大学等编写而成。  作为中国首份互联网金融发展报告,这份报告对我国互联网金融的发展情况进行了完整全面的分析总结,研究了许多不同国家的互联网金融发展经验,全面探讨了我国互联网金融发展至今的总体情
在业界纷纷推出端到端解决方案的大趋势下,近年来已经多次传出博科将被收购的消息。就在博科大举投资亚太区市场,于近日在新加坡开设地区接待中心(RBC)的同时,关于私募机构有意收购的传闻仍旧围绕着博科。  近期财报看好  博科首席执行官Michael Klayko亲自前来剪彩。他一面发布今年大举投资亚太区市场的计划,一面还要回应收购传闻。在他看来,传闻就是传闻,会随着时间推移不攻自破。博科近期稳步发展的
三年前,IBM“智慧地球”概念的提出,掀起了全球性的智慧城市建设热潮。智慧城市不仅成为全球城市发展的战略选择,也成为各国应对国际金融危机、重振经济和实现社会发展的重要手段,还使得以智能化为特征的新一代信息技术在交通、能源、公用设施、医疗、水资源管理、公共安全、政府服务和教育等领域得以实践和应用。据不完全统计,纽约、伦敦、东京等国外城市纷纷加大智慧城市建设力度,我国北京、上海、广州、杭州、沈阳、重庆
电的应用曾重构了整个社会。方兴未艾的云计算就是下一个“电”。  在当下,“云”影响世界并孕育着重大变革。它让人难以抗拒,又让人无所适从。面对应用“云”引发的挑战,你想好如何穿过荆棘,步入坦途了吗?    历史发展的路径绝对不会简单地雷同,但如果做类比推演,却不难发现太多惊人的相似。  19世纪最后十年,大多数制造商仍然依靠水力和蒸汽动力开动机器,他们不得不为工厂选址抢夺水源附近最佳的位置,以架设水
打印机、复印机、扫描仪、传真机是每个公司必不可少的办公设备,为了保证这些办公设备能够时刻处于最佳状态,IT部门需要时刻注意到设备的耗材剩余量、纸张剩余量等信息。  除此之外,IT部门还要注意机器的工作状态,如果机器出现故障要及时处理。对于IT部门来说,专人负责办公设备人力成本较高,但是如果没有专人负责,在出现问题时又不能及时处理。MPS(文印服务外包)服务的出现,帮助IT部门解决了这个问题。  所
本报讯 4月24日,由中国电子信息产业发展研究院主办,赛迪顾问股份有限公司承办的2012中国消费电子市场年会暨首届卫星导航产业大会在京召开。来自政府机构、行业协会与业内知名企业等300余名嘉宾就中国消费电子市场及北斗卫星导航产业发展等相关话题进行深入探讨。  在消费电子领域,智能化成为各类电子品的发展趋势。在三网融合、移动互联网、物联网等技术的推动下,各类电子产品将实现互联互通。在这种情况下,卫星