大数据应把握核心技术话语权

来源 :计算机世界 | 被引量 : 0次 | 上传用户:fdiskhotmail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  大数据是当下继云计算之后最热门的话题之一。在2011年,有关大数据的讨论充斥着各种研讨会,各大主流IT厂商纷纷推出与其相关的产品和服务。然而,在众多关于大数据的讨论中,中国研究机构和企业在数据管理的新一轮变革中很少有自己的声音。
  2012年1月6日,在北京举行的“中国非结构化数据管理高峰论坛暨‘核高基’科技重大专项课题成果发布会”上,记者了解到,大数据时代中国研究机构已把握了先机。本次会上发布了“核高基”项目——非结构化数据管理系统的最新研究成果,并就如何推动中国非结构化数据管理技术的研究和创新、加速国产非结构化数据管理系统的产业化进程进行了探讨。
  提前为大数据准备
  大数据问题的核心是非结构化数据的处理。根据“核高基”非结构化数据管理系统课题组的定义,非结构化数据是指那些显示数据结构的数据,典型的例子像文本、网页、邮件、格式文档、图型图像、视音频等。
  非结构化数据处理非常困难,因为其种类繁多且不断推陈出新,不同种类数据需要不同的操作方式进行处理。
   相关数据显示,大数据已成为当下诸多公司,尤其是互联网公司的必需品,一些公司待处理的非结构化数据已达ZB(10万亿亿字节)级别,如互联网公司的网络访问日志等。
  “迄今为止,软件行业经历了三次大的浪潮:第一次始于上世纪70年代操作系统、数据库的出现;第二次始于上个世纪90年代中期,半自动化数据文本处理软件的出现;现在已经进入大数据时代,表现为非结构化数据的大量涌现。”北京航空航天大学李未院士在演讲中表示,“中国企业在第一次浪潮中是跟踪学习,第二次则是主动参与,在第三次浪潮中要有自己的一席之地,所以我们要早做准备。”
  记者了解到,为了把握新型数据管理领域发展的先机,特别是在大数据时代中国能拥有话语权,国家“核高基”科技重大专项中提前部署,于“十一五”期间设立了“非结构化数据管理系统”课题。
  “‘十一五’期间,中国部署了两个相关课题,一个是关系数据库管理系统,另一个是非结构化数据管理系统。其中,关系数据库管理系统面向传统市场,而非结构化数据管理系统是作为下一代技术储备,瞄准未来的新型数据管理应用市场。”课题组成员清华大学王建民教授介绍说。
  据悉,围绕“核高基”的非结构化数据管理系统研究课题形成了三个主要的研究团队,分别由北京航天大学、清华大学、浙江大学组成。“应该说,在非结构化数据管理领域形成的这三个集产、学、研、用为一体的核心科研创新团队,为未来的中国非结构化数据管理的创新发展积累了宝贵的人才资源。”王建民如是评价。
  致力于掌握核心技术
  非结构化数据管理系统研究课题组经过两年多的科研攻关,取得了丰硕的成果。在大会上,课题组发布了三项重点研究成果,包括四面体数据模型、分布式柔性事物管理模型、跨媒体计算理论与方法。这些都是非结构化数据处理方面非常核心的技术。
  “非结构化数据管理有四个核心问题需要解决,即模型问题、系统问题、管理问题以及应用问题。”清华大学孙家广院士解释说。
  所谓模型问题是数据的建模,也就是如何统一表达结构化数据和非结构化数据;系统问题是指如何弹性地应对数据和负载的动态变化来构造一个系统,以支撑不同的操作行为;管理问题就是如何有效地存储和操作海量数据;应用问题就是如何在大型数据之上支持这个分析型和事物型的应用。比如,由北京航空航天大学牵头的研究团队推出的四面体模型解决的就是数据的建模问题,也是非结构化数据管理中最核心的问题之一。该四面体模型合理地表达了非结构化数据的基本属性、语义特征、底层特征以及原始数据等组成部分,以及各组成部分之间的内在联系。
  值得一提的是,非结构化数据管理系统研究课题的部分研究成果已形成应用成果——3款自主的非结构化管理系统产品,并成功地应用于盘古搜索、新华微博、天宇舆情分析等典型海量数据管理领域,不仅彰显了中国非结构化数据管理技术的核心竞争力与广阔市场前景,而且推动了非结构化数据产业发展。
  “未来,课题组还会致力于形成非结构化数据管理自主规范和国家标准,并建立非结构化数据管理公共测试平台,以促进非结构化数据管理软件产品的市场推广以及非结构化数据管理技术转移与产业化,最终促进新型数据管理产业链的形成。”王建民表示。
其他文献
“政协提案为实现‘十二五’开局、加快推进改革开放和现代化建设做出了重要的贡献。”3月3日,政协第十一届全国委员会第五次会议开幕式上,全国政协副主席、台盟中央主席林文漪在总结政协十一届四次会议时谈到,一年来,全国政协共提交提案6076件,立案5603件。截至2月20日,在已办理答复的5583件提案中,采纳解决的占28.26%——自2008年起,政协提案的采纳率逐年攀升,从19.74%提升至目前接近三
团购标杆企业Groupon于2月28日发布了2012财年第4季度及全年财报。整个2012财年,Groupon营收23.3亿美元,同比增长45%,但是,从2010~2012年,Groupon净亏损超过7亿美元。而纵观国内市场团购的发展,也经历了过山车般从高峰到低谷的震荡。成千上百家团购企业大洗牌,迄今所剩不多。  对于消费者而言,团购能够提供性价比更为突出的产品及服务,在物价飞涨的今天,理性消费总是
中国互联网发展越来越精彩,简单概括,就是20倍理论——未来十年,中国的网民数量增加两倍,网民上网时间、质量会增加十倍;过去十年中国网民数量增加了10倍,中国人平均上网时间增加了两倍,也是20倍。这前面的20倍和后面的20倍是从量变到质变的过程,一个人能够在线十几个小时,不仅仅把互联网当做工具,而且生活多方面都要依赖互联网。  这个十亿人同时在线的时代,会很快到来。十亿人同时在线后,会发生比过去十年
在新的一年中,信息安全领域最热的门类会是什么? 2011年终集中爆发的信息泄露事件将对整个信息安全领域产生什么样的影响?    近日,记者采访了专注于数据恢复技术的北京飞客瑞康科技公司董事长高宁女士,她认为,2012年,数据恢复技术市场必将迎来大发展时期。  飞客是一家成立于2004年的数据恢复公司,目前已经成为国内数据恢复领域的领头厂商,长期与联想等电脑厂商合作,为用户提供电脑中各种数据的恢复服
深信服AC产品获EAL3等级认证  本报讯 近日,深信服连续六年市场占有率第一的上网行为管理产品(AC),获得国家信息安全测评中心颁发的信息安全产品EAL3等级认证,成为国内首个获得此项认证的上网行为管理产品。目前我国除SIM卡能够通过EAL4增强级认证外,EAL3级认证成为网络产品最高等级的国家信息安全认证,代表国家对信息安全产品的最高认可。  东软医疗拟购飞利浦合资公司股权  本报讯 东软集团
雷军破天荒地首次公布了小米的营收:2012年小米手机销售量为719万部、含税销售额126.5亿元。为了证明自己不是网友口中的“吹牛不上税”,雷军还公布了国际四大会计师事务所之一普华永道的审计结果:2012年小米科技纳税总额达19亿元。  小米科技曾一直给人留下青春、狂躁的印象,而在它成立3年的时候,小米开始变了。雷军到底要“熬”出怎样的一锅“小米粥”?是一帮程序员和硬件发烧友?一个会炒作的品牌公司
为了促进亚太区跨境电子贸易之间的交流,使不同地域的商贸市场互相联系,相关国家和地区在2000年成立了“泛亚电子商贸联盟”,成员包括中国国际电子商务中心、中国香港贸易通公司、韩国商贸网络、新加坡劲升逻辑公司以及日本、马来西亚、泰国等国家和地区的相关政府机构。 目前,亚太区的电子商贸网络每日共处理数以百万宗的电子交易。各联盟成员用户可在电子平台取得更丰富的产品及服务资讯,以提升公司在全球市场上的竞争力
本报综合消息 近日,日本上市企业进入年报发布的高峰期。数据显示,日本八大电机公司2011财年的净利润预计将亏损近1万亿日元,规模仅次于国际金融危机爆发后的2009财年(2.1万亿日元)和IT泡沫破灭后的2002财年(1.9万亿日元)。  其中,尤以家电企业的亏损最为突出。松下公司和夏普公司净利润预计将分别创下本公司历史上最大亏损纪录,分别达到7000亿和2900亿日元。而日本家电业老大索尼公司预计
随着谷歌、三星和苹果等科技巨头相继投入巨资开发可穿戴设备产品,该领域市场在2013年逐渐升温。无论是科技企业,还是体育用品和服装等企业,都已经纷纷涉足这一领域,智能眼镜、智能手表、智能手环,以及智能鞋和智能衣等新兴产品层出不穷。可见,随着科技的发展,除了IT企业在不断地革新自己,就连传统产业也在加速IT化转型,可穿戴设备热潮迅速兴起。  研究机构也纷纷看好这一市场。美国弗雷斯特研究机构的报告《智能
苏禹烈  青阳天使投资创始合伙人,中国最年轻的天使投资人之一。  今天探讨互联网上市公司退市,要论及自由,这个自由有别于诞自英法革命、由德国哲学进行完善、强调个人权利的现代自由,更类似于基于直接管理而进行统治的古代政治自由。即强有力的公司掌控者通过在资本市场的进退,为公司赢得资金和生长。  对于庸常人来说,一份无规矩不成方圆的工作,是领取薪水(拿什么活)和获得归属感(怎么活)的解决方案;对于非常人