POLARDB数据库,阿里云的自信源自哪里

来源 :计算机世界 | 被引量 : 0次 | 上传用户:hnxmyuandong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  “你好,我是阿里云数据库团队负责人,我叫鸣嵩(曹伟)。”初次见面的印象,让笔者觉得鸣嵩并不像一个IT男,形象阳光、精神抖擞、嘴角带着一点点微笑。就在笔者还在回味《复联3》中小蜘蛛和奇异博士有关“花名”的梗时,鸣嵩让我有了新的认识。
  采访过程中,鸣嵩的语速一直很快,语言简练,思维清晰,不断出现的术语和数据说明了他的专业性,喜欢列举实例。整个人总是带着一股浓郁的自信。好像,每一个阿里人都是那么的自信。
  那些在一线才知道的
  一位工作在云数据库一线的开发和运维人员,在云栖社区做了以下分享:
  “我在4天前,手工做了一个备份,数据库比较大,3T,你们说差不多要70个小时备份,这个…有没有什么办法加快一点,我老板还着急要数据呢”
  “你好,我们公司有个数据库,想迁到阿里云RDS上,对RDS的产品品质我们很满意,只是我们的数据库有10T,请问一下,支持这么大的实例么?”
  “你好,我用了你们的MySQL数据库,最近几天在做活动,主库压力比较大,只读实例就延迟了,现在看过去貌似很难跟上,有什么办法么?”
  这些抱怨也好,吐槽也罢,都来自云数据库用户的真实案例,总结起来,传统的云数据库由于自身架构原因,会遇到很多问题:
  读写实例和只读实例各自拥有一份独立的数据,用户购买只读实例,不仅需要付出计算的成本,也需要付出存储资源的成本;新建一个只读实例需要重新拷贝数据,考虑到网络限流,速度不会很快;传统备份技术,由于涉及到拷贝数据,并上传远程存储,速度因此也受网络影响等等。
  随着数据库数据量的增大,各行各业对云数据库业务的需求增加,这些问题就会不断加剧。鸣嵩说:“这些困扰大家已久的问题, PolarDB都可以从本质上解决,而不是想个trick绕过去。”
  核心优势有5个
  PolarDB是阿里云数据库团队过去3年间自主研发的一个企业级数据库。鸣嵩总结了其5大核心优势。
  第一,兼容性。PolarDB兼容了当下最主流的、开发者最喜欢用的MySQL和PostgreSQL两种数据库生态,这意味着MySQL和PostgreSQL的老用户,在一行代码不用改的前提下,可以把业务从原来的开源数据库迁移到阿里云的企业数据库平台上。
  鸣嵩说:“从第一天起,我们做任何东西,不接受99%的兼容,我们只有100%的兼容。这是不会妥协的。”
  第二,性能好。对比MySQL有6倍性能提升及相对于商业数据庫实现大幅度降低成本。拿Sysbench跑Benchmark做测试,开源的原生数据库性能是每秒3.5万的TPS,PolarDB的性能可以达到22万,有6倍的提升,但是价格不变。
  第三,容量大。传统的数据库会受限于物理机能的磁盘大小,数据增长后面临着要么扩容,要么定期迁移,这种方案不仅开发成本高,还会造成业务中断。PolarDB则支持单库容量扩展至上百TB以及计算引擎能力及存储能力的秒级扩展能力。
  第四,技术更新换代。云数据库的发展趋势出现了一种更好的模式,Serverless按使用量付费。看起来只是计费模型的一种变化,事实上对技术本身有很大挑战。Serverless意味着弹性扩展、调度能力、资源隔离需要做得更加精细,使得能够支持这种计费模式。
  鸣嵩直言:“PolarDB的目标就是从过去云计算的1.0时代走向云计算的2.0时代。数据库从经典时代走向Serverless时代。“
  第五,一写多读。鸣嵩以淘宝为例,介绍道:“电商业务,读的压力要比写的压力大很多,传统的‘一主多从’模式存在空间浪费和扩容时间长的弊病。”
  PolarDB让“一主多从”共享统一一个数据副本,同一个实例的所有节点(包括读写节点和只读节点)都实现访问存储节点上的同一份数据,使得数据备份耗时实现秒级响应,实现了无缝扩展,不管数据量有多大,几分钟内即可实现只读副本扩容,以及数据的全量备份。
  何谓国之重器
  据了解,PolarDB发布以来,在公有云上已经累计了超过600家用户,涵盖金融、电商、游戏、IoT等各行各业。
  在被问及为何阿里云在已经拥有关系型数据库的情况下,仍旧开发出PolarDB时,鸣嵩表示:“企业级数据库一定是国之重器。”
  鸣嵩介绍道,企业级数据库,往往要求零宕机,7×24小时的可服务性,数据绝对不能丢。这是对数据库技术更苛刻的要求,同时还需要高安全性和无限扩展能力。“PolarDB的目标就是将来能在有关国计民生的行业、金融产业或者政府核心业务中用上国产自研的数据库。我认为,这是我们这一代做数据库技术人的使命。”
  此外,鸣嵩还指出一种技术趋势。过去十年,大量互联网企业为了解决业务发展数据膨胀的问题,都在使用一类基于Share Nothing架构做水平扩展的数据库,演化出了很多NoSQL和NewSQL产品,但这类产品都有对使用场景的假设和限制。而ORACLE、DB2、Aurora、PolarDB这些企业级的通用数据库,都在使用Share Everything共享存储技术。鸣嵩判断,在未来的5年之内,随着云时代的到来,随着企业级云数据库的兴起,Share Everything基于共享存储架构的数据库会成为新的热点。
  性能源于对硬件的诉求
  为了追求性能的不断提升,技术人员对于硬件的诉求也在不断提高。鸣嵩介绍了PolarDB所采用的领先的硬件技术:包括使用3DXpoint存储介质的Optane存储、NVMe SSD和RoCE RDMA网络。同时面向新硬件架构实现软硬一体优化:从数据库、文件系统到网络通讯协议、分布式存储系统和设备驱动,实现纵贯软件栈各层次的整个IO链条的深度优化。
  谈及Optane存储卡,鸣嵩毫无吝啬地给了一个赞,他表示:“3D XPoint介质比NAND颗粒提供了更好的I/O延迟和I/O QoS稳定性,因此在数据库整体QoS上我们在95%延迟的指标上提升了76%的性能。我个人认为这也是非常有工匠精神的一个介质、一个产品。如果说SSD把HDD延迟降低了一个数量级,3D XPoint又把SSD降低了一个数量级”
  鸣嵩认为,Optane很可能会打破传统的Memory金字塔体系,过去的模型是CPU、内存、SSD的三角形结构,内存是很快的但是比较小,掉电会丢;SSD是很大,延迟比较高,吞吐有限,但是掉电数据不会丢。而Optane在这个体系中加入了一层Apache Pass或称之为NVDIMM(非易失性随机访问存储器)。新的体系变成了CPU、内存、NVDIMM和SSD,新加入的结构,性能和内存很接近,而且空间可以很大,掉电不会丢。
  最后鸣嵩表示,Apache Pass未来很大程度上会改变数据库软件,也意味着数据库的性能可以再向上提高一个档次。
其他文献
今年3月中旬,随着美国普遍要求人们保持社交距离,LogMeIn公司的IT部门注意到了一些变化。LogMeIn为那些不在办公室工作的员工提供远程访问和对视频会议软件GoToMeeting的支持,因此对于这种情况的出现并不感到惊讶。但是,远程工作需求如此的急剧增长还是带来了一些挑战。  LogMeIn的首席信息官兼高级副总裁Ian Pitt介绍说:“IT部门负责我们客户服务和销售部门的所有联络中心。我
近日,曹慧泉在接受记者采访时表示:“工业互联网作为新一代信息技术与制造业深度融合的产物,推广应用是抢占新一轮工业革命制高点的关键所在。利用工业互联网为制造业转型升级,实现高质量发展是大势所趋,大有可为。”  为进一步推动工业互联网与制造业深度融合,曹慧泉建议继续加大政策支持力度,以普惠制的財税政策鼓励支持制造业企业推广应用工业互联网,加快数字化、信息化、智能化改造。建议完善法律法规,严厉打击网络安
随着5G引领的新基建渐行渐近,北京数字经济也开始全面提速。9月7日,在2020年中国国际服务贸易交易会上,北京发布了《北京市促进数字经济创新发展行動纲要(2020-2022年)》《北京市关于打造数字贸易试验区的实施方案》《北京国际大数据交易所设立工作实施方案》等系列方案,致力于将北京打造成为全国数字经济发展的先导区和示范区。  根据《北京市促进数字经济创新发展行动纲要(2020-2022年)》,北
企业中很少有像网络边缘一样面临剧烈动荡的领域。专家表示,推动这一变化的是各种挑战,如不断增长的SD-WAN访问需求、云互连资源和物联网,企业的传统边界正在发生根本性变化,这种变化将贯穿整个2020年。  据市场研究机构Gartner的研究显示,到2023年,超过50%的企业生成数据将在数据中心或云计算外部创建和处理,而这一比例在2019年还不到10%。  伴随着这一变化,网络边缘所支持的技术也在发
5月6日,第二届数字中国建设峰会在福州開幕。国家网信办当日在此次峰会上发布了《数字中国建设发展报告(2018年)》。报告显示,2018年我国数字经济规模达到31.3万亿元,GDP占比高达34.8%。  在此次峰会的大数据分论坛上,工业和信息化部总经济师王新哲指出,大数据的重要性日益凸显。2018年我国大数据带来的产业规模约5400亿元,预计到2020年这一数字将逾1万亿元。利用大数据提升国家方方面
Gartner预测,网络安全网格、人工智能工程和分布式云服务等技术发展趋势将对企业未来的的IT运营产生重大影响。  市场研究机构Gartner每年都会公布企业来年需要为之做好准备的顶级战略性技术发展趋势。今年Gartner认为,企业需要接受颠覆性变革将成为常态这一事实,并将重点放在架构弹性上。  Gartner在今年召开的IT论坛/Xpo Americas会议上公布了明年需要关注的战略性技术列表。
12月24日,全國工业和信息化工作会议披露,自正式启动5G商用以来,全国已开通5G基站12.6万个,超额完成网络提速降费年度任务,“携号转网”全国实行,并力争到2020年底在全国所有地级市实现5G网络覆盖。  最新数据显示,截至12月16日,三大运营商在北京共建设5G基站16634个,开通5G基站14577个。五环内室外5G信号已基本实现无缝覆盖,五环外实现精准覆盖。北京市已发展5G客户25.1万
随着企业将工作负载迁移到云端,对本地数据中心设备的需求逐步减少了。但本地部署还远未消失,超融合基础设施(HCI,Hyperconverged Infrastructure)是其中蓬勃发展的领域。  HCI是一种可扩展的、软件集成的基础设施,在计算、网络和存储容量等方面采用了模块化的方法。HCI并不是独立地使用专用硬件,而是利用分布式的横向商用硬件,并提供用于报告和管理的单面板仪表盘。它有各种各样的
企业越来越多地转向采用人工智能技术来帮助加强客户关系,让客户享有个性化的体验,同时增加企业收入。  前沿企业转向采用人工智能和机器学习技术,改变他们与客户互动的方式,加强客户关系,使自己从竞争对手中脱颖而出,同时还能增加收入。  实现这种转变的核心是聊天机器人、推荐引擎、个性化沟通、智能定向投放广告和图像识别等技术。Gartner分析师John-David Lovelock预测,到2022年,人工
面对疫情的挑战,正在实施人工智能和机器学习的几位CIO讨论了他们所做的工作。  如今人工智能和机器学习在企业界受到越来越热烈的追捧,企业组织日益利用这些技术更准确地预测客户的偏好,并加强业务运营。  据知名调研公司IDC称,到2023年,人工智能系统的支出将达到979亿美元,几乎是2019年支出375亿美元的三倍。据凯捷咨询(Capgemini)今年6月发布的研究显示,接受调查的950家企业组织中