论文部分内容阅读
有调查显示:如今人类每天都会产生2.5 quintillion bytes的数据(quintillion為10的18次方);手机每分钟都会发出1600万条短信;到2020年,全球移动设备数量预计将达到100亿台……
大数据:大机遇 大挑战
在美光科技亚太区解决方案架构总监See Ghee Tan(陈诗义)看来,这些大数据是全球的财富,可以在医疗、交通、制造等多个行业中帮助人们解决复杂问题。例如通过人工智能和机器学习分析病人的DNA数据,医生可以定制出可能尚未发现的癌症治疗方案;运用车联网技术分析道路和车辆数据,可以帮助汽车做出正确的判断,减少交通事故。
而如此大量的数据,在蕴藏着巨大机遇的同时,也带来了巨大的挑战,首先要解决的问题就是该如何有效地存储和分析这些数据?
据了解,美光科技制造半导体的过程就是一个借助数据分析和人工智能提高生产效率的成功实践。陈诗义向记者介绍,半导体制造是地球上最复杂的工作之一,美光从全球500多个服务器、8000余个数据来源收集了PB量级的数据,随后让数据科学家对这些数据进行分析,并建立AI和机器学习模型,改进了美光晶圆制造厂的生产过程,不仅能以极高的精确度在极短的时间完成任务,还能探测到熟练工作人员也难以感知到的异常情况。美光科技也凭借这一IT创新获得了2018年度CIO 100大奖。
“我们的愿景是通过改变世界使用信息的方式,让生活更加丰富多彩!”陈诗义强调,经过40多年的发展,美光已经从一家专门做DRAM的存储器厂商,逐渐发展成为提供存储器和存储方案的厂商。全球各地的PC和OEM厂商、游戏、汽车和工业、移动设备和网络设备、传统企业和云计算领域都在应用美光的存储器和存储方案。
美光9300 系列SSD应需而生
如今,美光存储主要分为两大产品线,一类是为个人计算机和工作站提供支持的客户端SSD,一类是满足不同企业、不断变化的IT应用和基础设施需求的企业级SSD。
陈诗义告诉记者,企业市场一直是美光关注的方向,根据美光的观察,近年来,企业级存储正呈现出以下趋势:
一、由于数据的海量增长,企业系统架构正在转向使用分布式的基础设施;
二、闪存的快速性能在超融合和边缘计算之间引入了新的连接点,每天有数十亿数据进入人工智能、机器学习、深度学习和实时分析领域;
三、企业需要全新的架构支持快速增长的分析项目,服务器的固态硬盘容量正在快速增长,企业需要更高效、容量更大的产品来支撑。
“美光的新系列旗舰产品——美光9300系列SSD就是在这样的背景下应需而生。”美光科技企业级固态硬盘高级产品经理Cliff Smith介绍,美光9300系列SSD采用PCIe第三代x4 NVMe界面,最高3500MB/s的读写速度,15.36TB容量,能以更大的容量为云计算和企业级市场提供更好的存储性能,帮助数据应用密集型公司更快速地访问和处理数据,从而缩短回应时间。
而美光9300系列SSD之所以采用NVMe协议,是因为NVMe正在超越SATA和SAS成为企业级固态硬盘的首选界面。当今企业对于部署云基础设施的需求正在不断增加,大量数据检索、处理和快速分析业务对存储的需求也越来越高,在这种需求的驱动下,许多企业主存储都在从SATA界面过渡到NVMe界面。
在谈到产品优势时,Cliff Smith为记者列举了一系列数据:美光9300系列SSD的性能比一般企业级SATA SSD快9倍,效率高出35%;与其他NVMe SSD相比,美光9300系列SSD在读取和写入方面同等地实现了3.5GB/s的吞吐量(6.4TB以上容量),能为以数据为中心的应用提供更快的回应时间;美光9300系列的功耗比前一代NVMe SSD低28%,有助于降低运营成本,高容量的可用性可让企业根据存储需求进行扩展,满足数据爆炸式增长的需求;大容量以及最高可达32个NVMe命名空间使企业能够更加有效地定制部署,以实现存储利用效率最大化。
Cliff Smith强调,对于拥有大型数据中心的企业来说,可能需要同时支持成千上百万客户的数据需求,所以在数据输入和数据转换时,数据中心的工作负载是非常高的。比较典型的例子是金融领域的高频交易,对于回应时间的要求非常高,甚至每一微秒的价值都能达到成百上千万美元。
为机器学习加速
除了上述特性,美光9300系列还对各种针对低延迟和性能关键型工作负载进行了优化,适用的工作负载包括:人工智能和机器学习中的训练/缓存、在线事务处理(OLTP)、高频交易(HFT)、块和对象存储等等。
以机器学习为例。通常,数据科学家会将机器学习分为两步:第一步是准备数据并分阶段导入硬盘缓存,在这个过程中,需要对数据进行获取、转换、加载和提取;第二部是将数据迁移到GPU 中进行学习,即将数据导出和训练。由于对存储的读取和写入有着极高的要求,这两个步骤通常是顺序进行的,而且数据科学家们在机器学习时采用的数据量都是PB级别、可能来自多个不同的平台,如果第一次获得的数据不成功,整套步骤就需要不断地重复进行。
而借助美光9300系列产品,数据的获取、转换、加载和提取这些步骤,与数据导出和训练的步骤可以同时进行,大大提升了处理任务的速度——比SATA SSD快了7倍,加速了数据转化为洞见的速度,让数据实现价值的效率大大提高了。
最后,在谈到下一代存储时,陈诗义表示,对企业来说最重要的是性价比,因为企业不同应用所需要的存储性能和企业愿意为此付出的成本是不一样的,美光会去研发贴近客户需求的产品,了解市场的演变,争取从中找到一个平衡点,打造出最佳方案。
大数据:大机遇 大挑战
在美光科技亚太区解决方案架构总监See Ghee Tan(陈诗义)看来,这些大数据是全球的财富,可以在医疗、交通、制造等多个行业中帮助人们解决复杂问题。例如通过人工智能和机器学习分析病人的DNA数据,医生可以定制出可能尚未发现的癌症治疗方案;运用车联网技术分析道路和车辆数据,可以帮助汽车做出正确的判断,减少交通事故。
而如此大量的数据,在蕴藏着巨大机遇的同时,也带来了巨大的挑战,首先要解决的问题就是该如何有效地存储和分析这些数据?
据了解,美光科技制造半导体的过程就是一个借助数据分析和人工智能提高生产效率的成功实践。陈诗义向记者介绍,半导体制造是地球上最复杂的工作之一,美光从全球500多个服务器、8000余个数据来源收集了PB量级的数据,随后让数据科学家对这些数据进行分析,并建立AI和机器学习模型,改进了美光晶圆制造厂的生产过程,不仅能以极高的精确度在极短的时间完成任务,还能探测到熟练工作人员也难以感知到的异常情况。美光科技也凭借这一IT创新获得了2018年度CIO 100大奖。
“我们的愿景是通过改变世界使用信息的方式,让生活更加丰富多彩!”陈诗义强调,经过40多年的发展,美光已经从一家专门做DRAM的存储器厂商,逐渐发展成为提供存储器和存储方案的厂商。全球各地的PC和OEM厂商、游戏、汽车和工业、移动设备和网络设备、传统企业和云计算领域都在应用美光的存储器和存储方案。
美光9300 系列SSD应需而生
如今,美光存储主要分为两大产品线,一类是为个人计算机和工作站提供支持的客户端SSD,一类是满足不同企业、不断变化的IT应用和基础设施需求的企业级SSD。
陈诗义告诉记者,企业市场一直是美光关注的方向,根据美光的观察,近年来,企业级存储正呈现出以下趋势:
一、由于数据的海量增长,企业系统架构正在转向使用分布式的基础设施;
二、闪存的快速性能在超融合和边缘计算之间引入了新的连接点,每天有数十亿数据进入人工智能、机器学习、深度学习和实时分析领域;
三、企业需要全新的架构支持快速增长的分析项目,服务器的固态硬盘容量正在快速增长,企业需要更高效、容量更大的产品来支撑。
“美光的新系列旗舰产品——美光9300系列SSD就是在这样的背景下应需而生。”美光科技企业级固态硬盘高级产品经理Cliff Smith介绍,美光9300系列SSD采用PCIe第三代x4 NVMe界面,最高3500MB/s的读写速度,15.36TB容量,能以更大的容量为云计算和企业级市场提供更好的存储性能,帮助数据应用密集型公司更快速地访问和处理数据,从而缩短回应时间。
而美光9300系列SSD之所以采用NVMe协议,是因为NVMe正在超越SATA和SAS成为企业级固态硬盘的首选界面。当今企业对于部署云基础设施的需求正在不断增加,大量数据检索、处理和快速分析业务对存储的需求也越来越高,在这种需求的驱动下,许多企业主存储都在从SATA界面过渡到NVMe界面。
在谈到产品优势时,Cliff Smith为记者列举了一系列数据:美光9300系列SSD的性能比一般企业级SATA SSD快9倍,效率高出35%;与其他NVMe SSD相比,美光9300系列SSD在读取和写入方面同等地实现了3.5GB/s的吞吐量(6.4TB以上容量),能为以数据为中心的应用提供更快的回应时间;美光9300系列的功耗比前一代NVMe SSD低28%,有助于降低运营成本,高容量的可用性可让企业根据存储需求进行扩展,满足数据爆炸式增长的需求;大容量以及最高可达32个NVMe命名空间使企业能够更加有效地定制部署,以实现存储利用效率最大化。
Cliff Smith强调,对于拥有大型数据中心的企业来说,可能需要同时支持成千上百万客户的数据需求,所以在数据输入和数据转换时,数据中心的工作负载是非常高的。比较典型的例子是金融领域的高频交易,对于回应时间的要求非常高,甚至每一微秒的价值都能达到成百上千万美元。
为机器学习加速
除了上述特性,美光9300系列还对各种针对低延迟和性能关键型工作负载进行了优化,适用的工作负载包括:人工智能和机器学习中的训练/缓存、在线事务处理(OLTP)、高频交易(HFT)、块和对象存储等等。
以机器学习为例。通常,数据科学家会将机器学习分为两步:第一步是准备数据并分阶段导入硬盘缓存,在这个过程中,需要对数据进行获取、转换、加载和提取;第二部是将数据迁移到GPU 中进行学习,即将数据导出和训练。由于对存储的读取和写入有着极高的要求,这两个步骤通常是顺序进行的,而且数据科学家们在机器学习时采用的数据量都是PB级别、可能来自多个不同的平台,如果第一次获得的数据不成功,整套步骤就需要不断地重复进行。
而借助美光9300系列产品,数据的获取、转换、加载和提取这些步骤,与数据导出和训练的步骤可以同时进行,大大提升了处理任务的速度——比SATA SSD快了7倍,加速了数据转化为洞见的速度,让数据实现价值的效率大大提高了。
最后,在谈到下一代存储时,陈诗义表示,对企业来说最重要的是性价比,因为企业不同应用所需要的存储性能和企业愿意为此付出的成本是不一样的,美光会去研发贴近客户需求的产品,了解市场的演变,争取从中找到一个平衡点,打造出最佳方案。