英伟达推出高性能网络SSD池化方案,打破存储性能边界

发布时间:2021-08-3 阅读量:1227 来源: 我爱方案网 作者: 我爱方案网整理

AI、大数据及云业务的快速普及,对算力和存储性能的需求日益增强,其目标就是应对井喷式的数据增长,满足社会智能化发展的需要。这种情况表现为在服务器层面,一个重要的需求就是内存提供更大的容量来处理需要分析的数据,其数据容量动辄几百GB乃至上TB级的容量;但是在一台服务器上对于内存的无限增加无论从实现上还是成本上都是个难题。随着NVMe SSD的性能越来越高,容量越来越大,成本日趋合理,为了应对远大于内存容量上限的上TB级数据的处理,越来越多的用户选择把NVMe SSD被用于充当内存的Cache,存储那些体量大,但不需要频繁修改的数据。这样,配置NVMe SSD成为了高性能计算服务器的标准配置。


NVMe SSD相比传统的机械硬盘,IO处理能力不管是在小文件传输、还是大文件传输上有了数量级的提高;但是,相比于内存的IO处理能力而言,还是有着非常大的差距(如下图所示),这也成为了制约NVMe SSD应用和高性能计算平台普及的一个重要问题。


1627953604(1)_副本.jpg


NVMeSSDDDR4占比


4K(读|写IOPS)700K|200K10M|10M2-7%


128K(读|写Bps)3.3G|3.0G32G|32G5%


当然,为了解决NVMe SSD传输的性能瓶颈,可以在每个服务器上配置多块SSD做Raid0,这样可以提高SSD的性能。但是,这样做会明显推高单台服务器上SSD的配置成本,而且SSD的容量浪费会变得异常明显。


networking-blog-image1-672x338_副本.png


图1:A代表配置一块NVMe SSD的服务器,B代表配置多块NVMeSSD的服务器,C代表采用了InfiniBand网络NVMeover Fabric的SSD池化方案,多台服务器共享NVMe SSD,在配置NVMe SSD的服务器上配置高性能并行文件系统,将SSD共享给每一台计算服务器,实现高IO访问同时,SSD容量利用率也得到了大幅提高


所以,NVIDIA网络事业部联合西部数据公司和北京极客天成科技有限公司,针对这一问题开展了基于InfiniBand网络的NVMe Over Fabric的高性能并行文件系统的尝试,将NVMe SSD池化,然后通过网络共享给对应的计算节点。在低成本和高性能中给出了最佳的融合实践。


该实践是在两台服务器上部署并完成测试的,其中一台服务器作为存储节点配置了12块西部数据SN8406.4TB的NVMe SSD,单SSD盘的4K随机读IO性能高达每秒780K,随机写IO性能高达每秒253K,128K文件的随机写带宽高达3.2GBps,128K文件的随机读带宽高达3.47GBps,高性能且速率稳定的SSD保证了整体测试的质量。另外一台服务器配置为计算节点,两台服务器均配置NVIDIA Mellanox的最新200GbpsHDRInfiniBand网卡,通过HDR交换机连接,InfiniBand网络的超高转发速率,且不丢包的特性对于高性能Cache池的应用至关重要,让用户不必担心在频繁的数据交换过程中由于突发的报文丢包而造成转发性能下降;同时,将12块SSD通过极客天成的高性能并行文件系统整合成一张性能和容量超大的共享网盘,共享给计算节点使用,并通过文件系统将所有的SSD盘管理起来,实现了高性能和高性价比的兼顾,构建出池化方案的基本轮廓。


实践数据如下:


networking-blog-image2-672x369_副本.png

图2:4KFIO测试数据在12块SSD的情况下,随机读性能为1.97MIOPS,随机写性能为4.16MIOPS,随机读+随机写的性能为3.55MIOPS


networking-blog-image3_副本.png

图3:128KFIO测试数据在6块SSD盘的情况下,随机读的性能为19GBps,随机写的性能为26.2GBps,随机读+随机写的性能为30.4GBps


通过测试数据对比NVMe SSD池化方案与本地内存采用Ramdisk方案的数据不难发现,基于InfiniBand网络的NVMeSSD池作为cache的性能已经明显得到优化,达到了接近内存的效果。


SSD Cache池DDR4占比


4K(读|写IOPS)1.77M|1.77M10M|10M17%

128K(读|写Bps)19G|26.2G32G|32G60-82%


从以上的测试结果不难看出,基于InfiniBand网络的SSD池化方案,可以经济地实现超高性能的Cache池来加速应用,成为一种新型数据中心高性能Cache池的通用架构。


NVIDIA(纳斯达克股票代码:NVDA)1999年发明的GPU驱动了PC游戏市场的增长,并重新定义了现代计算机图形、高性能计算和人工智能。NVIDIA在加速计算和AI领域的创举正在重塑交通,医疗健康和制造业等价值数万亿美元的产业,并推动了许多其他产业的增长。


西部数据公司作为数据基础架构的领导者,为用户提供创新的存储技术和解决方案,帮助用户获取、保存、访问和转换日益多样化的数据。从高级数据中心、移动传感器到个人设备,数据无所不在,西部数据提供业界领先的解决方案来探索数据的可能性。西部数据公司以数据为中心的解决方案由WesternDigitalTM(西部数据)、SanDiskTM(闪迪)、WDTM(西数)、WD_BLACKTM品牌组成。


北京极客天成科技有限公司以高通量分布式集群存储为先锋,围绕软件定义、智能化、安全可靠,NVMe Over Fabric构建了完全自主可控的分布式存储产品线和解决方案,主要解决用户海量数据下的高性能低时延数据读写难题,可为用户的数据中心提供创新和高效的存储及数据管理方案。

220x90
相关资讯
晶振启动时间影响因素解析与优化方向

​晶振的启动时间,通常是指其通电后进入稳定振荡状态所需的时间。若启动时间过长,可从以下五个常见的影响因素方面进行优化。

解析RTC实时时钟芯片的工作原理

RTC(Real-Time Clock,实时时钟)芯片作为一种独立的专用计时器件,其核心功能包括提供稳定的日历时钟、在主电源断电后持续运行、支持定时中断以及输出高精度时间戳,为各类嵌入式系统提供可靠的时间基准。

无源晶振与有源晶振在MCU应用中的关联逻辑与选型指南

时钟系统是保障微控制器(MCU)稳定运行的核心,而晶振作为关键时钟源,主要分为无源晶振与有源晶振两种类型。下面将围绕工作原理、硬件接口、电气特性及其在MCU中的适配场景等维度,系统解析这两类晶振与MCU之间的关联逻辑。

VC-OCXO压控恒温晶振管脚功能定义解析

恒温晶振(Oven Controlled Crystal Oscillator,简称OCXO)是高精度频率源的核心组件,选用切型更优(如SC切、AT切高精度型)、封装应力极小的高Q值晶片,通过恒温槽的超精密控温,让晶振始终工作在零温度系数点,几乎消除温度引发的频率漂移。

晶振倍频干扰解决方案:从PCB布局优化到源头抑制与电路整改

晶振倍频干扰(即高次谐波辐射)是电磁兼容(EMC)设计中非常棘手的问题,通常表现为基频25MHz的5次、7次谐波(如125MHz、175MHz等)处辐射超标。该问题源于晶振输出方波信号包含丰富的高次谐波成分,若PCB布局不当,晶振及其走线极易构成高效辐射天线,导致电磁干扰增强。