英伟达推出高性能网络SSD池化方案,打破存储性能边界

发布时间:2021-08-3 阅读量:1179 来源: 我爱方案网 作者: 我爱方案网整理

AI、大数据及云业务的快速普及,对算力和存储性能的需求日益增强,其目标就是应对井喷式的数据增长,满足社会智能化发展的需要。这种情况表现为在服务器层面,一个重要的需求就是内存提供更大的容量来处理需要分析的数据,其数据容量动辄几百GB乃至上TB级的容量;但是在一台服务器上对于内存的无限增加无论从实现上还是成本上都是个难题。随着NVMe SSD的性能越来越高,容量越来越大,成本日趋合理,为了应对远大于内存容量上限的上TB级数据的处理,越来越多的用户选择把NVMe SSD被用于充当内存的Cache,存储那些体量大,但不需要频繁修改的数据。这样,配置NVMe SSD成为了高性能计算服务器的标准配置。


NVMe SSD相比传统的机械硬盘,IO处理能力不管是在小文件传输、还是大文件传输上有了数量级的提高;但是,相比于内存的IO处理能力而言,还是有着非常大的差距(如下图所示),这也成为了制约NVMe SSD应用和高性能计算平台普及的一个重要问题。


1627953604(1)_副本.jpg


NVMeSSDDDR4占比


4K(读|写IOPS)700K|200K10M|10M2-7%


128K(读|写Bps)3.3G|3.0G32G|32G5%


当然,为了解决NVMe SSD传输的性能瓶颈,可以在每个服务器上配置多块SSD做Raid0,这样可以提高SSD的性能。但是,这样做会明显推高单台服务器上SSD的配置成本,而且SSD的容量浪费会变得异常明显。


networking-blog-image1-672x338_副本.png


图1:A代表配置一块NVMe SSD的服务器,B代表配置多块NVMeSSD的服务器,C代表采用了InfiniBand网络NVMeover Fabric的SSD池化方案,多台服务器共享NVMe SSD,在配置NVMe SSD的服务器上配置高性能并行文件系统,将SSD共享给每一台计算服务器,实现高IO访问同时,SSD容量利用率也得到了大幅提高


所以,NVIDIA网络事业部联合西部数据公司和北京极客天成科技有限公司,针对这一问题开展了基于InfiniBand网络的NVMe Over Fabric的高性能并行文件系统的尝试,将NVMe SSD池化,然后通过网络共享给对应的计算节点。在低成本和高性能中给出了最佳的融合实践。


该实践是在两台服务器上部署并完成测试的,其中一台服务器作为存储节点配置了12块西部数据SN8406.4TB的NVMe SSD,单SSD盘的4K随机读IO性能高达每秒780K,随机写IO性能高达每秒253K,128K文件的随机写带宽高达3.2GBps,128K文件的随机读带宽高达3.47GBps,高性能且速率稳定的SSD保证了整体测试的质量。另外一台服务器配置为计算节点,两台服务器均配置NVIDIA Mellanox的最新200GbpsHDRInfiniBand网卡,通过HDR交换机连接,InfiniBand网络的超高转发速率,且不丢包的特性对于高性能Cache池的应用至关重要,让用户不必担心在频繁的数据交换过程中由于突发的报文丢包而造成转发性能下降;同时,将12块SSD通过极客天成的高性能并行文件系统整合成一张性能和容量超大的共享网盘,共享给计算节点使用,并通过文件系统将所有的SSD盘管理起来,实现了高性能和高性价比的兼顾,构建出池化方案的基本轮廓。


实践数据如下:


networking-blog-image2-672x369_副本.png

图2:4KFIO测试数据在12块SSD的情况下,随机读性能为1.97MIOPS,随机写性能为4.16MIOPS,随机读+随机写的性能为3.55MIOPS


networking-blog-image3_副本.png

图3:128KFIO测试数据在6块SSD盘的情况下,随机读的性能为19GBps,随机写的性能为26.2GBps,随机读+随机写的性能为30.4GBps


通过测试数据对比NVMe SSD池化方案与本地内存采用Ramdisk方案的数据不难发现,基于InfiniBand网络的NVMeSSD池作为cache的性能已经明显得到优化,达到了接近内存的效果。


SSD Cache池DDR4占比


4K(读|写IOPS)1.77M|1.77M10M|10M17%

128K(读|写Bps)19G|26.2G32G|32G60-82%


从以上的测试结果不难看出,基于InfiniBand网络的SSD池化方案,可以经济地实现超高性能的Cache池来加速应用,成为一种新型数据中心高性能Cache池的通用架构。


NVIDIA(纳斯达克股票代码:NVDA)1999年发明的GPU驱动了PC游戏市场的增长,并重新定义了现代计算机图形、高性能计算和人工智能。NVIDIA在加速计算和AI领域的创举正在重塑交通,医疗健康和制造业等价值数万亿美元的产业,并推动了许多其他产业的增长。


西部数据公司作为数据基础架构的领导者,为用户提供创新的存储技术和解决方案,帮助用户获取、保存、访问和转换日益多样化的数据。从高级数据中心、移动传感器到个人设备,数据无所不在,西部数据提供业界领先的解决方案来探索数据的可能性。西部数据公司以数据为中心的解决方案由WesternDigitalTM(西部数据)、SanDiskTM(闪迪)、WDTM(西数)、WD_BLACKTM品牌组成。


北京极客天成科技有限公司以高通量分布式集群存储为先锋,围绕软件定义、智能化、安全可靠,NVMe Over Fabric构建了完全自主可控的分布式存储产品线和解决方案,主要解决用户海量数据下的高性能低时延数据读写难题,可为用户的数据中心提供创新和高效的存储及数据管理方案。

相关资讯
核心对比!无源晶振与有源晶振在结构和工作原理的本质区别

无源晶振与有源晶振是电子系统中两种根本性的时钟元件,其核心区别在于是否内置振荡电路。晶振结构上的本质差异,直接决定了两者在应用场景、设计复杂度和成本上的不同。

温度稳定性对RTC晶振的计时误差影响与分析

RTC(实时时钟)电路广泛采用音叉型32.768kHz晶振作为时基源,但其频率稳定性对温度变化极为敏感。温度偏离常温基准(通常为25℃)时,频率会产生显著漂移,且偏离越远漂移越大。

从参数到实践!剖析有源晶振的频率稳定度、老化率及正确接线方案

有源晶振作为晶振的核心类别,凭借其内部集成振荡电路的独特设计,无需依赖外部电路即可独立工作,在电子设备中扮演着关键角色。本文将系统解析有源晶振的核心参数、电路设计及引脚接法,重点阐述其频率稳定度、老化率等关键指标,并结合实际电路图与引脚定义,帮助大家全面掌握有源晶振的应用要点,避免因接线错误导致器件失效。

如何对抗晶振老化?深入生产工艺与终端应用的防老化指南

晶振老化是影响其长期频率稳定性的核心因素,主要表现为输出频率随时间的缓慢漂移。无论是晶体谐振器还是晶体振荡器,在生产过程中均需经过针对性的防老化处理,但二者的工艺路径与耗时存在显著差异。

无源晶振YSX321SL应用于高精度HUD平视显示系统YXC3225

在现代汽车行业中,HUD平视显示系统正日益成为驾驶员的得力助手,为驾驶员提供实时导航、车辆信息和警示等功能,使驾驶更加安全和便捷。在HUD平视显示系统中,高精度的晶振是确保系统稳定运行的关键要素。YSX321SL是一款优质的3225无源晶振,拥有多项卓越特性,使其成为HUD平视显示系统的首选。