FPGA在云计算行业中的应用

发布时间:2022-10-8 阅读量:1192 来源: 我爱方案网整理 发布人: Aurora

FPGA,现场可编程门阵列,一种半定制的数字集成电路。FPGA 凭借其灵活性高、开发周期短、处理性能强(并行)等特点,广泛应用于通信、图像处理、医疗等领域。随着科技的进步,FPGA 在人工智能、5G 和自动驾驶等领域也有一席之地。但对于大多数人来说,FPGA依然是神秘而陌生的。让我们结合其在云计算行业中的应用,简单介绍一下。  

 

什么是FPGA?  

 

通俗来讲,它是一种芯片,和我们熟知的CPU、GPUASIC芯片一样,有其自己的应用场景。FPGAField Programmable Gate Array)中文名现场可编程逻辑门阵列,是可编程器件,与传统逻辑电路和门阵列(如PALGALCPLD器件)相比,FPGA具有不同的结构,允许无限次的编程。  

 

FPGA采用了逻辑单元阵列LCALogic Cell Array)这样一个概念,内部包括可配置逻辑模块CLBConfigurable Logic Block)、输入输出模块IOBInput Output Block)和内部连线(Interconnect)三个部分。    

 

FPGA的优势  

 

近几年人工智能、大数据各种web服务的规模在指数级的增长,而通用处理器(CPU)的摩尔定律的性能的提升遇到瓶颈。人们通过使用定制硬件来加速常见的计算任务,然而日新月异的行业又要求这些定制的硬件可被重新编程来执行新类型的计算任务。FPGA的可编程属性进入人们的视野。  

 

通常,计算密集型任务,如:矩阵运算、图像处理、机器学习、压缩、非对称加密、搜索引擎的排序等。这类任务一般是CPU把任务卸载(offload)给FPGA去执行。对这类任务,目前我们正在用的Intel StraTIx V FPGA的整数乘法运算性能与20核的CPU基本相当,浮点乘法运算性能与8核的CPU基本相当。  

 

Intel StraTIx 10 FPGA,配备更多的乘法器和硬件浮点运算部件,理论上可达到与现在的顶级CPU旗鼓相当的计算能力。

 

在云计算数据中心,FPGA相比与CPUGPU的核心优势在于延迟更低。各芯片的延迟对比,如下图:    

 

各芯片的延迟对比

 

对通信密集型任务,FPGA相比CPUGPU 的优势就更大了。从吞吐量上讲,FPGA上的收发器可以直接接上40 Gbps甚至100 Gbps的网线,线束处理任意大小的数据包;而CPU需要从网卡把数据包收上来才能处理,很多网卡是不能线束处理64字节的小数据包的。尽管可以通过插多块网卡来达到高性能,但CPU和主板支持的PCIe插槽数量往往有限,而且网卡、交换机本身也价格不菲。  

 

从延迟上讲,网卡把数据包收到CPU,CPU再发给网卡,即使使用DPDK这样高性能的数据包处理框架,延迟也有4-5微秒。更严重的问题是,通用CPU的延迟不够稳定。例如当负载较高时,转发延迟可能升到几十微秒甚至更高,操作系统中的时钟中断和任务调度也增加了延迟的不确定性。  

 

FPGA在云计算的应用  

 

云计算中心部署FPGA大致有三种场景:  

 

1 专用集群场景  

 

FPGA服务器作为专用服务器里面插满了FPGA加速卡,就像是一个FPGA组成的超级计算机。例如,某公司的实际应用一块PCIe卡上放了6FPGA,每台1U服务器上又插了4 PCIe卡。  

 

2 网络集群场景  

 

为了保证数据中心中服务器的同构性,在每台服务器上插一块FPGA,FPGA之间通过专用网络连接。  

 

独立节点场景  

 

FPGA脱离服务器,作为独立的角色存在于云计算集群中。把FPGA部署在网卡和交换机之间。如下图所示,每个FPGA有一个4 GB DDR3-1333 DRAM,通过两个PCIe Gen3 x8 接口连接到一个CPU socket(物理上是PCIe Gen3 x16接口,因为FPGA没有x16的硬核,逻辑上当成两个x8的用)。物理网卡(NIC)就是普通的40 Gbps网卡,仅用于宿主机与网络之间的通信。    

 

FPGA脱离服务器

 

FPGA(SmartNIC)对每个虚拟机虚拟出一块网卡,虚拟机通过SR-IOV直接访问这块虚拟网卡。原本在虚拟交换机里面的数据平面功能被移到了FPGA里面,虚拟机收发网络数据包均不需要CPU参与,也不需要经过物理网卡(NIC)。这样不仅节约了CPU资源,还提高了虚拟机的网络性能,把同数据中心虚拟机之间的网络延迟降低了10倍。  

 

FPGA复用主机网络的初心是加速网络和存储,更深远的影响则是把FPGA之间的网络连接扩展到了整个数据中心的规模,做成真正的cloud-scale 超级计算机。

 

关于我爱方案网

 

我爱方案网是一个电子方案开发供应链平台,提供从找方案到研发采购的全链条服务。找方案,上我爱方案网!在方案超市找到合适的方案就可以直接买,没有找到就到快包定制开发。我爱方案网积累了一大批方案商和企业开发资源,能提供标准的模块和核心板以及定制开发服务,按要求交付PCBA、整机产品、软件或IoT系统。更多信息,敬请访问http://www.52solution.com


相关资讯
核心对比!无源晶振与有源晶振在结构和工作原理的本质区别

无源晶振与有源晶振是电子系统中两种根本性的时钟元件,其核心区别在于是否内置振荡电路。晶振结构上的本质差异,直接决定了两者在应用场景、设计复杂度和成本上的不同。

温度稳定性对RTC晶振的计时误差影响与分析

RTC(实时时钟)电路广泛采用音叉型32.768kHz晶振作为时基源,但其频率稳定性对温度变化极为敏感。温度偏离常温基准(通常为25℃)时,频率会产生显著漂移,且偏离越远漂移越大。

从参数到实践!剖析有源晶振的频率稳定度、老化率及正确接线方案

有源晶振作为晶振的核心类别,凭借其内部集成振荡电路的独特设计,无需依赖外部电路即可独立工作,在电子设备中扮演着关键角色。本文将系统解析有源晶振的核心参数、电路设计及引脚接法,重点阐述其频率稳定度、老化率等关键指标,并结合实际电路图与引脚定义,帮助大家全面掌握有源晶振的应用要点,避免因接线错误导致器件失效。

如何对抗晶振老化?深入生产工艺与终端应用的防老化指南

晶振老化是影响其长期频率稳定性的核心因素,主要表现为输出频率随时间的缓慢漂移。无论是晶体谐振器还是晶体振荡器,在生产过程中均需经过针对性的防老化处理,但二者的工艺路径与耗时存在显著差异。

无源晶振YSX321SL应用于高精度HUD平视显示系统YXC3225

在现代汽车行业中,HUD平视显示系统正日益成为驾驶员的得力助手,为驾驶员提供实时导航、车辆信息和警示等功能,使驾驶更加安全和便捷。在HUD平视显示系统中,高精度的晶振是确保系统稳定运行的关键要素。YSX321SL是一款优质的3225无源晶振,拥有多项卓越特性,使其成为HUD平视显示系统的首选。