英伟达TensorRT 8上线,实现了AI推理方面的突破

发布时间:2021-07-22 阅读量:976 来源: 我爱方案网 作者: 我爱方案网整理

NVIDIA在推理方面取得突破,从云端到边缘实现更智能、更具互动性的对话式AI。


TensorRT8为医疗、汽车和金融领域的领先企业提供全球最快AI推理性能。


NVIDIA于今日发布公司第八代AI软件TensorRT 8。该软件将语言查询推理时间缩短了一半,使开发者能够从云端到边缘构建全球最佳性能的搜索引擎、广告推荐和聊天机器人。


TensorRT8的各项优化为语言应用带来了创纪录的速度,能够在1.2毫秒内运行BERT-Large——全球最广为采用的基于transformer的模型之一。过去,企业不得不缩减模型大小,而这会导致结果出现大幅偏差。现在有了TensorRT8,企业可以将其模型扩大一倍或两倍,从而大幅提高精度。


NVIDIA开发者计划副总裁GregEstes表示:“AI模型正以指数级的速度增长。全世界对AI实时应用的使用需求正在激增。这使企业必须部署最先进的推理解决方案。最新版本的TensorRT引入了多项新功能,使企业能够以前所未有的质量和响应速度向其客户提供对话式AI应用。”


五年来,医疗、汽车、金融和零售等各个领域27,500家企业的超35万名开发者下载TensorRT近250万次。TensorRT可部署于超大规模数据中心、嵌入式或汽车产品平台。


最新推理创新


除了针对transformer的优化之外,TensorRT8还通过其他两项关键特性,实现了AI推理方面的突破。


其一是稀疏性,这是助力推动NVIDIAAmpere架构GPU性能提升的一项全新技术,它不但提高了效率,还使开发者能够通过减少计算操作来加速其神经网络。


其二是量化感知训练,开发者能够使用训练好的模型,以INT8精度运行推理,在这一过程中不会损失精度。这大大减少了计算和存储成本,从而在TensorCore核心上实现高效推理。


广泛的行业支持


行业领导者已将TensorRT用于他们在对话式AI和其他各个领域的深度学习推理应用。


HuggingFace是开源AI技术的领导者,其客户包括全球多个行业领域的大规模AI服务提供商。该公司正与NVIDIA开展密切合作,推出能够助力实现大规模文本分析、神经搜索和对话式应用的开创性AI服务。


HuggingFace产品总监JeffBoudier表示:“我们正在与NVIDIA开展密切合作,以基于NVIDIAGPU,为最先进的模型提供最佳性能。HuggingFace加速推理API已经能够为基于NVIDIAGPU的transformer模型提供高达100倍的速度提升。通过TensorRT8,HuggingFace在BERT上实现了1毫秒的推理延迟。我们十分期待能在今年晚些时候为我们的客户提供这一性能。”


全球领先的医疗技术、诊断和数字解决方案创新者GE医疗正在使用TensorRT,助力加速早期检测疾病的关键工具——超声波计算机视觉应用,使临床医生能够通过其智能医疗解决方案提供最高质量的护理。


GE医疗心血管超声首席工程师ErikSteen表示:“临床医生需要花费宝贵的时间来选择和评估超声图像。在VividPatientCareElevatedRelease项目的研发过程中,我们希望通过在VividE95扫描仪上实施自动心脏视图检测,使这一过程变得更加高效。心脏视图识别算法将选择合适的图像来分析心壁运动。TensorRT凭借其实时推理能力,提高了视图检测算法的性能,同时缩短了我们研发项目的产品上市时间。”


可用性


TensorRT8现已全面上市,并免费向NVIDIA开发者计划成员提供。用户还可从TensorRTGitHub库中获得最新版本插件、解析器和样本的开放源代码。


220x90
相关资讯
晶振启动时间影响因素解析与优化方向

​晶振的启动时间,通常是指其通电后进入稳定振荡状态所需的时间。若启动时间过长,可从以下五个常见的影响因素方面进行优化。

解析RTC实时时钟芯片的工作原理

RTC(Real-Time Clock,实时时钟)芯片作为一种独立的专用计时器件,其核心功能包括提供稳定的日历时钟、在主电源断电后持续运行、支持定时中断以及输出高精度时间戳,为各类嵌入式系统提供可靠的时间基准。

无源晶振与有源晶振在MCU应用中的关联逻辑与选型指南

时钟系统是保障微控制器(MCU)稳定运行的核心,而晶振作为关键时钟源,主要分为无源晶振与有源晶振两种类型。下面将围绕工作原理、硬件接口、电气特性及其在MCU中的适配场景等维度,系统解析这两类晶振与MCU之间的关联逻辑。

VC-OCXO压控恒温晶振管脚功能定义解析

恒温晶振(Oven Controlled Crystal Oscillator,简称OCXO)是高精度频率源的核心组件,选用切型更优(如SC切、AT切高精度型)、封装应力极小的高Q值晶片,通过恒温槽的超精密控温,让晶振始终工作在零温度系数点,几乎消除温度引发的频率漂移。

晶振倍频干扰解决方案:从PCB布局优化到源头抑制与电路整改

晶振倍频干扰(即高次谐波辐射)是电磁兼容(EMC)设计中非常棘手的问题,通常表现为基频25MHz的5次、7次谐波(如125MHz、175MHz等)处辐射超标。该问题源于晶振输出方波信号包含丰富的高次谐波成分,若PCB布局不当,晶振及其走线极易构成高效辐射天线,导致电磁干扰增强。