NetSpeed发布基于人工智能的片内互连方案

发布时间:2018-07-3 阅读量:1396 来源: 我爱方案网 作者:

特斯拉去年底宣布了正在研制AI芯片的大消息,这是以4级和5级自动驾驶为目标的前瞻性设计。

4级自动驾驶将需要非常巨大的计算和数据传输需求,英特尔的报告指出,其的计算量高达到4TB/天。目前,特斯拉的自动驾驶系统Autopilot采用英伟达的GPU方案。然而GPU计算能力的进一步提升带来的巨大功耗不容忽视,很难同时满足未来无人驾驶要求的巨大运算能力和超低功耗。4级自动驾驶未来采用更具功耗优势的AI芯片则是势在必行。

据悉,特斯拉这款自研AI芯片已经进入测试阶段。和同类芯片相比,其开发周期大大缩短,仅仅9个月。这是因为该芯片在设计初期就采用了颠覆性的设计思路,芯片内部通信采用了NetSpeed Systems公司基于人工智能的拓扑结构。

无独有偶,高通、Intel、亚马逊,以及中国的AI领军企业百度、寒武纪和地平线机器人也采用了这种创新的片内互连方案。为什么这一设计理念会受到众多AI公司的青睐?NetSpeed Systems大中华区销售总监黄啓弘介绍了最新发布的SoC片内互连方案Orion AI及其优势。

图:NetSpeed Systems大中华区销售总监黄啓弘

人工智能技术在视频、语音、预测、机器人及自动驾驶等应用中越来越广泛。黄啓弘表示,

这些热门的AI应用已经对处理能力提出进阶需求,需要TB/s量级的带宽。芯片内部上千个运算单元,会达到甚者超过512位的位宽,这些对工程师设计SoC架构带来了巨大的挑战。这时候,就需要打破传统的设计思路,借助人工智能算法帮助工程师化繁为简。

Orion AI片内互连方案应运而生。Orion AI基于NetSpeed经过验证的Orion IP,提供了以人工智能为核心的设计方法,在芯片内部采用点对点通信,通过大型矩阵乘法,帮助工程师寻找到最佳解决方案,显著节省了开发时间。“在SoC架构设计的最初,工程师就可以把系统需求提供给Orion AI,NetSpeed的图灵机器学习引擎将通过神经网路进行多次的学习迭代,不断优化,最终得到符合系统需求的最佳设计。”黄啓弘表示,“工程师们不必再为思考系统内部数据交换的主从关系等耗费大量宝贵的时间,而能用更多的精力进行创新设计。如果系统需求要更改或进一步提升,Orion AI也可以提供持续的设计反馈。”

图:Orion AI在神经网络上多次迭代得到最佳方案

基于人工智能的设计需要大量的计算单元,任意节点数据点对点的通信也需要极高的带宽,这时候,Orion AI支持可配置多播的专利技术和先进的QoS机制就显得至关重要。Orion AI可以动态控制下一点到多点的传播,而且支持无需回传的写入信息模式,大大提高了效率。同时,Orion AI先进的端到端带宽分配控制和通信隔离与延迟控制机制使QoS得到保障。

:Orion AI具有模块化、可扩展的多层堆叠架构

据介绍,Orion AI可实现极致性能,片上带宽高达万亿位,并具备支持数千计算引擎的底层架构。它提供超宽数据通路,接口位宽高达1024位,内部结构位宽更高,并可支持高达4K字节的长突发传输。NetSpeed近日推出的SoCBuilder包含一个预集成的第三方IP目录,以及针对人工智能、汽车电子、5G、超大规模计算和AR / VR等应用的专用参考设计。采用SoCBuilder,SoC开发将更快速、更容易,更准确,将系统搭建时间从数月或数周缩短到数天。

正如Linley Group首席分析师Linley Gwennap所说,有了Orion AI的帮助,“就像有一位随时在线的建筑大师给出设计建议。”Orion AI 重新定义了SoC设计,使得SoC既面向人工智能应用,本身也运用人工智能技术,工程师可以采纳图灵的建议得到最优架构,用宝贵的时间去解决SoC设计中的其他难题。


方案超市都是成熟的量产方案和模块,欢迎合作:

CMOS图像芯片调试及FPGA处理
FPGA解决方案
FPGA ATM采集卡


快包任务,欢迎技术服务商承接:

寻找在Xilinx FPGA上的JPEG图像编解码IP 预算:¥80000
FPGA配置文件回读 预算:¥10000
FPGA开发 预算:¥5000


>>购买VIP会员套餐


相关资讯
强强联合!英伟达50亿入股英特尔

英伟达投资50亿入股英特尔股票

​温补晶振(TCXO)核心技术解析:8大关键参数决定系统时序精度​

在高速通信、精准导航与精密测量等尖端领域,电子系统的时序架构对时钟信号稳定性的要求已近乎苛刻——其精度如同机械钟表的游丝摆轮,微小偏差便可能引发整个系统的时序紊乱,导致数据传输错误、定位偏移或测量失准。环境温度的波动一直是普通晶振频率稳定性的最大挑战,而温补晶振(Temperature Compensated Crystal Oscillator,简称TCXO)作为高精度时钟基准的核心器件,正是为解决这一核心问题而生。它凭借内置的“感知-计算-补偿”机制,在宽温环境下实现对频率的精准锁定,将温度变化引发的漂移压制在极低水平,成为高端电子系统中不可或缺的“时序锚点”。要真正理解并选型这一精密器件,就必须深入剖析其决定性能优劣的几个重要参数。

汽车BMS技术:动力电池的“智慧守护者”,全维度解密其核心优势与应用场景

本文将深入剖析汽车级BMS的核心技术优势及其广泛的关键应用场景

工业检测为何必须用工业相机?普通相机的四大核心短板解析

工业相机是根据工业检测的特殊需求进行深度优化与强化的专业设备

贸泽开售Renesas Electronics RA8P1微控制器 为先进AI提供高CPU性能

Renesas Electronics RA8P1微控制器可提供超过7,300 CoreMarks的CPU性能,以及在500 MHz时256 GOPS的AI性能