借助 reVISION 加速安防监控系统设计

发布时间:2017-07-18 阅读量:1961 来源: 我爱方案网 作者: candytang

监控系统严重依靠嵌入式视觉系统提供的功能加速在广泛市场和系统中的部署。这些监控系统的用途非常广泛,包括事件和流量监控、安全与安防用途、ISR 和商业智能。用途的多样性也带来了几大挑战,需要系统设计人员在解决方案中加以解决。它们是:


• 多摄像头视觉 – 能够连接多个同类或异类传感器类型。
• 计算机视觉技术 - 能够使用高级库和框架(例如 OpenCV 和 OpenVX)进行开发。 
• 机器学习技术 – 能够使用框架(例如 Caffe)来实现机器学习推断引擎。
• 提高分辨率和帧率 – 提高每个图像帧所需的数据处理。


根据用途,监控系统会实现相应算法(例如光流法)以检测图像内的运动。立体视觉提供图像内的深度知觉,也使用机器学习技术来检测和分类图像中的对象。
  



图 1 - 实例应用(上:面部检测与分类,下:光流)


异构系统器件,例如 All Programmable Zynq®-7000 和 Zynq® Ultrascale+™ MPSoC,正越来越多地应用于监控系统的开发。这些器件是可编程逻辑(PL)架构与高性能 ARM® 内核处理器系统(PS)的完美结合。


与传统方案相比,PL 与 PS 的紧密耦合使得创建的系统具有更强的响应能力、可重配置能力以及更高的能效。基于 CPU/GPU 的传统 SoC 需要使用系统存储器将图像从一个处理阶段传送到下个阶段。这会降低确定性并增大功耗和系统响应时延,因为多个资源需要访问同一个存储器,造成处理算法瓶颈。该瓶颈随帧率和图像分辨率增加而加重。


当解决方案采用 Zynq-7000 或 Zynq UltraScale+ MPSoC 器件实现时,就会打破这个瓶颈。这些器件允许设计人员在器件的 PL 中实现图像处理流水线。在 PL 中创建真正的并行图像流水线,其中一个阶段的输出被传送到另一个阶段的输入。这样能获得确定的响应时间,缩短时延,实现功耗最佳解决方案。


利用 PL 实现图像处理流水线,还能获得比传统 CPU/GPU SoC 方案更宽的接口能力,而后者只能获得固定接口。PL IO 接口的灵活特性允许任意连接,支持 MIPI、Camera Link、HDMI 等行业标准接口。这种灵活特性还能实现定制传统接口,而且能进行升级以支持最新接口标准。利用 PL,还可以让系统并行连接多个摄像头。


不过,最关键的是实现应用算法,而且无需用硬件描述语言(例如 Verilog 或 VHDL)重新编写所有高级算法。这正是 reVISION™ 堆栈的用武之地。


 
图 2 - 传统 CPU/GPU 方案与 Zynq-7000/Zynq UltraScale+ MPSoC 的对比


reVISION 堆栈


reVISION 堆栈使开发人员能够实现计算机视觉和机器学习技术。在这里,针对 Zynq-7000 和 Zynq UltraScale+ MPSoC 的高级框架和库同样适用。为此,reVISION 将支持平台、应用和算法开发的多种资源完美结合在一起。该堆栈分为三个不同等级:


1. 平台开发 - 这是堆栈的最底层,是剩余堆栈层的构建基础。该层为 SDSoC™ 工具提供平台定义。

2. 算法开发 – 这是堆栈的中间层,为所需算法的实现提供支持。该层有助于图像处理和机器学习推断引擎加快向可编程逻辑中转移。

3. 应用开发 – 这是堆栈的最高层,可提供行业标准框架支持。该层用来开发应用,以便利用平台开发和算法开发层。


堆栈的算法和应用层支持传统图像处理流程和机器学习流程。在算法层中,支持用 OpenCV 库开发图像处理算法。这包括:能将多种 OpenCV 功能(包括 OpenVX 内核子集)加速放在可编程逻辑中实现。为支持机器学习,算法开发层提供几种可以放在 PL 中用以实现机器学习推断引擎的预定义硬件功能。然后,由应用开发层访问这些图像处理算法和机器学习推断引擎,用以创建最终应用,并为 OpenVX 和 Caffe 等高级框架提供支持。
 


图 3 - reVISION 堆栈


reVISION 堆栈能提供所有必要元素,用以实现高性能监控系统所需的算法。


在 reVISION 中加速 OpenCV


算法开发层的最重要优势之一是能够加速多种 OpenCV 功能。该层中,可加速的 OpenCV 功能被分成四个高级类别。


1. 计算 – 包括的功能有:两个帧的绝对偏差、像素运算(加、减和乘)、梯度和积分运算。
2. 输入处理 – 支持位深度转换、通道运算、直方图均衡化、重新映射和尺寸重调整。
3. 滤波 - 支持多种滤波器,包括 Sobel、自定义卷积和高斯滤波器。
4. 其他 – 提供多种功能,包括 Canny/Fast/Harris 边缘检测、阀值以及 SVM 和 HoG 分级器。


这些功能构成了 OpenVX 子集的核心功能,能够针对 OpenVX 与应用开发层紧密集成。开发团队可利用这些功能在可编程逻辑中创建算法流水线。以此方式在逻辑中实现这些功能,这样能显著提高算法实现性能。


reVISION 中的机器学习


reVISION 提供与 Caffe 的集成,能够实现机器学习推断引擎。与 Caffe 的集成发生在算法开发层和应用开发层。Caffe 框架在 C++ 库中为开发人员提供大量函数库、模型和预训练的权重,以及 Python™ 和 MATLAB® 捆绑程序。该框架使用户能够创建和训练网络,以执行所需的运算,无需重新开始。为便于模型重用,Caffe 用户可通过模型库(model zoo)共享模型;库中提供多个网络模型,用户可针对专门的任务实现和更新网络模型。在 prototxt 文件中定义这些网络和权重,当在机器学习环境中部署时,使用该文件来定义推断引擎。


reVISION 提供 Caffe 集成功能,使机器学习推断引擎的实现非常简单,只需提供 prototxt 文件即可;剩下的工作由框架来完成。然后,使用这个 prototxt 文件来配置处理系统以及可编程逻辑中的硬件优化库。可编程逻辑用来实现推断引擎,并包含 Conv、ReLu、Pooling 等功能。

 


图 4 - Caffe 流程集成


机器学习推断引擎中的数字表达对性能也起到重要作用。机器学习越来越多地使用更为高效、降低精度的定点数字系统,例如 INT8 表达法。与传统的浮点 32 (FP32)方法相比,定点降精度数字系统不会造成较大精度损失。与浮点相比,定点运算更易于实现,因此改用 INT8 后能实现更高效、快速的解决方案。可编程逻辑解决方案最适合使用定点数字,reVISION 能在 PL 中使用 INT8 表达法。采用 INT8 表达法后,可在 PL 中使用专用 DSP 模块。有了这些 DSP 模块的架构,当使用相同的内核权重时,可同时执行两个 INT8 乘法累积运算。这样不仅能获得高性能实现方案,而且可以降低功耗。凭借可编程逻辑的灵活特性,也可以轻松实现精度更低的定点数字表达形式。


结论


reVISION 使开发人员能够利用 Zynq-7000 和 Zynq UltraScale+ MPSoC 器件所提供的功能。而且,即使不是专家也能利用可编程逻辑来实现算法。这些算法和机器学习应用可通过高级的行业标准框架来实现,从而缩短系统开发时间。这使开发人员能够提供响应性和可重配置能力更强而且功耗更加优化的系统。

相关资讯
华虹半导体2025年Q1业绩解析:逆势增长背后的挑战与破局之路

2025年第一季度,华虹半导体(港股代码:01347)实现销售收入5.409亿美元,同比增长17.6%,环比微增0.3%,符合市场预期。这一增长得益于消费电子、工业控制及汽车电子领域需求的复苏,以及公司产能利用率的持续满载(102.7%)。然而,盈利能力显著下滑,母公司拥有人应占溢利仅为380万美元,同比锐减88.05%,环比虽扭亏为盈,但仍处于低位。毛利率为9.2%,同比提升2.8个百分点,但环比下降2.2个百分点,反映出成本压力与市场竞争的加剧。

边缘计算新引擎:瑞芯微RV1126B四大核心技术深度解析

2025年5月8日,瑞芯微电子正式宣布新一代AI视觉芯片RV1126B通过量产测试并开启批量供货。作为瑞芯微在边缘计算领域的重要布局,RV1126B凭借3T算力、定制化AI-ISP架构及硬件级安全体系,重新定义了AI视觉芯片的性能边界,推动智能终端从“感知”向“认知”跃迁。

半导体IP巨头Arm:季度营收破12亿,AI生态布局能否撑起估值泡沫?

2025财年第四季度,Arm营收同比增长34%至12.4亿美元,首次突破单季10亿美元大关,超出分析师预期。调整后净利润达5.84亿美元,同比增长55%,主要得益于Armv9架构芯片在智能手机和数据中心的渗透率提升,以及计算子系统(CSS)的强劲需求。全年营收首次突破40亿美元,其中专利费收入21.68亿美元,授权收入18.39亿美元,均刷新历史纪录。

Arrow Lake的突破:混合架构与先进封装的协同进化

2024年10月,英特尔正式发布Arrow Lake架构的酷睿Ultra 200系列处理器,标志着其在桌面计算领域迈入模块化设计的新阶段。作为首款全面采用Chiplet(芯粒)技术的桌面处理器,Arrow Lake不仅通过多工艺融合实现了性能与能效的优化,更以创新的混合核心布局和缓存架构重新定义了处理器的设计范式。本文将深入解析Arrow Lake的技术突破、性能表现及其对行业的影响。

暗光性能提升29%:深度解析思特威新一代AI眼镜视觉方案

2025年5月8日,思特威(股票代码:688213)正式发布专为AI眼镜设计的1200万像素CMOS图像传感器SC1200IOT。该产品基于SmartClarity®-3技术平台,集成SFCPixel®专利技术,以小型化封装、低功耗设计及卓越暗光性能,推动AI眼镜在轻量化与影像能力上的双重突破。公司发言人表示:"AI眼镜的快速迭代正倒逼传感器技术升级,需在尺寸、功耗与画质间实现平衡,这正是SC1200IOT的核心价值所在。"