FPGA技术协助嵌入式系统竞逐于机器学习之路

 FPGA技术协助嵌入式系统竞逐于机器学习之路

机器学习技术是人工智能的一个重要科学发展,透过在经验学习中改善具体算法的效能,而且用来训练的数据越多,所学习出来的结果越好,为了处理分析大量图像或是语音等辨识的机器学习算法数据,需要采用GPU芯片所打造的高速平行运算处理的类神经网络超级计算机,利用诸如Tensorflow、Caffe等深度学习框架(Framework)等工具,来发展有效的算法。

一旦得到算法之后,对嵌入式系统的设计而言,迅速将算法应用到云端数据中心,或是直接到终端的边缘运算(Edge Computing)装置上,就是目前人工智能应用成果发挥的展示场。由于嵌入式系统本身的运算效能与低功率消耗的功能不断提升,所构建的智能功能、软硬件解决方案,非常有助于开创前所未有的人工智能的应用。

机器学习的技术已广泛应用于数据探勘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、语音和手写识别、战略游戏与机器人等应用领域。

可程序设计门阵列(FPGA)的解决方案,利用其可程序设计性的优势,已经广为业界所认知,赛灵思(Xilinx)做为FPGA解决方案的主要供货商而言,密切关注机器学习所带领的产业趋势,以及重要的应用范例。赛灵思亚太区工业及医疗市场的高级经理罗霖(Andy Luo)先生接受专访时,针对Xilinx产品进入机器学习的领域,提纲契领直指两个主要的应用领域。

赛灵思亚太区工业及医疗市场的高级经理罗霖(Andy Luo)

赛灵思亚太区工业及医疗市场的高级经理罗霖(Andy Luo)

首先,在云端机房与数据中心的应用领域,透过跨国性大型搜索引擎与社群媒体巨擘的紧密合作,以大陆市场为例,Xilinx与百度(Baidu)的搜索引擎加速器合作,具有重要的指标性,由于机器学习在高效能运算(HPC)平台上,使用的类神经网络模型与多层次架构(Training Framework)来训练算法,一旦将结果应用于数据中心的加速卡设计时,往往需要进行细部的调整与开发,所以弹性变更逻辑线路的设计要求下,FPGA的可程序化(Programmable)的能力就益行重要。

Xilinx的解决方案之所以迅速攫取多数大厂用户的目光,端赖两项重要的诱因,也就是低功率消耗与高度灵活的硬件平台,提供数据中心专用加速器性能上的优势,并支持数据中心业者,打造更快速的创新应用与技术。

Xilinx推出可重组加速堆栈(Reconfigurable Acceleration Stack)技术,针对机器学习、大数据分析和视频串流直播(Video Streaming)等三大新兴计算密集型应用,借助所提供各种应用链接库、开发工具和参考设计,有效的降低设计工程师开发FPGA通用的程序设计门坎,迅速解决数据中心中工作负载快速增长的挑战,并加速云端服务产品上市进程。

第二个重要的应用领域,就是在边缘运算装置的部署,因为大量的视讯镜头的使用,使得嵌入式视觉(Embedded Vision)技术可以因为采用机器学习的算法,而带来更多智能型的应用。

但是嵌入式系统考虑功率消耗需求,无法企求使用32或64位的高效能处理器,因此开发出一种技术,让多半使用32-bit或16-bit的浮点运算(Floating Point)所设计的算法,可以放在8位整数运算处理器的智能终端装置上,Xilinx的解决方案在这类的应用上,保持算法在嵌入式系统上有效的准确度,所以使用机器学习所训练而获得的算法,当部署到低耗电与低运算密度的系统时,仍能完成人工智能的应用。

智能终端运算应用随着空拍机与自动驾驶汽车的发展,尤其是先进驾驶辅助系统(ADAS)中的自动识别、路线规划,以及无人机上自动避开空中障碍,或是视讯监控与辨识分析等新兴功能,带领令人高度期待的应用,也推增FPGA的市场占有率。

另一个重点就是工业4.0的应用,这利用传感器融合(Sensor Fusion)的装置,将工业场域所收集的控制数据,做线性规划与数据分类,以掌握工业设备目前的状态。选择Xilinx的FPGA组件能在单一芯片上提供广泛的高速界面,能以低成本获得更高效能,并因为各种开发环境整合到同一平台上而节省开发资源,让客户得以专注于开发差异化功能的产品,取得市场先机。

低功率消耗与快速反应速度 FPGA独擅胜场
和GPU为主的解决方案相比,罗霖分析FPGA的主要优势,首推低功耗的设计,通常3瓦的功耗的设计足以支撑整个加速卡的效能,第二个重要的优势,是反应速度快速,以微秒等级的反应速度,特别适合在空拍机或是自驾车应用的领域,因为反应速度决定人身安全的重要诉求。

用户喜欢...

技术分享#CC2650开发板设计PCB原理图

一、开发板逻辑原理图 如前所述,CC2650是一个功能丰富,特点鲜明的全能型射频通讯管理芯片,简单地把主要的功能引脚引出的开发板设计是好的设计方案,不过不大符合不断地给自己找麻烦...


FPGA加速器卡的PCB设计注意事项

本应用笔记概述了PCI Express卡机电规范3.0版定义的加速器卡形状因子。 它解决了印刷电路板(PCB)设计挑战,从叠层设计到介电材料选择,再到PCB设计过程中使用的PCB制造技术。 该图呈现了典...


使用Zynq UltraScale +器件开发防篡改设计

本应用笔记提供了防篡改(AT)指南和实际示例,以帮助保护ZynqUltraScale+器件支持的系统中可能存在的知识产权(IP)和敏感数据。 这种保护(以防篡改的形式)需要在Zynq UltraScale +器件通过软...


超移动便携式嵌入式系统的三大基本技术

SB的新型通用Type-C连接器,充电配置文件以及需要转向器的超高速度都是您口袋中携带的变化之一。 更大的屏幕,更长的电池寿命,更快的视频游戏和更好的云连接定义了现代超移动嵌入式平...


Arduino 环境中的 FPGA:使用 Alorium 的 Snō 模块支持预配置和定制 IP

当固件在微控制器或微处理器上的运行速度过慢时,现场可编程门阵列 (FPGA) 可解决实时嵌入式设计的硬件问题。同时,FPGA 还具有外设灵活性。然而,要使用 FPGA,设计工程师就需要学习全新的...


通过 Arduino MKR Vidor 4000 快速轻松地应用 FPGA

许多设计人员迟早都会发现,微控制器或微处理器上运行的固件可能会变得太慢。现场可编程门阵列 (FPGA) 为此提供了一种可编程方法,以硬件速度来解决高速、实时、嵌入式设计问题。然而,...


使用Arduino MKR Vidor 4000快速轻松地应用FPGA

正如许多设计人员迟早会发现的那样,在微控制器或微处理器上运行的固件可能会变得太慢。这就是现场可编程门阵列(FPGA)提供可编程方式,以硬件速度解决高速,实时,嵌入式设计问题。...


使用FPGA通过机器学习构建高性能嵌入式视觉应用

本文将介绍ML处理的要求以及FPGA解决许多性能问题的原因。然后,它将介绍一个合适的基于FPGA的ML平台以及如何使用它。...


FPGA配置采用高速NOR闪存

NOR闪存被广泛部署为FPGA的配置器件。工业,通信和汽车ADAS应用中的FPGA使用取决于NOR Flash的低延迟和高数据吞吐量特性。快速启动时间要求的一个很好的例子是汽车环境中的摄像机系统。点火后...


为物联网设计添加高性能语音关键字检测:第 1 部分 - 使用 FPGA

随着Alexa、Hey Siri或Hi Google等多个产品成功响应关键词,关键字检测 (KWS) 已成为越来越多嵌入式应用的一项重要要求。虽然典型的先进 KWS 解决方案依赖于复杂的卷积神经网络 (CNN) 和其他深度神...


使用 FPGA 构建具有机器学习能力的高性能嵌入式视觉应用

随着摄像头和其他设备产生的数据在快速增长,促使人们运用机器学习从汽车、安防和其他应用产生的影像中提取更多有用的信息。专用器件有望在嵌入式视觉应用中实现高性能机器学习 (ML...


利用电容式触摸技术开发智能建筑产品

无可否认,在过去五年中,我们的家庭和办公室越来越多地充斥着智能和互联电子产品。 想想你最近可能接触过的所有智能建筑产品。 也许您使用智能房间控制面板预订办公室的会议室。 然...


QDR SRAM接口FPGA 详细Verilog代码

QDR SRAM介绍 QDR 具有独立的读、写数据通路,均使用DDR,在每个时钟周期内会传输四个总线宽度的数据 (两个读和两个写),这就是QDR四倍数据速率的由来。 这里用到的是典型2字突发的QDR,...


Aldec的边缘计算示例: Zynq SoC 的 FPGA架构将嵌入式视觉/ ADAS性能提升了10倍

Aldec的一个应用工程师 Farhad Fallah 在 New Electronics 网站上发表的一篇题​​为生活在边缘的文章最近引起了我的注意,因为它简洁地描述了为什么 FPGA 对于许多高性能的边缘计算应用如此有用...


恒扬数据携手OpenPOWER多家成员共同推进基于CAPI SNAP框架的FPGA加速应用开发

日前,以“智慧链接新智能 创新加速助中国” 为主题2017年OpenPOWER 中国高峰论坛在京隆重召开,包括IBM、赛灵思、英伟达、浪潮、中太服务器、恒扬数据等在内的联盟成员出席了此次盛会并...


LVDS高速ADC接口, Xilinx FPGA实现

LVDS 即Low-Voltage Differential Signaling。FPGA的selecteIO非常强大,支持各种IO接口标准,电压电流都可以配置。其接口速率可以达到几百M甚至上千M。使用lvds来接收高速ADC产生的数据会很方便。像IS...