加速实现收集边缘低功耗人工智能应用_神经收集_人员
自第一台电脑发明以来,寻求最空想系统架构的路途始终充满坎坷。从打算发展史中可以看出,系统架构始终在打算资源阔别用户的集中式架构和处理资源靠近用户的分布式架构之间反复摇摆。曾于20世纪70年代和80年代盛行的基于做事器的方案则采取高度集中化的方法积蓄打算资源和存储能力。但是这一理念很快在低本钱个人电脑和互联网快速发展的80和90年代衰落了。在这种新的架构模式下,打算任务不断向个人电脑倾斜。
环绕个人电脑构建的高度分布式方案彷佛无懈可击,直到以智好手机、平板电脑和条记本电脑为代表的高流动性工具大行其道。四处携带打算硬件和存储资源瞬间成为了一种累赘。系统架构随之缓慢地将任务移到云端,利用其近乎无限的打算和存储资源、高可靠性以及低本钱。
企业也在利用云端减少成本本钱和更高效地管理IT根本举动步伐干系的运维本钱。随着他们采取机器学习和更高等的人工智能技能,云端将扮演着至关主要的角色。即将来临的新一代智能工厂、聪慧城市和智能家居须要云端来高效管理机器视觉系统、折衷交通模式以及最小化功耗。
但并非所有运用都将在云端运行。行业专家提出,另一轮从集中式到分布式的系统架构转变的征兆已经显而易见了。无论到来与否,有一点确信无疑。那便是低延迟哀求、不断加剧的隐私问题和通信带脱期制将驱动网络边缘对智能化的需求。随着设计职员向网络边缘运用加入高等智能,他们须要能够快速相应环境条件变革的系统。例如,当一辆无人驾驶汽车驶入聪慧城市,它不可能讯问云端如何避免冲撞事件,而是必须立即做出反应,自主做出判断。同样,当AI安全摄像头在家中检测到异动,它必须利用设备现有资源做出决定,如有人闯入,则急速报警。
这些新型运用须要基于AI或机器学习的、靠近IoT传感器数据源而非云真个打算办理方案。这样的需求有多大?有人认为潜力非常可不雅观。Gartner的剖析师估计到2022年,多达50%的企业数据将在传统的集中式数据中央或云端以外的地方处理(拜会图1)。
图1. 为避免受延迟、隐私和网络带脱期制而快速兴起的网络边缘打算
网络边缘打算的哀求
设计职员在开拓网络边缘打算办理方案时面临的最严厉的寻衅是要知足高灵巧性、低功耗、小尺寸和低本钱等一系列独特哀求(拜会图2)。
图2. 新一代基于AI的网络边缘打算运用须要知足一系列独特哀求
开拓职员如何构建功耗低、尺寸小、本钱低而又不影响性能的网络边缘办理方案呢?首先,他们须要具备最大化设计灵巧性、支持广泛I/O接口的芯片,还须要能够助其利用快速演进的神经网络架构和算法的半导体办理方案。末了他们还须要能通过自定义量化平衡精度和功耗的办理方案。
考虑到网络边缘设备的尺寸限定,设计职员须要适当的芯片来设计小巧高性能的AI设备,在输出卓越性能的同时又能知足尺寸或散热管理的哀求。本钱也是一个关键要素。任何一种办理方案都必须能与其他批量生产的网络边缘办理方案一较高下。末了,即便是在网络边缘,快速上市的规则依然适用。第一个将办理方案推向市场的企业一定拥有巨大上风。因此,任何有潜力的办理方案必须有机会得到必要的资源实现定制化,并缩短开拓周期——无论是演示示例、参考设计还是设计做事。
网络边缘基于FPGA的机器学习推理
FPGA在网络边缘扮演何种角色?机器学习常日哀求两种类型的打算事情量。演习系统通过现有数据习得新能力。例如,人脸检测功能通过采集和剖析成千上万张图片来学习识别人脸。这种早期演习阶段本色上是高度打算密集的。开拓职员常日会在数据中利用高性能硬件处理数量弘大的数据。
机器学习的第二阶段推理通过识别图案和实行任务将系统能力用于处理新数据。例如,之前谈论的人脸检测功能将在投入现场事情后持续优化其能力,以精确识别人脸。在此阶段系统边运行边学习,随着韶光推移变得愈加智能。鉴于网络边缘的任务实行存在诸多限定,设计职员不可能在云端进行推理。相反他们须通过在网络边缘实行靠近数据源的打算任务来提升系统的智能程度。
那么如何替代云端弘大的打算资源从而在网络边缘实行推理呢?一种办法便是利用FPGA固有的并行处理能力来加速神经网络的性能。设计职员可以利用经由特殊优化的低功耗低密度FPGA知足网络边缘对严苛性能和功耗限定的哀求。莱迪思的ECP5和iCE40 UltraPlus FPGA可知足这一需求。设计职员可通过功耗不敷1W 的ECP5 FPGA和毫瓦级iCE40 UltraPlus FPGA来加速神经网络,构建高效、基于AI的网络边缘打算运用。(拜会图3)
图3. 基于莱迪思FPGA的低功耗(1mW-1W)机器学习推理
Lattice sensAI™ 简介
除了打算硬件外,设计职员还须要各种IP、工具、参考设计和设计专业知识来构建有效的办理方案并将其快速推向市场。
为帮助开拓职员应对这一日益严厉的寻衅,莱迪思现推出基于iCE40 UltraPlus和ECP5 FPGA系列的新型全套开拓生态系统。Lattice sensAI旨在帮助开拓职员快速构建适用于智能家居、聪慧城市、智能工厂、智能汽车和移动运用的AI网络边缘办理方案,为网络边缘供应优化灵巧的推理。
正如下列图4所示,Lattice sensAI通过集成模块化硬件平台、神经网络IP核、软件工具、参考设计和来自互助伙伴生态系统的定制设计做事,简化了灵巧推理解决方案的开拓,经优化具有低功耗(1mW-1W)、封装尺寸小(小至5.5mm²)、批量价格低(约1-10美元)等上风。
图4. Lattice sensAI为开拓职员构建网络边缘打算办理方案供应了坚实的根本
如图4所示,Lattice sensAI以莱迪思的硬件套件为根本。为实现这一功能,莱迪思供应全新的模块化硬件平台,加速机器学习的原型设计,知足广泛的性能和功耗需求。莱迪思还供应基于低功耗iCE40 UltraPlus FPGA的移动开拓平台(MDP),可用于毫瓦级功耗AI设计。MDP重点包括一系列板载传感器,如图像传感器、麦克风、罗盘、压力传感器和陀螺仪等。针对功耗稍高但总体低于1W的运用,莱迪思则供应基于ECP5 FPGA系列的模块化视频接口平台(VIP)。VIP可实现包括MIPI CSI-2、嵌入式DisplayPort(eDP)、HDMI、GigE Vision和USB3在内的广泛接口的互连。屡获殊荣的嵌入式视觉开拓套件是莱迪思首批硬件平台之一。该模块化平台包含了一块CrossLink输入板、一块ECP5处理器板和一块HDMI输出板。随着全新eDP和USB3 GigE I/O板的加入,设计职员可轻易置换输出板以支持其他运用。
除开拓板外,莱迪思还供应新的神经网络加速器IP核,便于开拓职员在FPGA上进行演示。该软IP包括一个针对iCE40 UltraPlus FPGA优化后的二值神经网络(BNN)加速器,可让开发职员利用iCE40 UltraPlus FPGA通过二值神经网络算法实现深度学习运用。莱迪思还供应一个卷积神经网络加速器(CNN)核。该核可灵巧设置参数,适用于莱迪思的ECP5 FPGA,它还支持不同量化,让设计职员实现精度和功耗的平衡。
如图5所示,Lattice sensAI能让用户通过易用的工具流程实现快速设计空间探索和平衡。利用Caffe和TensorFlow等行业标准框架可实现网络演习。然后神经网络编译器工具能将经由演习的网络模型映射成定点数值表示,支持不同的权重和激活量化。此外,神经网络编译器能帮助剖析、仿照和编译不同类型的网络,从而在莱迪思的CNN/BNN加速器IP核上实现,无需RTL设计履历。然后利用Radiant和Diamond等传统的FPGA设计软件工具可实现总体的FPGA设计,包括剩下的预/后处理模块。
图5. 通过易用的Lattice sensAI工具流程实现快速设计空间探索和平衡
为简化常用AI功能的实现,Lattice sensAI包含了各种利用该产品硬件平台、IP核以及软件工具的参考设计和演示示例,例如:
低功耗人脸检测——该演示包含适用于网络边缘、利用神经网络模型的、低功耗快速人脸检测功能。该基于iCE40 UltraPlus FPGA的演示利用了二值权重和激活,能帮助设计职员实现低于1mW功耗的人脸识别。
汽车后装市场摄像头——该演示紧张针对新兴的汽车后装市场中的摄像首领头子域。它展示了设计职员如何通过FPGA本身的并行打算实现速率标志牌检测。在此示例中,在ECP5 FPGA上实现的卷积神经网络被演习读取过往的交通指示牌信息。演习完成后,该摄像头可在经由交通标志时检测并显示速率限定。
将声音指令转换为系统操作——该演示向设计职员展示了如何将声音指令转化为系统操作。这项功耗不敷5mW的关键词识别功能利用了集成到iCE40 UltraPlus FPGA的二值神经网络。示例描述了如何将数字麦克风直连到莱迪思推理引擎,从而利用关键词检测实现“实时在线”的监听功能。
用于面部跟踪的目标检测办理方案——该演示探索了适用于面部跟踪运用、基于AI实现的目标检测办理方案。演示描述了利用莱迪思ECP5-85 FPGA进行卷积神经网路加速,个中8个卷积层在8个神经网络引擎中实现。该方案在莱迪思的嵌入式视觉开拓套件上独立运行,上电后在90 x 90 RGB输入下以14fps运行。ECP5的总功耗仅为0.85 W。
定制化设计做事
开拓团队常日须要设计做事互助伙伴的专业能力来帮忙开拓定制化办理方案。AI市场也不例外。为知足这种需求,莱迪思与智能工厂、聪慧城市、智能汽车、智能家居和移动运用等浩瀚领域的设计做事伙伴展开了互助。例如,莱迪思经认证的互助伙伴之一VectorBlox是一家基于神经网络的推理解决方案开拓商。比来,VectorBlox和莱迪思互助在iCE40 UltraPlus FPGA上用不到5000个LUT的神经网络实现了人脸检测运用。该办理方案利用了开源RISC V软处理器和定制加速器,大大降落了功耗,同时缩短了相应韶光。
为了更快地在莱迪思FPGA中实现推理解决方案,开拓职员可能须要乞助于具备神经网络设计和演习干系知识的设计做事专家。这些知识常日须要与Caffe和TensorFlow框架以及传统的RTL设计履历相结合。为了让这些专业知识更易获取,莱迪思推出了Lattice sensAI设计做事操持,推举设计做事公司,从而加速设计,在莱迪思FPGA上实现深入学习运用。这些公司供应开拓和演习网络的专业知识,且能开拓RTL实现特定运用。
参与该操持的第三方企业已经与莱迪思进行互助,展示了其在神经网络开拓、演习和硬件履行方面的强大实力。
结论
网络边缘打算革命蓄势待发,只有具备AI系统专长的开拓职员方可驾轻就熟。随着用户寻求更高等别的智能,对付靠近IoT数据源的低功耗推理的需求将进步神速。Lattice sensAI供应灵巧、超低功耗、小尺寸和批量价格低的网络边缘优化办理方案。莱迪思的超低功耗FPGA由广泛的硬件平台、软IP、设计工具、参考设计和第三方专家供应支持,为您打开通往成功最可靠、最快捷的路子。
本文系作者个人观点,不代表本站立场,转载请注明出处!