然而,随着物联网家当狂奔式升级,一年一度的全景图谱发布,已远远知足不了高歌年夜进的发展速率和企业诉求。
基于上述事实,《全国物联网家当全景图谱》决定进行重大改版升级:

AI芯片分为GPU、FPGA、ASIC、类脑芯片计算芯片领域企业有哪些_芯片_寒武纪 绘影字幕

(1)一年一度的静态,将浓缩为更短周期的“动态更新”;

(2)大而全的企业收录办法,将嵌入符合家当事实标准的筛选标准,弱水三千,只取优上;

(3)对物联网企业的基本信息收录,将升级为更丰富更深度的信息整合与加工;

(4)对付物联网家当全版块的关注,将升级为侧重关注重点领域、潜力赛道的权重分配。

首次被翻牌的重点版块包括:物联网芯片(打算芯片、通信芯片为主)、授权频谱物联网网络、非授权频谱物联网网络、物联网操作系统、物联网PaaS云平台、公用奇迹、智能安防摄像头、智能家居、聪慧消防、聪慧物流、智能门锁、智能照明等十余个技能种别/垂直领域。

在整条物联网家当链中,芯片无疑是个中最为核心的组成部分,只有拥有了芯片这个大脑,原来愚蠢的“物”才能摇身变为在物联网时期大有作为的智能互联设备。

粗略来分,物联网芯片可以被分为通信芯片和打算芯片两大类。
我们已经对物联网通信芯片领域的玩家进行了汇总。
本文将进一步对打算芯片领域的企业进行汇总整理。

随着图像识别、语音识别、车联网等物联网新运用的发展,传统的CPU架构已经无法知足这些日月牙异的打算需求,于是,AI芯片借着以“华为mate10”为代表的产品开始逐渐走入大众视野。
和须要大量空间去放置存储单元和掌握单元而打算单元很少的CPU比较,AI芯片具有大量的打算单元,非常适宜大规模并行打算的需求。

基于通用性与打算性能的不同,可以把AI芯片分为GPU、FPGA、ASIC、类脑芯片四大类。

AI芯片简介特点GPUGPU最初是用在个人电脑、事情站、游戏机和一些移动设备上运行绘图运算事情的微处理器。
虽然GPU是为了图像处理而生的,但是它在构造上并没有专门为图像做事的部件,只是对CPU的构造进行了优化与调度,以是GPU不仅可以在图像处理领域大显技艺,它还被用来科学打算、密码破解、数值剖析,海量数据处理(排序,Map-Reduce等),金融剖析等须要大规模并行打算的领域。
1.无法单独事情,必须由CPU进行掌握调用才能事情

2.功耗高

FPGAFPGA是算法即电路,软硬合一的芯片。
基于硬件描述措辞,可以把算法逻辑直接编译为晶体管电路组合。
由于FPGA的硬件电路是由算法定制的,其不须要取指令与指令译码过程,因而,FPGA能够充分发挥芯片的打算能力。
1.FPGA可以重复编程,因而具备一定的灵巧性

2.效率高,功耗低

ASIC依产品需求不同而定制化的分外规格集成电路,由特定利用者哀求和特定电子系统的须要而设计、制造,大略来说便是定制化芯片。
近年来呈现的类似TPU、NPU、VPU、BPU等令人眼花缭乱的各种芯片,实质上都属于ASIC。
1.更加符合专业需求

2.从性能、面积、功耗等各方面,AISC都优于GPU和FPGA,但价格昂贵

类脑芯片类脑芯片架构便是仿照人脑的神经突触通报构造。
浩瀚的处理器类似于神经元,通讯系统类似于神经纤维,每个神经元的打算都是在本地进行的,从整体上看神经元们分布式进行事情的,也便是说整体任务进行了分工,每个神经元只卖力一部分打算。
在处理海量数据上这种办法上风明显,并且功耗比传统芯片更低。
在功耗上有绝对上风,但商用过程缓慢

GPU

【英伟达(NVIDIA)】

公司:NVIDIA

总部:美国

网址:https://www.nvidia.com/zh-cn/

芯片:NVIDIAVolta系列、NVIDIAQuadroRTX系列等

简介:NVIDIA公司是环球可编程图形处理技能领袖,专注于打造能够增强个人和专业打算平台的人机交互体验的产品。
公司的图形和通信处理器拥有广泛的市场,已被多种多样的打算平台采取,包括个人数字媒体PC、商用PC、专业事情站、数字内容创建系统、条记本电脑、军用导航系统和***游戏掌握台等。
1999年,NVIDIA发明了GPU,这极大地推动了PC游戏市场的发展,重新定义了当代打算机图形技能,并彻底改变了并行打算。
人工智能的观点大热后,大家开始广泛利用GPU做深度学习,这使得英伟达的股价从2015年至今飙升了足足10倍。

芯片型号:NVIDIAVoltaGV100

芯片架构:Volta

韶光节点:于2017年5月年度GTC技能大会上正式发布。

产品先容:采取台积电专门为NVIDIA定制的12nmFFN新工艺(N代表NVIDIA),集成多达211亿个晶体管,核心面积达到了胆怯的815平方毫米,比较于GP100分别增加了38%、34%。
其内部拥有5376个32位浮点核心、2688个64位浮点核心(还是2:1),划分为84组SM阵列、42组TPC阵列、7组GPC阵列,同时搭配336个纹理单元,都比GP100增加了40%,同时还首次加入了672个TensorCore。
TensorCore是一种新的核心,专门为深度打算操作加入的,更加刚性,不那么弹性,但是依然可以编程。

芯片型号:NVIDIAQuadroRTX8000/6000/5000系列

芯片架构:图灵(Turing)

韶光节点:2018年8月,在温哥华举行的SIGGRAPH2018专业打算机图形学顶级会议上正式发布。

产品先容:NVIDIAQuadroRTX8000/6000/5000系列是基于NVIDIA全新的第八代GPU架构图灵(Turing)的“环球首款光芒追踪GPU”,其打破性技能包括:

全新RTCore可实现工具和环境的实时光芒追踪,并做到物理上精确的阴影、反射和折射以及全局光照

TuringTensorCore可加速深度神经网络演习和推理,这对付赋力AI增强型产品和做事至关主要。

全新TuringStreamingMultiprocessor架构拥有多达4608个CUDAcore,可供应高达16teraflops的打算性能,并走运算每秒16万亿次整数运算,以加速仿照真实天下的物理仿照。

前辈的可编程着色技能可提高繁芜视效和图形密集型事情体验。

首次采取超快速的三星16GbGDDR6内存,支持更繁芜的设计、海量建筑数据集、8K电影内容等。

NVIDIANVLink可通过高速链路联通两个GPU,将内存容量扩展至96GB,并可通过高达100GB/s的数据传输供应更高性能。

供应对USBType-C和VirtualLink的硬件支持。
VirtualLink是一种新的开放式行业标准,旨在通过单一USB-C连接器知足下一代VR头显的功率、显示和带宽需求。

全新增强型技能可提高VR运用性能,这些技能包括可变速率着色(VariableRateShading)、多视角渲染(Multi-ViewRendering)和VRWorksAudio。

【AMD】

公司:美国超威半导体公司(AdvancedMicroDevices)

总部:美国

网址:https://www.amd.com/zh-hans

芯片:AMDNavi系列

简介:美国AMD半导体公司成立于1969年,专门为打算机、通信和消费电子行业设计和制造各种创新的微处理器(CPU、GPU、APU、主板芯片组、电视卡芯片等),以及供应闪存和低功率处理器办理方案。
人工智能时期,NVIDIA和Intel两大巨子在冒死争夺市场,AMD则显得有些太过低调。
但基于GPU的通用打算在AI领域的巨大上风,AMD也并不是全无机会。

据悉,AMD估量将于2018年推出新一代显卡架构:Navi仙后座,本次的仙后座将会采取7nm工艺,估量是GF的第一代,DUV(深紫外)技能。
同时还汇合成人工智能专用芯片以提升仙后座在机器学习性能。
其余,2017年9月还有称,特斯拉将与AMD联手打造自动驾驶芯片,目前芯片进展顺利,特斯拉已经收到了第一批样品,正在进行干系测试事情。

芯片型号:AMDNavi系列

芯片架构:AMDNavi仙后座

韶光节点:估量2018年第四季度发布

产品先容:确定将会采取7nm工艺,GFX10架构,AMD还将在Navi显卡上集成与AI(人工智能)干系的电气化元件以强化自动学习的性能。

FPGA

【Xilinx(赛灵思)】

公司:Xilinx(赛灵思)

总部:美国

网址:https://china.xilinx.com/

芯片:珠穆朗玛峰(Everest)

简介:赛灵思是FPGA、可编程SoC及ACAP的发明者,Xilinx研发、制造并发卖范围广泛的高等集成电路、软件设计工具以及作为预定义系统级功能的IP核。
客户利用Xilinx及其互助伙伴的自动化软件工具和IP核对器件进行编程,从而完成特定的逻辑操作。
赛灵思创始了现场可编程逻辑阵列(FPGA)这一创新性的技能,并于1985岁首年月次推出商业化产品,眼下Xilinx知足了全天下对FPGA产品一半以上的需求。

2018年7月18日,赛灵思宣告收购中国AI芯片领域的明星创业公司——深鉴科技。
有“中国英伟达”之称的AI芯片初创企业将连续在其北京办公室运营。
目前,交易金额及细节尚未公布。

芯片型号:珠穆朗玛峰(Everest)

芯片架构:ACAP

韶光节点:估量将于2018年内实现流片,2019年向客户交付发货。

产品先容:2018年3月,赛灵思宣告推出全新一代AI芯片架构ACAP,并将基于这套架构推出一系列芯片新品;个中首款代号为“珠穆朗玛峰(Everest)”的AI芯片新品将采取台积电7nm工艺打造,今年内实现流片,2019年向客户交付发货。
ACAP因此新一代的FPGA架构位核心,基于ARM架构,结合分布式存储器与硬件可编程的DSP模块、一个多核SoC以及一个或多个软件可编程且同时又具备硬件灵巧应变性的打算引擎,并全部通过片上网络(NoC)实现互连。
大略地来讲,ACAP是基于赛灵思的传统上风FPGA芯片,又通过架构、制程等一揽子升级打造的打算引擎,目标是达到在针对性领域远超传统GPU、CPU的打算性能。

【深鉴科技】

公司:北京深鉴科技有限公司

总部:北京

网址:http://www.deephi.com/

芯片:“听涛”、“不雅观海”

简介:深鉴科技成立于2016年,致力于成为国际前辈的深度学习加速方案供应者。
公司供应基于原创的神经网络深度压缩技能和DPU平台,为深度学习供应端到真个办理方案。
通过神经网络与FPGA的协同优化,深鉴供应的嵌入式端与云真个推理平台更加高效、便捷、经济,现已运用于安防与数据中央等领域。

深鉴科技由清华团队创办,自成立以来,深鉴科技已经得到了天使到A+轮的3轮融资,累计融资金额超1亿美金,投资方包括金沙江创投、高榕成本、Xilinx、联发科、清华控股、蚂蚁金服、三星风投等。
2018年7月18日,赛灵思宣告收购深鉴科技。

如今,深鉴科技已发展为一家具备神经网络压缩编译工具链、深度学习处理器DPU设计、FPGA开拓与系统优化等技能能力的初创公司。
个中,最为核心的,即为DPU(DeepLearningProcessingUnit),以及神经网络压缩编译技能,它不仅可以将神经网络压缩数十倍而不影响准确度,还可以利用“片上存储”来存储深度学习算法模型,减少内存读取,大幅度减少功耗。
目前,深鉴科技的产品紧张运用于安防监控与数据中央两大领域。

芯片型号:“听涛”、“不雅观海”

芯片架构:亚里士多德

韶光节点:估量2018年下半年发布

产品先容:“听涛”系列芯片,采取台积电28纳米制程,核心利用深鉴自己的亚里士多德架构,峰值性能1.1瓦4.1TOPS

【百度】

公司:百度

总部:北京

网址:https://home.baidu.com/

芯片:XPU

简介:百度在2017年8月HotChips大会上发布了XPU,这是一款256核、基于FPGA的云打算加速芯片。
互助伙伴是赛思灵(Xilinx)。
XPU采取新一代AI处理架构,拥有GPU的通用性和FPGA的高效率和低能耗,对百度的深度学习平台PaddlePaddle做了高度的优化和加速。
据先容,XPU关注打算密集型、基于规则的多样化打算任务,希望提高效率和性能,并带来类似CPU的灵巧性。
但目前XPU有所欠缺的仍是可编程能力,而这也是涉及FPGA时普遍存在的问题。
到目前为止,XPU尚未供应编译器。

【英特尔(Altera)】

公司:英特尔(Altera)

总部:美国

网址:https://www.intel.cn/content/www/cn/zh/products/programmable.html

简介:Altera公司(阿尔特拉)是天下上“可编程芯片系统”(SOPC)办理方案倡导者。
Altera结合带有软件工具的可编程逻辑技能、知识产权(IP)和技能做事,在世界范围内为14000多个客户供应高质量的可编程办理方案。

2015年12月英特尔斥资167亿美元收购了Altera公司,后来随着收购完成,英特尔也在Altera的根本上成立了可编程奇迹部。
此后,英特尔一贯在推进FPGA与自家至强处理器的软硬件结合并取得了相应的进展

产品先容:英特尔采取左右开弓的FPGA计策:一方面打造CPU-FPGA稠浊器件,让FPGA与处理器协同事情;另一方面基于ArriaFPGA或StratixFPGA打造可编程加速卡(PAC/programmableaccelerationcard)。

基于FPGA技能,英特尔已经构建了一个完善的NFV生态,覆盖软硬件厂商、系统集成商、电信运营商、OTT厂商等干系企业。
此外,英特尔还为OME厂商供应一个面向包含FPGA的英特尔至强可扩展处理器的英特尔加速堆栈,进而为客户供应完全的软硬件一体的FPGA办理方案。

英特尔在7月收购芯片公司eASIC后将其并入PSG部门,并随后透露这一收购案紧张是为了知足办理客户痛点,知足FPGA客户真个降落本钱和能耗需求,并供应可降落16nm、10nm、7nm制程的FPGA产品本钱的规模化技能。

目前加速卡还是FPGA进入硬件领域的紧张形态之一,不过英特尔已经在进行其他方向、其他形态的探索,并在积极推进和其他数据中央OEM厂商在FPGA方面的互助。

【LatTIce】

公司:莱迪思(Lattice)半导体公司

总部:美国

网址:http://www.latticesemi.com/

简介:Lattice(莱迪思半导体公司)创建于1983年,总部位于美国俄勒冈州波特兰市(Portland,Oregon),,是环球智能互连办理方案市场的领导者,也是环球第二大FPGA厂,供应市场领先的IP和低功耗、小尺寸的器件,在2015年3月收购多媒体连接供应商----矽映电子(SiliconImage)。
SiliconImage不仅在通讯介面有雄厚的根本,同时推动了HDMI、DVI、MHL和WirelessHD等行业标准的制订。

【Microsemi】

公司:MicrosemiCorporation

总部:美国

网址:https://www.microsemi.com/

芯片:PolarFireFPGA

简介:MicrosemiCorporation总部设于加利福尼亚州尔湾市,是一家领先的高性能仿照和稠浊旗子暗记集成电路及高可靠性半导体设计商、制造商和营销商。
Microsemi的产品包括独立元器件和集成电路办理方案等,可通过改进性能和可靠性、优化电池、减小尺寸和保护电路而增强客户的设计能力。
Microsemi公司所做事的紧张市场包括植入式医疗机构、防御/航空和卫星、条记本电脑、监视器和液晶电视、汽车和移动通信等运用领域。

产品先容:2017年2月,Microsemi在京召开***发布会,宣告推出PolarFireFPGA,定位低功耗、中等密度产品。

PolarFire有四大上风:1.低功耗,比竞争对手低50%功耗;2.本钱优化;3.可靠性与安全性上风;4.逻辑范围扩展至1K-500KLE,因此和竞争对手一样,可覆盖从低密度的CPLD到中密度的FPGA。

ASIC

【寒武纪】

公司:北京中科寒武纪科技有限公司

总部:北京

网址:http://www.cambricon.com/

芯片:寒武纪1H8、寒武纪1H16、寒武纪1M、MLU100

简介:“寒武纪”成立于2016年,是北京中科寒武纪科技有限公司的简称,由中科院打算所孵化,于2017年8月得到了国投、阿里巴巴、遐想等共计1亿美元融资,成为估值近10亿美元的智能芯片领域独角兽公司。
寒武纪紧张面向深度学习等人工智能关键技能进行专用芯片的研发,可用于云做事器和智能终端上的图像识别、语音识别、人脸识别等运用。

公司未来的愿景是让人工智能芯片打算效率提高一万倍,功耗降落一万倍。
为了实现这一目标,寒武纪AI芯片能在打算机中仿照神经元和突触的打算,对信息进行智能处理,还通过设计专门存储构造和指令集,每秒可以处理160亿个神经元和超过2万亿个突触,功耗却只有原来的十分之一。
未来乃至有希望把类似AlphaGo的系统都装进手机,让手机帮助我们做各种各样的事情,乃至通过长期的不雅观察和学习,真正实现强大的智能。

2016,寒武纪发布了天下上第一个商用深学习处理器IP,即寒武纪1A处理器。
2017年,寒武纪授权华为海思利用寒武纪1A处理器,搭载于麒麟970芯片和Mate10系列手机中。

2017年11月,寒武纪在北京发布了三款新一代人工智能芯片,分别为面向低功耗场景视觉运用的寒武纪1H8,高性能且拥有广泛通用性的寒武纪1H16,以及用于终端人工智能和智能驾驶领域的寒武纪1M。

2018年5月3日,寒武纪科技在上海举办了2018产品发布会。
会上,寒武纪正式发布了采取7nm工艺的终端芯片Cambricon1M和首款云端智能芯片MLU100。

芯片型号:寒武纪1M

韶光节点:2018年5月8日正式发布

产品先容:1M利用TSMC7nm工艺生产,其8位运算效能比达5Tops/watt(每瓦5万亿次运算)。
寒武纪供应了三种尺寸的处理器内核(2Tops/4Tops/8Tops)以知足不同场景下不同量级智能处理的需求,寒武纪称,用户还可以通过多核互联进一步提高处理效能。

寒武纪1M处理器延续了前两代IP产品(1H/1A)的完备性,可支持CNN、RNN、SOM等多种深度学习模型,这次又进一步支持了SVM、k-NN、k-Means、决策树等经典机器学习算法的加速。
这款芯片支持帮助终端设备进行本地演习,可为视觉、语音、自然措辞处理等任务供应高效打算平台。
据悉,该产品可运用于智好手机、智能音箱、摄像头、自动驾驶平分歧领域。

芯片型号:MLU100云端芯片

芯片架构:MLUv01架构

韶光节点:2018年5月8日正式发布

产品先容:MLU100采取寒武纪最新的MLUv01架构和TSMC16nm工艺,可事情在平衡模式(主频1Ghz)和高性能模式(1.3GHz)主频下,等效理论峰值速率则分别可以达到128万亿次定点运算/166.4万亿次定点运算,而其功耗为80w/110w。
与寒武纪系列的终端处理器相同,MLU100云端芯片具有很高的通用性,可支持各种深度学习和常用机器学习算法。
可知足打算机视觉、语音、自然措辞处理和数据挖掘等多种云处理任务。
搭载这款芯片的板卡利用了PCIe接口。

【华为】

公司:海思半导体

总部:深圳

网址:http://www.hisilicon.com/

芯片:麒麟970、麒麟980

芯片型号:麒麟970

韶光节点:2017年9月2日在柏林消费电子展上正式对外发布

产品先容:华为麒麟970是华为于2017年9月2日在柏林消费电子展上正式对外发布的新款内置人工智能(AI)芯片。
这款芯片将被用于华为下一代智好手机,紧张用于反抗对手苹果和三星电子公司。
该芯片采取了行业高标准的TSMC10nm工艺,集成了55亿个晶体管,功耗降落了20%,并实现了1.2Gbps峰值***速率。
创新性集成NPU专用硬件处理单元,创新设计了HiAI移动打算架构,其AI性能密度大幅优于CPU和GPU。
相较于四个Cortex-A73核心,处理相同AI任务,新的异构打算架构拥有约50倍能效和25倍性能上风,图像识别速率可达到约2000张/分钟。
高性能8核CPU,比拟上一代能效提高20%。
率先商用MaliG7212-CoreGPU,与上一代比较,图形处理性能提升20%,能效提升50%,可以更永劫光支持3D大型游戏的流畅运行。

芯片型号:麒麟980

韶光节点:2018年8月31日在柏林消费电子展上正式对外发布

产品先容:麒麟980一上来就达成了六项环球首发记录:

环球首款7nmSoC

环球首发ARMCortex-A76CPU核心

环球首发双核NPU

环球首发Mali-G76GPU

环球首发1.4GbpsLTECat.21基带

环球首发支持2133MHzLPDDR4X运行内存

首先,麒麟980采取7nm工艺,集成了69亿个晶体管。
据TSMC的官方统计,比较上一代旗舰——10nm工艺制程的麒麟970,980性能提升约20%,能效提升约40%,逻辑电路密度提升60%,即原来的1.6倍。

至于芯片架构,麒麟980首次搭载寒武纪1A的优化版,采取双核构造,其图像识别速率比970提升120%。

而在通用芯片CPU上,980基于ARMCortex-A76CPU架构进行开拓,性能比970提升75%,能效同步提升58%,比骁龙845性能领先37%,能耗降落32%。
这套全新设计的CPU架构麒麟CPU子系统,由2个超大核、2个大核和4个小核的三档能效架构组成。

在GPU上,980成为首款搭载最新的Mali-G76GPU架构的移动端芯片。
和970比较,其GPU性能提升46%,能效提升178%。
最直接的感想熏染,便是在玩大型游戏时,不易卡顿。
游戏性能的提升,也回应了用户一贯以来对其GPU性能的担忧。

【地平线】

公司:地平线机器人

总部:北京

网址:http://www.horizon.ai/

芯片:征程(Journey)、朝阳(Sunrise)

简介:地平线机器人(HorizonRobotics)由前百度深度学习研究院卖力人余凯创办,致力于打造基于深度神经网络的人工智能“大脑”平台。
2017年10月,这家公司拿到了英特尔、嘉实投资、高翎成本、红杉成本等近亿美元的A+轮投资。

地平线基于自主研发的人工智能芯片和算法软件,以智能驾驶,聪慧城市和聪慧零售为紧张运用处景,供应给客户开放的软硬件平台和运用办理方案。
为多种终端设备装上人工智能“大脑”,让它们具有从感知、交互、理解到决策的智能。
地平线具有天下领先的深度学习和决策推理算法开拓能力,将算法集成在高性能、低功耗、低本钱的嵌入式人工智能处理器及软硬件平台上。
基于创新的人工智能专用途理器架构BPU(BrainProcessingUnit),地平线自主设计研发了中国首款环球领先的嵌入式人工智能视觉芯片——面向智能驾驶的征程(Journey)系列处理器和面向智能摄像头的朝阳(Sunrise)系列处理器,并向行业客户供应“芯片+算法+云”的完全办理方案。

芯片型号:征程(Journey)系列

芯片架构:高斯架构

韶光节点:2017年12月20日正式发布自动驾驶处理器征程1.0架构;2018北京国际车展期间,地平线发布新一代自动驾驶处理器征程2.0架构,并公布了基于2.0处理器架构的L3级以上自动驾驶打算平台Matrix1.0。

产品先容:征程1.0是面向ADAS的处理器(BPU1.0,高斯架构),征程2.0则是面向L3及以上自动驾驶的处理器(BPU2.0,伯努利架构)。
据先容,内置征程2.0的自动驾驶打算平台Matrix1.0结合深度学习技能,支持多传感器领悟,可每秒处理720P***30帧,实时处理4路***,实现20种不同类型物体的像素级语义分割,功耗为31W,已经达到运用和产品化水平。

芯片型号:朝阳(Sunrise)系列

芯片架构:高斯架构

韶光节点:2017年12月20日正式发布

产品先容:朝阳1.0是一款面向摄像头的AI视觉芯片,它基于高斯架构,并凑集了地平线的深度学习算法,因而能够在前端实现大规模人脸检测跟踪、***构造化等运用,可广泛运用于聪慧城市、智能商业等场景。

【异构智能】

公司:北京异构智能科技有限公司

总部:北京

网址:https://www.novumind.com/

芯片:NovuTensor

简介:NovuMind(异构智能)是由百度古人工智能精彩科学家吴韧博士带领一批环球顶尖的AI技能人才于2015年8月在美国加州硅谷成立的AI公司,紧张为汽车、安防、医疗、金融等领域供应ASIC芯片,并供应芯片+模型+演习的全栈式AI办理方案。
2016年12月,NovuMind得到洪泰基金、宽带成本、真格基金、英诺天使和臻迪科技等1500多万美元的A轮融资,据悉该团队正在进行B轮融资。
目前团队共有50余人,包括在美国的35名以及北京的15名顶尖技能工程师。

相较于英伟达的GPU或Cadence的DSP等通用的深度学习芯片设计,NovuMind专注于开拓更有效进行推理(interference)的深度学习加速器芯片。
NovuMindAI芯片的重点在于,不仅让一个小型确当地“终端”设备具有“看”的能力,而且还具备“思考”以及“识别”的能力,其余,这些都不须要通过数据中央的支持,不占用任何带宽,吴博士将之称为智能物联网(I²oT,IntelligentInternetofThings)。

芯片型号:NovuTensor

韶光节点:2018年CES正式发布

产品先容:NovuMind方面表示其最新推出的高性能、低功耗的AI芯片NovuTensor是截至目前天下上唯一一款能够实际运行的、性能达到主流GPU/TPU水平而性能/功耗比却远超主流GPU/TPU的芯片——在功耗12w的情形下,NovuTensor每秒可识别300张图像,每张图像上,最多可检测8192个目标,比较目前最前辈的桌面做事器GPU(250W,每秒可识别666张图像),仅利用1/20电力即可达到其性能的1/2;而比较目前最前辈的移动端或嵌入式芯片,相同用电的情形下,性能是其三倍以上。

据理解,本次CES展示的仅仅是FPGA版本,等正在流片的ASIC芯片正式出厂,性能将提高4倍,耗电将减少一半,耗能不超过5瓦、可进行15万亿次运算的超高性能。

【谷歌】

公司:谷歌

总部:美国

网址:http://www.google.cn/intl/zh-CN/about/

芯片:TPU

简介:谷歌在2016年的I/O大会上推出了专门为加速深层神经网络运算能力而研发的一款AI芯片——张量处理器TPU(第一代)。
谷歌表示,只管在一些运用上利用率很低,初代TPU均匀比那时候的GPU或CPU快15-30倍,性能功耗比(TOPS/Watt)赶过约30-80倍。

图:TPU芯片布局图

2017年5月I/O大会上,谷歌发布了第二代TPU,峰值性能达到180TFLOPS/s。
第一代TPU只加速推理,但第二代TPU新增了演习的功能。
不仅如此,谷歌的用户还能通过专门的网络,在云端利用TPU构建机器学习的超级打算机。

在第二代TPU里,每个TPU都包含了一个定制的高速网络,构成了一个谷歌称之为“TPU舱室”(TPUPOD)的机器学习超级打算机。
一个TPU舱室包含64个第二代TPU,最高可供应多达11.5千万亿次浮点运算,内存400万兆字节,4倍快于当时市情上最好的32台GPU。

CloudTPU带来的最大好处,则是谷歌的开源机器学习框架TensorFlow。
TensorFlow现在已经是Github最受欢迎的深度学习开源项目,CloudTPU涌现往后,开拓职员和研究者利用高等API编程这些TPU,这样就可以更轻松地在CPU、GPU或CloudTPU上演习机器学习模型,而且只需很少的代码变动。

【英特尔(Movidius)】

公司:英特尔(Movidius)

总部:美国

网址:https://www.movidius.com/

简介:Movidius是一家专注于打算机视觉的创业公司,也是谷歌ProjectTango3D传感器技能背后的元勋。
2016年9月,英特尔宣告将收购Movidius。

2017年8月,英特尔发布了下一代Movidius视觉处理芯片,该芯片可提高尖端设备的处理能力,比如无人机、VR头盔、智能摄像头、可穿着设备和机器人。
其上最新的视觉处理单元(VisionProcessingUnit,简称VPU)采取的是MyriadX系统级芯片,它配备了一个专用的神经打算引擎,支持边缘深度学习推断。
芯片上的硬件块是专门针对深层神经网络而设计的,它以高速和低功耗来运行深层神经网络。
英特尔说,深度神经网络加速器可以在DNN推断时实现每秒1万亿次运算。

【中星微】

公司:中星微电子有限公司

总部:北京

网址:http://www.vimicro.com/english/

芯片:NPU

简介:2016年6月20日,中星微率先推出中国首款嵌入式神经网络处理器(NPU)芯片,这是环球首颗具备深度学习人工智能的嵌入式***采集压缩编码系统级芯片,取名“星光智能一号”。
这款基于深度学习的芯片利用在人脸识别上,最高能达到98%的准确率,超过人眼的识别率。
该NPU采取了“数据驱动”并行打算的架构,单颗NPU(28nm)能耗仅为400mW,极大地提升了打算能力与功耗的比例。

目前“星光智能一号”出货量紧张集中在安防摄像领域,个中包含授权给其他安防摄像厂商部分。
未来将紧张向车载摄像头、无人机航拍、机器人和工业摄像机方面进行推广和运用。

【云知声】

公司:北京云知声信息技能有限公司

总部:北京

网址:http://dev.hivoice.cn/

芯片:雨燕(Swift)

简介:云知声是一家智能语音识别技能公司,成立于2012年,总部位于北京。

2018年5月16日,云知声在北京正式发布环球首款面向物联网领域的AI芯片“雨燕”(Swift)。
作为云知声UniOne系列的第一代物联网AI芯片,“雨燕”完备由云知声自主设计研发,采取云知声自主AI指令集,拥有具备自主知识产权的DeepNet、uDSP(数字旗子暗记处理器),支持DNN/LSTM/CNN等多种深度神经网络模型。

除了供应芯片和终端引擎,云知声还将运用部分向客户开源,同时供应相应定制化工具以及云端AI能力做事。
通过云端芯结合,“雨燕”将运用于智能家居、智能音箱、智能车载等各个详细场景中。

类脑芯片

【IBM】

公司:IBM

总部:美国

网址:https://www.ibm.com

芯片:TureNorth

简介:DARPA与IBM互助建立了一个项目,名为“神经形态自适应伸缩可塑电子系统操持(SyNAPSE)”。
该操持意图还原大脑的打算功能,从而制造出一种能够仿照人类的觉得,理解,行动与互换的能力的系统,用场非常明确:赞助士兵在沙场动态繁芜环境中的认知能力,用于无人武器的自动作战。

该项目中最引人瞩目的是类脑芯片TureNorth。
2011年,IBM发布第一代TrueNorth芯片,它可以像大脑一样具有学习和信息处理能力,具有大规模并行打算能力。
2014年,IBM发布第二代TrueNorth芯片,性能大幅提升,功耗却只有70毫瓦,神经元数量由256个增加到100万个,可编程突触由262144个增加到2.56亿个。
高通也发布了Zeroth认知打算平台,它可以融入到高通Snapdragon处理器芯片中,以协处理办法提升系统认知打算性能,实际运用于终端设备上。

【西井科技】

公司:西井科技

网址:暂无

芯片:DeepSouth(深南)、DeepWell(深井)

简介:西井科技是一家开拓“类脑人工智能芯片+算法”的科技公司,其芯片用电路仿照神经,成品有100亿规模的仿真神经元。
由于架构分外,这些芯片打算能力强,可用于基因测序、仿照大脑放电等医疗领域。
在团队方面,西井科技有50名员工,个中40人是英国帝国理工、牛津、加州大学伯克利分校等干系专业的博士、硕士。
据悉,西井科技曾于2015年6月、2016年1月分别得到天使轮和pre-A轮融资。

西井科技是用FPGA仿照神经元以实现SNN的事情办法,有两款产品:

仿生类脑神经元芯片DeepSouth(深南),第三代脉冲神经网络芯片SNN,基于STDP(spike-time-dependentplasticity)的算法构建完全的突触神经网络,由电路仿照真实生物神经元产生脉冲的仿生学芯片,通过动态分配的方法能仿照出高达5000万级别的“神经元”,功耗为传统芯片在同一任务下的几十分之一到几百分之一。

深度学习类脑神经元芯片DeepWell(深井),处理模式识别问题的通用智能芯片,基于在线伪逆矩阵求解算法(OPIUMlite)对芯片中神经元间的连接权重进行学习和调度;拥12800万个神经元,通过专属指令集调度芯片中神经元资源的分配;学习与识别速率远远高于运行在通用硬件(如CPU,GPU)上的传统方法(如CNN),且功耗更低。

【高通】

公司:美国高通公司

总部:美国

网址:http://www.qualcomm.cn/

芯片型号:Zeroth

简介:芯片巨子高通也在进行类脑芯片的研发,早在2013年高通就曾公布一款名为Zeroth的芯片,Zeroth不须要通过大量代码对行为和结果进行预编程,而是通过类似于神经传导物质多巴胺的学习(别号“正强化”)完成的。
高通为了让搭载该芯片的设备能随时自我学习,并从周围环境中得到反馈,还为此开拓了一套软件工具。
在公布的资料中高通还用装载该芯片的机器小车进行了演示,使小车在受人脑启示的算法下完成寻路、躲避障碍等任务。