随着智能算法的快速发展和智能运用处景的日渐丰富,对智能终真个本地化打算提出了越来越多的需求,紧张表示在以下三个方面:

人工智能科普 | 智能硬件之芯_寒武纪_智能 计算机

第一:智能硬件的低功耗和低延时的需求。

第二:智能利用的隐私性需求。

第三:智能算法的高算力需求。

传统的CPU、GPU和DSP无法知足这些需求,须要专用的AI芯片来应对一些AI的运用。

除了上述三个方面的需求之外,终真个智能处理还有一个新的发展的趋势:多模态识别。

所谓多模态识别是指语音识别、图像处理和自然措辞处理等多种不同的智能处理任务,须要在智能终端上同时运行。

这对智能处理器的通用性和实时性提出了更高的需求。
由于算法发展快,硬件研发周期长,这就须要芯片设计之初,跟算法职员紧密的沟通来剖析算法未来可能的发展趋势,以及和芯片研发职员来协同优化。

寒武纪科技发展进程

寒武纪公司和科大讯飞很早就开始了深入互助,寒武纪公司去年三月刚刚注册成立,科大讯飞是我们天使轮投资人之一,早在14年,我们的深度学习处理器产品设计之初,讯飞就在算法方面给予了我们很多辅导。

虽然寒武纪是一个非常年轻的公司,但是我们作为一个科研团队,在智能硬件和智能算法的领域已经专研了快十年。

08年的时候,我们在中科院打算所成立了一个10人的学术团队,在2013年的时候我们提出了国际上首个深度学习处理器架构DianNao。

2014年揭橥在了ASPLOS上得到了最佳论文奖,这个是亚洲的学术机构有史以来第一次得到体系构造领域里的最佳论文奖,在14年我们又提出了多核处理器深度学习处理器架构,得到了当年的MICRO最佳论文奖。

在15年的时候,我们在之前的学术研究成果的根本上,展开了家当化过程,研制成功了首个深度学习专用的处理器芯片。

寒武纪科技在注册成立的同时,我们发布了深度学习处理器IP产品,即寒武纪1A处理器。

寒武纪1A后来被集成到了华为的麒麟970的处理芯片里面, 为mate10的手机供应了强大的智能处理的能力,而在前不久寒武纪公司也刚刚完成了A的融资。

寒武纪公司的智能处理器产品

接下来我来大略先容一下,寒武纪公司紧张的智能处理器产品。

寒武纪1A处理器是我们去年发布的一款深度打算处理器的产品。
它的峰值分为两种模式,一种是普通的剖析师模式,可以达到512GFlops的半精度浮点的能力,利用了信息化的根本之后,可以加速到等效的2TFlops旁边的峰值。

虽然寒武纪1A是出身于2016年,但是在2017年即将过去的本日,寒武纪1A依然是市场上最完备、最有前瞻性的处理器IP产品。

它可以支持不同的多模态智能处理任务,可以支持从上古时期到最新的各种神经网络模型,各种类型的算子。

寒武纪1A可以达到四核通用CPU 25倍以上的性能和50倍以上的能效,而且靠的不实蛮力堆运算器。

我们的稠密模型峰值只有500GOPS,但是依赖稀疏化技能,四两拨千斤打败了强大的苹果A11处理器。

这是我们的新一代的IP产品:寒武纪1H16,它跟1A比较有三个紧张特点:性能更强;能耗更低;功能更完备。

除了寒武纪1H16处理器之外,我们还出了其余一款针对视觉处理的专用途理器寒武纪1H8。

它的紧张特点是低本钱、低功耗,可以为打算机视觉领域供应本钱合理的AI硬件方案,它的性能功耗比更提升至以前的2.3倍,并供应了4中国不同的运算能力配置供选择。

现在先容一下我们的软件平台的情形,我们的自己开拓了全套的工具链,可以支持TensorFlow、mxnet这样的开放框架,包括未来还会兼容安卓nn接口。

在这框架之下,我们又开拓了像高性能函数库、编辑器、汇编器,用户可以很方便的通过runtime和驱动透过OS去调用寒武纪处理器。

我们软件系统大概包括了三个紧张部分,一个是软件开拓工具包,一个是功能调试工具包,以及性能调优工具包。

末了说一下,我们寒武纪科技秉持着端云一体的发展计策,指令集、软件开拓平台一贯是跨平台运用移植的壁垒,为了让研发职员快速高效地开拓和支配人工智能运用,我们认为端和云该当利用统一的指令集和开拓平台。

这样有什么好处呢?一是运用【迁移】非常方便,乃至不要重新编译就迁移过去了;二是端云可以【协同】起来,做更细粒度、自由度更大的任务切分,整体供应更强大的智能处理能力。

过去海内企业特殊芯片行业的起步较晚,一贯是国外的行业的跟随者,也付出了一些教训,得到了一些履历。

在智能时期大家都在同样的起跑线上,我们希望能够跟海内的公司,特殊像科大讯飞这样的精良的企业,一起来对构建属于我们中国的智能软件生态。

我想只要我们大家共同努力,自底向上共同构建软硬件生态,一定会创造中国智能家当美好的来日诰日。