《电子技术应用》

国内人工智能芯片三面大旗,有何异同

2018/3/23 23:19:35

人工智能是什么?

它是技术还是应用,我们怎么样才能实现科幻电影中营造的人工智能世界?

当梦想照进现实,一步步的从理论成为实际,这中间有太多的路要走,每个人,每个企业对于同一技术的思考都不尽相同。

但是,所谓大道至简,条条大路通罗马,殊途同归,说的都是一个道理。

微信图片_20180323232355.jpg

人工智能半导体,从软到硬

人工智能,作为一项应用,正在重复过去数十年个人计算机走过的老路。

从硬件,软件,再到硬件的发展,就像天平的两端,需要在两者之间找到最佳的平衡点,才能够实现技术和应用的落地。

在苹果,谷歌,微软在软件基础之上打磨人工智能功能之后,这些企业也意识到了硬件的重要性,谷歌甚至专门为人工智能开发了其特有的专用芯片TPU,这也说明,人工智能芯片对于整个产业来说,正在变得至关重要。

在美国是这样,在韩国也是如此。

根据美国知识产权局表示,2017 年 AI 半导体专利达 391 件,对比 2013 年的 32 件,近 4 年成长超过 10 倍,且速度逐年加快,2014 年有 59 件、2015 年成长三成至 77 件,2016 年更是倍增至 167 件。

而在中国,在人工智能的浪潮中,有这样一群人,他们毕业于国内外的顶级高效,对人工智能有着深刻的认识,大多数曾供职于国内外的顶级研究室,或在高校任职,现在,都投身于人工智能的浪潮从,以各自对于人工智能硬件的认知,推动人工智能半导体方面的发展。

其中,尤以地平线机器人,深鉴科技和寒武纪这三家企业被业内提到的次数最多,也最为人津津乐道。

那么这三家企业在实现人工智能的大道上,到底有什么区别呢?

在3月15日举行的AI半导体技术论坛上,这样一个以打假著称的日子里,我们看一看这三家企业有何不同吧。

以下叙述,没有排名,仅以演讲顺序为主。


地平线机器人:嵌入式人工智能

一家企业能否成功主要取决于几个方面,能否把握市场趋势,能否推出具有优势的产品,能否不随波逐流,有自己的思路。

按照地平线机器人芯片规划部部长谭洪贺的话来说,成立于2015年的地平线,从成立之初就对人工智能芯片的设计有着自己独特的想法。

适用于IT领域的安迪比尔定理: “Andy gives, Bill takes away.(安迪提供什么,比尔拿走什么。)” ,在地平线看来也适用于人工智能芯片市场。

摩尔定理给所有的计算机消费者带来一个希望,如果我今天嫌计算机太贵买不起,那么我等十八个月就可以用一半的价钱来买。要真是这样简单的话,计算机的销售量就上不去了。需要买计算机的人会多等几个月,已经有计算机的人也没有动力更新计算机。

这一定理说明了硬件和算法之间的问题,也确定了地平线在人工智能芯片上的发展方向。

由于有了足够的硬件资源,工程师做事情更讲究自己的工作效率,程序的规范化和可读性等等。另外,由于人工成本的提高,为了节省工程师的时间,算法更迭会越来越快,同时效率却越来越低。今天的比昨天的占用硬件资源多是一件在所难免的事。

这就像“缸”与“水”的关系一样,芯片是外在的缸,算法是水,想要实现更多的人工智能的功能,就需要更多,更多功能的算法,也就要求必须要有足够大的缸来装下这些算法,缸比水大,顶多算是资源过剩,水比缸大,在芯片上可就不单是简简单单的溢出问题了。

因此,谭洪贺表示,地平线在设计芯片的时候,都是将算法和芯片作为一个整体来考虑,协同进行设计。

微信图片_20180323232418.jpg

这一想法的结果就是,2017年12月20号,地平线在北京举办了一场名为“AI芯时代”的产品发布会。

地平线带来了全新的嵌入式人工智能视觉处理器:面向智能驾驶的征程(Journey)1.0处理器和面向智能摄像头的旭日(Sunrise)1.0处理器。

按照地平线创始人&CEO余凯的话来说,这是完全由地平线自主研发的人工智能芯片,采用地平线的第一代BPU架构,具有全球领先的性能:可实时处理  1080p30视频,每帧中可同时对200个目标进行检测、跟踪、识别,典型功耗1.5W,每帧延时小于30ms。

据公开资料显示,余凯是前百度IDL副院长,百度无人驾驶项目发起人之一。这个名字体现了地平线公司对超越边界的执着。公司从创立伊始就以打造中国的Neural Processing Unit (NPU)为目标。希望通过研发高性能、低功耗、低成本的处理器和算法软件,解决终端设备在本地的算法和计算问题,成为嵌入式人工智能的领导者。为了实现这个目标,他们自主研发了一种创新的嵌入式人工智能处理器架构IP——Brain Processing Unit,也就是我们所说的BPU。

“从本质上来说,地平线既不单纯是一家算法公司或者是一家芯片公司。作为一家嵌入式人工智能解决方案公司,地平线的目标是要做全球的嵌入式人工智能的领导者。做AI的大脑,提供高性能,高能效,全站式的解决方案。”

芯片结构的不停迭代告诉我们,CPU属于标量处理器,GPU是向量处理器,从谷歌的TPU和地平线的BPU开始,已经演变成张量的处理器,因此所有的模块都属于张量处理的模块。要求在存储和数据处理的过程中,注意尺度的问题。对于张量处理器来说,无论是二维还是三维,都需要确定主攻的方向。

地平线对于人工智能的看法分为三个步骤,第一,是做能够感知的AI,也就是能够感知周围的世界。第二步建模,以实现对周围环境进行3D建模或者是结构建模。最后实现决策和规划,再基于感知和建模的结果,反馈到现实之中。


寒武纪:人工智能芯片的多样化挑战

与地平线2015年入局不同,寒武纪可以说算是国内最早一批的人工智能公司之一。

资料记载,寒武纪的起源可以追溯至2008年,其前身为中科院计算所成立的一只10人学术团队。

估计当时的这10个人都没有想到会成立一家公司,更能够推出芯片,搅动中国人工智能市场。

事实往往就是这么出乎意料,早期以发表学术论文为主的这一只团队,在2015年研制出了首个处理器产品,并逐渐开始商业化。

但是,一个巨大的问题摆在了这个团队面前,没有公司,商业化运营很难进行下去,因此,2016年3月,寒武纪公司正式成立。

在中国科学院计算技术研究所陈云霁、陈天石两兄弟的领导下,2016年,寒武纪推出的寒武纪1A处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备。

微信图片_20180323232455.jpg

按照寒武纪执行董事罗韬话来说,在中国提供人工智能芯片的企业中,寒武纪解决方案最为完整。目前,寒武纪已与通信设备商华为合作,在后者智能手机Mate 10搭载的麒麟970芯片集成了1A的IP(知识产权),并与IT设备商中科曙光推出了面向人工智能推理任务的服务器Phaneron。

陈云霁曾这样说到:“人的大脑是已知最智能的物体。如果能把大脑中神经元和突触数字化抽象出来,这样的数字化网络某种程度上可能就继承了人脑对信息的处理能力。”

从现有情况来看,一方面神经网络确实是智能处理的好方法,但另一方面通用处理器在这方面效率很低,为什么不能用人工智能的办法来设计一款专门的芯片呢?所以,“寒武纪”芯片就是要解决这个专门的问题。

“寒武纪”AI芯片可以在计算机中模拟神经元和突触的计算,对信息进行智能处理。通过设计专门存储结构和指令集,每秒可以处理160亿个神经元和超过2万亿个突触,功耗却只有原来的1/10。

按照寒武纪目前的想法来看,人工智能芯片面临的就是多样化问题,这个多样化,包括两个方面:需求多样化和形态多样化。

需求多样化是指,对于不同的神经网络来说,就想吃饭一样,不同的人口味都不同,有的人喜欢甜的,有的人喜欢咸的。应用在不用领域的神经网络,基于不同的功能,不同的需求,要求也不尽相同。大规模的神经网络需要高性能,高效化的芯片。小规模的神经网络需要低能耗的芯片。

而形态多样化,则是指对于同一款神经网络芯片,想要能够支持多种形态的神经网络,不仅要在结构上,也要在算法等诸多方面做出全面的考虑,才能够满足多个神经网络的需求。


深鉴科技:软硬件协同

深鉴科技的团队真可谓是“全明星阵容”,其创始团队全部是由来自斯坦福大学与清华大学的深度学习硬件加速研究者组建而成。其中,联合创始人&CTO单羿作为前百度前百度IDL异构计算方向创始成员,曾入选过IBM PhD Fellowship(IBM博士英才计划)项目。

联合创始人韩松在2016年世界顶级深度学习会议ICLR上,以一篇Deep Compression(深度神经网络压缩)论文与AlphaGo的开发者——谷歌DeepMind共同活动了最佳论文奖,同时因为其很高的研究造诣,韩松将于2018年任职MIT(麻省理工)助理教授。

另一位联合创人汪玉是清华电子系副教授,国家自然科学基金“优青”获得者,清华大学教改以来首批终身教授,汪玉从2006年就已经开始研究FPGA,并且是现任ACM FPGA技术委员会亚太地区唯一成员。

所以,虽然深鉴科技在2016年才成立,但是已经吸引了来自百度、360、华为、风河、Intel、Nokia等公司在内的大批行业精英,使得整个团队在具有国际学术影响力的同时又具备了资深的工业经验。

资料显示,深鉴科技最为核心的即Deep Learning Processing Unit(DPU)及神经网络压缩编译技术,甚至被世界最大的FPGA芯片厂商Xilinx认为是世界深度学习硬件加速的典范。

所谓DPU既深度学习处理器,其精髓就在于使用了深度压缩技术。这项技术不仅可以将神经网络压缩数十倍而不影响精度,还可以使用芯片存储深度学习算法模型,减少内存读取次数,大大降低运行功耗。

与此同时,基于优化协同性,深度压缩技术对于硬件本身也提出了新的要求。为此,深鉴科技推出了两种用于深度学习处理器的底层架构——亚里士多德架构和笛卡尔架构,以及面向DPU的深度神经网络开发工具包DNNDK。

姚颂认为,所有产品都可以分为四个层次:能用、好用、让用户想用、让用户爱用——AI芯片产品也是如此。

对于AI芯片来说:

第一层是能用,就是这块芯片能够跑AI、能够对深度学习运算进行加速。

第二层是好用,如何让这块芯片支持的AI算法种类多一点,让用户开发起来更简单。

第三层是想用,那就是用户用你的产品开发起来更简单、算法跑出来性能更好,选择别的产品时开发起来更麻烦。

第四层则是爱用,也就是用户粘性高,当很多使用你的芯片的人集成在一起,形成社区与软件生态,有很多开放的项目代码可以供人交流参考,这就不仅是能用或者好用了,而是让用户爱用。

微信图片_20180323232521.jpg

人工智能的两个方向

近年来,英特尔、英伟达、Facebook、微软、Google、IBM、苹果、华为等科技公司都在积极布局AI芯片,复杂的深度学习网络计算需求很高,除了云计算,需要有更多更强大的本地计算资源。

咨询公司Tractica的预测数据显示,到2025年,与人工智能相关的深度学习芯片组市场收入,将由去年的5亿美元飙升至122亿美元的规模,复合年均增长率超过40%。这一数据不仅是基于巨头的参与,也是源自人工智能创业企业近年来的爆发。

要知道,从1956人工智能概念被提出以来,经历60多年的发展,这项技术前后经历了多次跌宕起伏。随着AlphaGo打败李世石这样的典型案例出现,无论是各国政府还是资本市场,都将人工智能视为今后发展的战略中心。

我国更是提出了要将人工智能与传统行业进行深度融合,这为一大批企业提供了极好的发展空间。更为重要的是,“大众创业万众创新”的新时代也为广大创业者提供了良好的发展平台。

在这波人工智能的创业浪潮中,有两个创业方向:1、以算法为主,做算法研究 ;2、以硬件为主,做AI芯片。


总结

在这场硝烟尚未完全燃起的战争中,美国一直以来是全球人工智能领域领跑的国家,但中国已经开始着手加速入局。这两年,数家中国公司开始芯片研发,“XPU”的出现如雨后春笋。

而以地平线,寒武纪,深鉴科技为主的大批人工智能芯片企业正在以各自对于人工智能行业的独特思考,不断的摸索自己的发展之路,创造属于自己的人工智能领域。

地平线的发展策略是,针对使用场景需求研究最适合的算法框架,然后将算法框架实现在芯片上,其目的是做“嵌入式人工智能”,用芯片加算法的模式,进行单点突破。

寒武纪则选择了另一条路径。2016年发布了人工智能专用指令集后,寒武纪在软件平台投入了大量的人力。寒武纪不仅令处理器可以支持主流的编程框架,同时开发了专用函数库、编译器、模型生成工具等,降低开发者使用的门槛。相对而言,寒武纪的芯片通用性更强。

而深鉴科技走的是为深度学习提供高效灵活的软硬一体解决方案的道路。无论是推出Deep Learning Processing Unit(DPU)还是神经网络压缩编译技术,深鉴科技始终认为,每家AI芯片公司都需要成为一家软件&系统公司,这样才能在市场竞争中取得优势。


继续阅读>>