《电子技术应用》

谷歌TPU势头正劲 英伟达GPU突围AI芯片胜算有几分

2017/6/5 6:00:00

2017台北国际电脑展COMPUTEX 2017已经于5月30日开幕。英伟达的创始人兼CEO黄仁勋在AI论坛上发表了演说,谈到了英伟达的人工智能规划。

今年5月9日,英伟达公布了第一季度的财报,第一季度营收19.4亿美元,同比跳涨48.4%,净收入5.07亿美元,比去年同期跳涨126%。其中,游戏显卡业务营收占了总营收的53%,仍然是英伟达的主力军。但是数据中心业务收入翻倍至4.09亿美元,汽车业务收入也增长了24%至1.4亿美元。从去年起,数据中心和汽车业务加速发展,为提振股价起到了重要作用。黄仁勋曾表示,人工智能已经到了变革的边缘,最终将会有1万亿的设备拥有人工智能,而英伟达也正在变为人工智能公司。

黄仁勋在5月30日的演讲上谈到,CPU的性能增长遇到瓶颈,成长空间仅剩10%,而基于GPU的运算具有极大的潜力,成为推动人工智能的关键技术。他表示,到2025年,GPU的性能将是现在的1000倍。

以GPU为基础打入人工智能市场,英伟达一路高歌猛进,目前已经是人工智能GPU第一大厂。十几年前,人们开始将计算任务从CPU卸载到GPU,英伟达2006年推出了CUDA技术,来解放GPU的计算能力,经过多年的积累,目前CUDA+GPU已经在深度学习方面表现出了极强的适应性和强大的计算能力。

5月11日,英伟达在圣何塞的GPU技术大会上发布了新品Tesla V100,又称Volta,号称是史上最强的GPU加速器,专门针对服务器市场,用来处理需要强大计算能力支持的密集型HPC、AI和图形处理任务。其运算架构采用了台积电12nm FFN制程,集成了211亿个晶体管和5120个计算机内核,并且配备了40个Tensor内核,具有非常强大的深度学习性能。相对于之前的Pascal架构,深度学习训练速递提升了12倍,推理速度也提升了6倍。推理性能要比英特尔的Skylake CPU架构快15到25倍。每秒处理浮点运算能达到120万亿次。

1496310987054033670.jpg

英伟达代表了GPU方向,那么另外两个通往人工智能的重要方向——英特尔的CPU和谷歌的TPU又有什么样的优势?

作为CPU全球霸主,英特尔在切入人工智能的时候依然要用CPU做武器。去年英特尔先后收购深度学习初创公司Nervana Systems(Nervana开发的Engine芯片在深度学习训练方面具有优于传统GPU的能耗和性能优势)、机器视觉初创公司Movidius,还曾用167亿的价格收购了FPGA制造商Alera。英特尔表示将在2017年推出深度学习专用芯片,速度比GPU快10倍,并且将在2020年之前将深度学习训练速度提升100倍。目前英伟达的GPU炒得火热,人们都在质疑,关于人工智能,到底是CPU更合适,还是GPU更具有优势。

GPU包含多个流处理单元,更加擅长大规模的并行计算,适用于数据并行度高的计算密集型程序,对于AI这种编程框架,尤其是对图形图像的计算速度远超CPU。因此GPU更适合训练神经网络,在AlphaGo给了人们更加深刻的关于人工智能的认知之后,GPU的优势也被放大。虽然GPU有着可怕的数据运算能力,但是CPU是中央处理器,是做通用计算的,对于并行程度要求低,对数据的依赖性不高,适合处理多样的任务。在前期的数据获取,例如图像采集、人脸识别,以及后期的决策环节、和传感器等渠道的信息综合方面,CPU都具有明显优势,而中间的过程靠GPU进行并行计算,这样才能给出完整的人工智能路径。二者的侧重点不同,优势不同,但都是人工智能发展所不可或缺的。英伟达虽然掌握了GPU霸权,英特尔的速度也慢了些,但是那几起收购案不可小觑。

值得注意的是,最近升级版的AlphaGo再战柯洁,谷歌的TPU也逐渐被越来越多的人了解。不像CPU、GPU发展多年,TPU是谷歌推出TensorFlow框架几年后才研发出来的,是专门针对TensorFlow框架,服务于AI计算。由于排除了GPU中的其他部分,留下了专门处理AI的部分,因此TPU以其针对性和高效性被看好。那么TPU是否能够碾压GPU和CPU呢?

不久前的I/O大会上,谷歌的第二代TPU亮相。曾经作为英伟达的客户的谷歌,如今为了更高效地推进人工智能,自己研发专用芯片。第二代TPU能够达到180 TFLOP/s的浮点性能,和传统GPU相比提升15倍,比CPU提升30倍。另外谷歌还推出一个TPU pod阵列,能够包含64颗二代TPU。与一代相比,二代除了提高计算能力之外,还提高了数据推理能力,前几天AlphaGo的精彩表现就展示出了这一点。

1496310987117084680.jpg

但是英伟达指出,谷歌拿TPU和旧的GPU比是不合适的。另一方面,GPU是通用芯片,TPU则是专门为特定用途设计,只用来执行单一工作的ASIC,因此二者并不具有太大的可比性。目前第二代TPU已经能够支持浮点运算,而且能达到180万亿次,已经超越了英伟达Tesla V100,在人工智能的研究中,谷歌的TPU具有明显优势。

谷歌这样的巨头有充分的资源用自己造的TPU来对特定的研发任务进行专用加速,但是未来的市场,物联网深入布局,移动设备更加多样,会有更广泛旺盛的需求,也会有更多变的算法需要实现。因此未来的市场面临的是,选择功能强大的通用型芯片还是更加专业、有效的ASIC。英伟达的重心在技术落地和变现,而谷歌则在全面探索人工智能。能够高效率地解决更多的问题,就是工具的价值所在,目前围绕AI芯片的所谓“三强争霸”的说法并不准确,专注GPU的英伟达能否成为起AI芯片界的高通未可知,但是谷歌不会成为一个芯片公司。 不管是CPU、GPU还是TPU,都只是发展的必经阶段。二代TPU和Volta很快会被迭代,芯片本身要服务于计算,因此需要通过互相的借鉴和超越来互相推进,满足日益增长的计算需求。未来也许还会出现针对不同计算需求的ASIC,也许也会出现一种或多种更加强大的通用型芯片。


继续阅读>>