《电子技术应用》

基于OpenCL*的DLA:低功耗支撑无人驾驶强计算

2017/7/19 21:01:00

  从前人们认为“无人驾驶”、 “机器驾驶员解放人类驾驶员”这样的概念还遥不可及,然而英特尔正在让这样的构想落地。为了驱动车轮上的数据中心,英特尔当前在无人驾驶领域的发力用“不积跬步无以至千里”来形容再合适不过,而其中的的六大技术即是“跬步”,也是助力无人驾驶车辆致千里的关键所在。

  你知道吗?未来,一辆无人驾驶汽车在90分钟之内就会产生4TB的数据量,这些数据可以帮助汽车了解其所在环境,让车辆可以安全的行驶在道路上。如果没有车内人工智能利用机器视觉和深度学习实时对数据加以分析,无人驾驶汽车就很难轻松上路。但这类人工智能负载通常需要消耗非常多的电力,并且难以在车内有限的功率下运行。因此,如果能用更低功耗来支撑更强大的计算,就会更有效地利用人工智能帮助汽车做决策。英特尔研发基于OpenCL*的DLA (Deep Learning Accelerator) 就可以有效解决这一难题,为功耗减负、为计算加码。

  能效乘法:对CPU和FPGA进行优化分区

  人工智能是一个混合算法,它不仅仅是计算机视觉,从自然语言处理到决策都对计算有着不同的需求,因此,只有有的放矢才能让功耗最大化。当前英特尔在利用CPU做预测和顺序执行方面很有优势,但同时,车内人工智能算法中有大量的并行执行。随着英特尔收购Altera,FPGA在并行执行上的优异表现让这一问题得以解决。英特尔在无人驾驶领域采用了混合架构,其中包括CPU、FPGA以及未来Mobileye专用的视觉芯片与视觉计算等方式,充分发挥每个芯片的特点来保证计算效果,从而在开放混合的平台上保证人工智能在无人驾驶上的实现,同时保证了性能、功耗已经工程化的统一。

  通过优化分区CPU和FPGA,英特尔能够使能效提高6倍,利用非常低的功耗——仅23fps/瓦——就能实时执行复杂的人工智能算法。

  40瓦 vs. 250瓦:FPGA相对于GPU的能效优势

1.png

  汽车利用多摄像头中的深度学习来执行实时对象检测和分类

  无人驾驶汽车需要时刻“眼“观六路,多摄像头神经网络就会利用复杂的深度学习算法来对物体进行检测和分类:哪些是行人?哪个是箱子?——这些功耗都将被控制在40瓦以下,而通过对比,GPU完成这一系列动作则需要250瓦的功耗。因此,利用运行在Wind River Linux*上的英特尔? Arria?10 FPGA和英特尔?至强?CPU,展示了英特尔技术明显的功耗优势。

  如果想早日体验高度无人驾驶带来的高效与便利,就不能忽视量产过程中的能耗问题。因此,英特尔让混合架构中的每一部分发挥各自所长,这既是技术积累,又是能耗减负,有了这一关键技术,英特尔就能助力无人驾驶车辆轻装上阵。


继续阅读>>