《电子技术应用》

能否傲视群“芯” 10nm骁龙835性能分析

2017/1/6 6:00:00

如今在手机圈,一年能发布各种品牌上千款手机,但手机最核心的处理器、尤其是旗舰处理器,一年也只有那么寥寥数款。当下每代处理器的升级,不仅意味着性能的提升,在一定程度上还代表了未来产品技术演进的方向,并且影响着各品牌期间产品的发布规划。在2017年CES大会前夕,北京时间1月4日,高通在CES大会前夕正式揭晓了今年最顶级的处理器:骁龙835,而谁能成为这款芯片的首发产品也成了时下手机圈的一大趣谈。究竟是怎样一款芯片能让各家厂商趋之若鹜,我们今天就来看看此次骁龙835是一款怎样的产品。

三星10nm FinFET LPE工艺

此次骁龙835采用三星10nm FinFET LPE工艺,也是目前业界能量产最先进的工艺。对于FinFET工艺相信大家并不感到陌生,FinFET工艺主要是通过改造删栏形态来降低CPU漏电率,减小芯片功耗。我们都知道,半导体工艺的水准直接影响着处理器的性能。简单来说,更先进的工艺能够提升单位面积下的晶体管数量,而从运算能力的角度来讲,CPU的晶体管数量取决于CPU尚运算逻辑部件面积的大小。反之,CPU上晶体管数量越多,运算逻辑部件面积就越大,这也就意味着处理器的单位性能越高,这也就是为什么每代处理器都在不断的致力于工艺的精进。

从高通发布的数据来看,每颗骁龙835上都集成了30亿个晶体管,逼近iPhone7上采用的A10 Fusion 33亿的数量,因而才实现了骁龙835对比骁龙820降低了25%的功耗。在高通的介绍中,骁龙835采用第二代FinFTF工艺,能将芯片封装面积进一步减小35%,大约为153mm2,与A10 Fusion的125mm2比较接近。不过需要注意的是,骁龙835还集成了基带,因此骁龙835的封装面积还是非常不错的,而进一步降低封装面积,则能够使厂商在做内部结构设计时更加留有余地。另外,从之前看到的消息,骁龙835采用的是LPE(Low Power Early)工艺,因此笔者推测之后可能还会有一个LPP(Low Power Plus)的升级版。

Kryo 280架构:

骁龙835仍然延续kryo 架构,基于ARMv8设计,采用八核(4大核+4小核)的设计。对于现阶段的移动处理器,一般分为自研架构和公版架构(ARM标准架构),主要在于对于公版架构的二次开发,比如精简公版指令、增加处理器的各种新特性。而经过Scorpion架构、Krait架构以及骁龙820采用的Kryo架构,高通对于自研架构的技术已经比较得心应手,这也是高通对比其它还采用公版架构的处理器厂商能够实现差异化竞争的地方。

骁龙835采用4x2.45GHz+4x1.9GHz的八核心设计,在平时使用中,80%的场景下使用四颗小核工作,而在诸如APP加载、VR场景下时则开启四颗大核工作。并且根据官方介绍,骁龙835在四颗大核的L2二级缓存设计为2MB,四颗小核的L2二级缓存为1MB,相比骁龙820整整提升了一倍。我们知道,CPU中缓存的调用速度比内存快得多,而更大的缓存则可以帮助我们在平时使用中可以快速调用更多的数据。

X16 LTE Modem:

关于高通处理器,一直有一句玩笑话:高通的产品就是买基带送CPU。虽是玩笑,但也体现出高通处理器在连接性的地位。骁龙835内存X16千兆级LTE调制解调器,支持高达1Gbps的Cat16下载速度,以及150Mbps的Cat13 LTE上传速度,并且支持802.11ad多千兆比特Wi-Fi,能够达到4.6Gbps的峰值速度。而高通在基带的连接性中,除了速度,还有加入了一些创新性的特性以带来更好的体验。

X16 LTE Modem还支持4x20MHz载波聚合以及4x4 MIMO的天线配置。载波聚合简单来说,就是同时利用多频段的资源,把一些不连续的频谱碎片聚合到一起,增加系统传输带宽,从而获得更高的数据传输速率。我们在日常使用中,当遇到一个频段上用户太多时,就可以通过利用多频段载波聚合来达到提升带宽的效果,提升使用的网速。除此之外,X16 LTE Modem还是首款支持5G蓝牙标准。蓝牙5.0将运用于无线可穿戴、工业、智能家庭和企业市场领域,由于蓝牙5.0拥有4倍与上版本的覆盖面积、2倍的传输速度以及8倍的广播信息容量,其可以显著加速物联网的构建。

Adreno 540 GPU与Hexagon DSP:

相比于CPU,GPU在某种程度上显得更加重要,而Adreno系列则是高通一直引以为豪的产品。骁龙835搭载Adreno 540 GPU,主频为670MHz,图形处理性能相比上一代提升25%,并且支持OpenGL ES 3.2、完整的OpenCL 2.0、Vulkan和DX12等各种图形标准。一直以来,大部分3D游戏都通过OpenGL标准交互,但由于其出生于90年代,如今的OpenGL已经显得廉颇老矣,对于目前市面上多核处理器的利用效率较低,在图形处理的效率上比较低,而骁龙835支持的Vulkan改善多线程性能,渲染性能更快,摆脱OpenGL依赖CPU运算的方式,使GPU与CPU之间无需事先拷贝数据,在同样的内存下同时进行读写,充分发挥多核处理器的并行计算能力。

而根据高通官方PPT我们可以看到,除了GPU之外,骁龙835依旧保持了从820以来的VPU(视频处理单元)和DPU(显示处理单元)。其中DPU支持10-bit 4k@60Fps显示,Q-Sync以及更宽色域;而VPU则支持4K HEVC 10-bit硬解码能力,还提供了视觉聚焦区域渲染。

在此之前,在骁龙820上,高通引入Hexagon 680 DSP处理器,应用在对综合手机上的许多单个传感器的数据,进行整合分析,完成数据集中处理。而在骁龙835上,升级为支持HVX特性的Hexagon 682 DSP,并且延续了680 DSP上HVX(向量扩展)以及低功率岛的特性。并且Hexagon 682 DSP还包含对Google TensorFlow的支持,包括了对定制神经网络层的支持,以及对骁龙异构核心的功耗与性能的优化。

另外,人工智能作为当前最火热的领域,作为手机“大脑”的处理器自然对这方面也有所涉及。在官方介绍中,我们惊喜的看到骁龙835还增加对TensorFlow和Halide框架的支持。TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,主要用于语音和图像识别等多项机器深度学习领域,而Halide则是专门用来简化图像处理的程序语言。尽管在当前阶段在实际应用中可能还不明显,但我们也清楚的可以看到高通在人工智能和VR/AR领域已经正式布局。

Quick Charge 4:

如果评选2016年手机圈最流行的一句广告语的话,我相信“充电五分钟,通话两小时”一定为大家耳熟能详。随着骁龙835的亮相,新一代快充标准QC 4也已经与大家见面。相比于QC 3.0,QC 4增加了对USB Type-C和USB-PD的支持,并且包括USB供电。相比于QC 3.0,QC 4的充电速度提升了20%,效率提升30%。我们知道,相比于QC 2.0,QC 3.0采用最佳电压智能协商INOV算法,可以更精细的调节电压/电流的充电功率,而QC 4则将这一算法升级至第三版,创新性的加入了实时散热管理,能够在既定散热条件下,自主确定并选择最佳充电功率。伴随QC 4而来的还有高通推出最新的电源管理芯片SMB1380和SMB1381,具有低阻抗和95%的峰值转化效率。

在安全方面,QC 4能更准确的测得充电时的电压、电流和温度,保护电池以及充电器,并且增加了额外保护层,放置电池充电过度,在每个充电周期调节电流。

总结:先讲一件有趣的事:处理器对智能手机的重要性不言而喻,但到底有多重要呢?当你看到每年CES前后,手机圈都在纷纷猜测和盛传又有XXX款手机将首发骁龙处理器,然后在互联网上引起一阵热议,或许就能明白对于如今的智能手机,处理器不单单是一个元件,甚至从某个角度成为了一个象征。而从骁龙835主打的这些功能可以看到,高通整体的策略早已不在是单纯地提升运算性能,而是将处理器打造成智能手机的全面管家,覆盖到各个功能,通过更多差异化的功能来引领整个行业的发展。而关于骁龙835的实际性能表现,我们也会在之后继续密切关注。


继续阅读>>