《电子技术应用》
您所在的位置:首页 > EDA与制造 > 业界动态 > 谷歌、高通和三星SoC巅峰对决

谷歌、高通和三星SoC巅峰对决

2021-09-20
来源:半导体行业观察
关键词: SOC

  这款手机甚至还没有推出,但由定制的谷歌 Tensor SoC 驱动的Pixel 6 系列的前景已经引发了一些重大问题。芯片能赶上苹果吗?它真的会使用最新最好的技术吗?

  谷歌本可以从长期合作伙伴高通购买芯片组,甚至从新朋友三星那里购买 Exynos 型号芯片。该公司正在与三星合作,使用现成的组件和一些内部机器学习 (ML) 芯片的组合来开发自己的芯片组。

  根据一份可靠的报告,Pixel 6 的Google Tensor SoC 看起来与市场上的其它旗舰芯片组略有不同。当然,当我们拥有设备时,我们将保存基准测试以及任何性能和电池判断。但是,我们已经掌握了大量信息,可以深入研究 Qualcomm(以及我们正在使用的三星)最新芯片组之间的纸面数据比较。谷歌Tensor 与骁龙 888 芯片组的对决如何形成?让我们先睹为快。

  Google Tensor vs Snapdragon 888 vsExynos 2100

  尽管高通和三星的下一代 SoC 离我们并不遥远,但谷歌 Tensor 芯片旨在与当前的高通骁龙 888和三星 Exynos 2100旗舰芯片组竞争。所以我们将使用这些作为我们比较的基础。

  鉴于他们关系的性质,正如我们所期望的那样,谷歌的 Tensor SoC 严重依赖三星在其最新 Exynos 处理器中的技术。报道称,调制解调器和 GPU 设置直接借鉴于 Exynos 2100,相似之处延伸到类似的 AV1 媒体解码硬件支持。

  如果 GPU 设置确实与三星的Exynos 2100 匹配,那么 Pixel 6 也将是一款不错的游戏手机,尽管仍比 Snapdragon 888 的图形功能落后几帧。尽管如此,对于那些希望从 Pixel6 获得适当旗舰级性能的人来说,这将是一种解脱。但是,我们预计该芯片的张量处理单元 (TPU) 将提供更具竞争力的机器学习和 AI 功能。

  Google 的 2+2+4 CPU 设置是一个更奇怪的设计选择。值得更详细地探索,我们将对此进行探讨,但突出的一点是,两个强大的Cortex-X1 CPU 应该使 Google Tensor SoC 更适合单线程,但较旧的Cortex-A76内核可能会使芯片成为较弱的多任务处理能力。这是一个有趣的组合,可以追溯到三星命运多舛的Mongoose CPU设置。然而,关于该设计的功率和热效率还有很多问题需要回答。

  从理论上讲,谷歌 Tensor 处理器和 Pixel 6 系列与 Exynos 2100 和骁龙 888 相比,在 2021 年的一些最佳智能手机中具有很强的竞争力。

  了解 Google Tensor CPU 设计

  让我们看一下技术爱好者关注的大问题:为什么 Google 会选择 2018 年的 Arm Cortex-A76 CPU 作为尖端 SoC?答案在于面积、功率和散热的妥协。

  我从之前的 Arm 公告中挖出了一张幻灯片(见下文),有助于形象化重要的论点。假设图表的比例不是特别准确,但得出的结论是 Cortex-A76 比新的Cortex-A77和 A78更小、功耗更低,而且时钟速度和制造工艺相同(ISO 比较)。这个例子是在 7nm 上,但三星已经在5nm Cortex-A76上与 Arm 合作了一段时间。如果你想要数字,Cortex-A77 比 A76 大 17%,而 A78 只比 A77 小 5%。同样,Arm 仅设法将 A77 和 A78 之间的功耗降低了4%,而 A76 则是更小、功耗更低的选择。

  权衡是 Cortex-A76 提供的峰值性能要低得多。回顾 Arm 的数据,该公司在 A77 和A76 之间实现了 20% 的微架构收益,并在迁移到 A78 的过程中进一步提高了 7%。因此,多线程任务在 Pixel 6 上的运行速度可能比其 Snapdragon 888 竞争对手慢,尽管这在很大程度上取决于确切的工作负载。有了两个 Cortex-X1 内核来承担重任,谷歌可能会对其芯片具有正确的峰值功率和效率组合充满信心。

  这是关键点——选择较旧的 Cortex-A76 与 Google 对两个高性能 Cortex-X1 CPU 内核的渴望密不可分。移动处理器 CPU 设计可以消耗的面积、功率和热量非常有限,而两个 Cortex-X1 则突破了这些界限。

  选择更小、更低功率的内核可以为这些更大的组件释放芯片的硅、能量和热预算。或者,可以说选择两个 Cortex-X1 CPU 内核迫使 Google 采用两个更小、功耗更低的中级内核。但是,当高通和三星很高兴并且只用一个 Cortex-X1 就表现得很好时,为什么谷歌要两个 Cortex-X1?

  除了原始的单线程性能提升外,内核比 A78 快 23%,Cortex-X1 是机器学习的主力军。正如我们所知,机器学习是谷歌这种定制芯片设计目标的重要组成部分。Cortex-X1 通过使用更大的缓存和两倍的 SIMD 浮点指令带宽,提供了 Cortex-A78 两倍的机器学习数字运算能力。换句话说,谷歌正在降低一些通用的多核性能,以换取两个增强其 TPU ML 功能的 Cortex-X1。特别是在可能不值得启动专用机器学习加速器的情况下。尽管我们还不知道 Google 打算为其 CPU 内核配对多少缓存,但这也会对其性能产生影响。

  尽管使用了 Cortex-A76 内核,但仍有可能在功率和热量方面进行权衡。测试表明,单个 Cortex-X1 内核非常耗电,在当今的旗舰手机中难以维持峰值频率。有些手机甚至会避免在 X1 上运行任务以提高功耗。两个板载核心使热量和功率问题翻倍,因此我们应该谨慎对待Pixel 6 将仅仅因为它有两个强大的核心而超越竞争对手的建议。持续的性能和能源消耗将是关键。请记住,三星的Exynos 芯片组由其强大的 Mongoose 内核提供支持,正是因为这个问题。

  谷歌的 TPU 差异化

  关于 Google Tensor SoC 的为数不多的未知数之一是其张量处理单元。我们知道它主要负责运行 Google 的各种机器学习任务,例如语音识别到图像处理,甚至视频解码。这表明有一个合理的通用推理和媒体组件,它连接到芯片的多媒体管道中。

  高通和三星也有自己专用于机器学习的硅部件,但骁龙 888 的特别有趣之处在于这些处理部件的扩散程度。Qualcomm 的 AI 引擎分布在其CPU、GPU、Hexagon DSP、Spectra ISP 和传感中心。虽然这有利于提高效率,但您不会找到同时运行所有这些组件的用例。所以高通 26TOPS 的全系统 AI 性能即使有也不会经常使用。相反,您更有可能看到一次运行一两个组件,例如用于计算机视觉任务的 ISP 和 DSP。

  毫无疑问,谷歌的 TPU 将包含各种子块,特别是如果它也运行视频编码和解码,但似乎 TPU 将容纳大部分(如果不是全部)Pixel 6 的 ML 功能。如果谷歌能够一次充分利用其大部分 TPU 功能,那么它很可能能够在一些真正有趣的用例上超越竞争对手。但我们只能拭目以待。

  Google Tensor 与Snapdragon 888谁更强?

  谷歌 Tensor SoC 为移动芯片组竞技场注入了一些急需的新鲜血液。当然,我们会等到手机拿到手之后再下结论。但在纸面上,谷歌 Tensor 看起来与旗舰级 Snapdragon 888 和 Exynos 2100 一样引人注目。

  正如我们一直预期的那样,Google Tensor 不会超越当前一代的处理器。但是,它正在寻求自己的新颖方法来解决移动处理问题。凭借两个高性能 CPU 内核及其内部 TPU 机器学习解决方案,谷歌的 SoC 与其竞争对手略有不同。尽管真正的游戏规则改变者可能是谷歌通过迁移到自己的芯片来提供五年的操作系统更新。

  您如何看待 Google Tensor 与 Snapdragon 888 和 Exynos 2100?Pixel 6 的处理器是否会成为真正的旗舰竞争者?




电子技术图片.png

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。