英伟达密集落子边缘AI，企业计算成为下一个重心-AET-电子技术应用

英伟达密集落子边缘AI，企业计算成为下一个重心

日期： 2021-06-03

来源：互联网

关键词： AIInsight 英伟达

　　继在游戏、数据中心市场收获巨额回报之后，英伟达希望覆盖更多的AI计算领域，而下一个重点就是企业计算。在日前举办的COMPUTEX 2021上，英伟达面向企业计算发布了重大计划和创新产品。

　　黄仁勋在今年4月的GTC大会上，首次强调了发展企业计算的决心。在他看来，现在正处于第二轮AI发展浪潮的起点，而这波发展将以企业和产业边缘计算为主，AI将彻底改变全球大型行业，包括制造、物流、农业、医疗健康、金融服务和运输业。

　　在COMPUTEX 2021上，英伟达企业计算负责人Manuvir Das也表示，现在是实现AI大众化，将其巨大力量带给企业用户及其客户的好时机。

　　英伟达企业计算负责人Manuvir Das

　　面向企业级AI计算，英伟达在构建三个基本要素：普适性强、可用于制造任何系统的硬件基础，用于AI的软件平台，以及用于协作设计的软件平台。

　　扩大认证服务器生态系统

　　目前，面向企业级的NVIDIA EGX，英伟达正在扩大NVIDIA-Certified认证服务器生态系统，使得企业用户的使用和部署更为便捷。

　　Das解释说，为助力系统制造商创建AI优化设计，并确保这些系统能够得到客户的信赖，NVIDIA 制定了一项针对GPU加速服务器的计划——NVIDIA 认证计划。

　　来自研华科技、Altos、永擎电子、华硕、戴尔科技、技嘉、慧与、联想、QCT、超微等公司的 NVIDIA 认证系统正在不断增加，其中包括主流数据中心使用的一些主流 x86 服务器，它们将AI的力量带了给更多行业，包括医疗、制造、零售和金融服务。

　　凭借NVIDIA认证系统，企业能够支持传统数据中心以及混合云中的各种复杂工作。其中包括在VMware vSphere上运行NVIDIA AI Enterprise和数据分析软件，来部署支持AI的企业级平台，从而实现批量运行AI工作负载；还包括在NVIDIA Omniverse Enterprise上实现设计协作、高级模拟以及在红帽OpenShift平台上实现AI部署。系统还可与 Cloudera 数据工程和机器学习无缝集成，把交付模型的时间从几个小时缩短至几分钟。

　　据了解，NVIDIA 认证系统经过严格的测试，在性能、安全性和可扩展性方面延续NVIDIA 的设计最佳实践。这些系统的价格和性能水平各异，采用NVIDIA A100、A40、A30或A10 Tensor Core GPU以及NVIDIA BlueField-2 DPU或NVIDIA ConnectX-6系列网卡。

　　目前，在高级AI训练和云计算服务领域，戴尔科技、慧与、宁畅和超微已经率先推出基于NVIDIA HGX加速计算平台、经过认证的新服务器。这些产品通过四或八个NVIDIA A100 GPU、NVIDIA NVLink GPU互连技术、NVIDIA InfiniBand网络以及NVIDIA AI和HPC软件栈提供领先的AI性能。

　　首批NVIDIA认证系统运用BlueField-2 DPU提升安全性

　　“今后，DPU 将成为所有服务器、数据中心和边缘的一个重要组成部分”，Das 表示，“NVIDIA 认证系统计划将扩展至采用 NVIDIA BlueField DPU 的系统。”

　　今年下半年，几家系统制造商将首次发布经过新一类NVIDIA认证系统的服务器，将通过BlueField-2 DPU（数据处理器）在网络、存储和安全性能上实现突破。

　　通过卸载CPU的工作任务，单一BlueField-2 DPU可以提供125个CPU核才能实现的数据中心服务，从而释放服务器CPU周期以支持各种关键业务应用。

　　NVIDIA 认证将于2022年扩展至Arm CPU服务器

　　Das 宣布，NVIDIA 认证系统计划将扩展至支持配备 Arm 核主机 CPU 的加速系统。

　　此外，英伟达与技嘉科技合作开发了一款Arm HPC开发者套件，为HPC、AI和科学计算应用开发提供硬件和软件一体化的平台。该平台经NVIDIA验证，可满足严苛的HPC应用要求，包含一个来自Ampere Computing的基于Arm Neoverse的Ampere Altra处理器、两个A100 GPU、两个BlueField-2 DPU以及NVIDIA HPC SDK。

　　Das 表示：“随着 GPU 和 DPU 加速器承担更多的 AI 计算工作负载，将主机 CPU 作为编排器比将它作为计算引擎更有用。”

　　下一步，为了将Arm生态系统扩展至企业以实现高性能AI计算，技嘉科技和纬颖科技计划将提供新的服务器，采用基于Arm Neoverse 的CPU、NVIDIA Ampere架构GPU/BlueField-2 DPU。这款服务器预计将于明年上市，届时将被提交至NVIDIA进行认证。

　　云端开发中心便于企业AI项目从原型快速投入生产

　　为了帮助企业将AI项目从原型快速投入生产，英伟达最新发布了一款托管在云端的开发中心NVIDIA Base Command Platform。

　　多数企业现在都知道AI对其数字化转型计划的成功至关重要，但是目前面临的一项复杂挑战是，如何将其部署并整合到企业中。NVIDIA Base Command Platform专为大规模、多用户和多团队的 AI 开发工作流程而设计，而且这些工作流程既可以在本地也可以在云中托管。凭借这款软件，研究人员和数据科学家能够同时使用加速计算资源工作，帮助企业最大程度地提高其专家级开发者和宝贵 AI 基础设施的生产力。

　　谷歌云成为计划在云实例中启用Base Command Platform 来管理和编排集群的首批云服务提供商之一。谷歌云机器学习基础设施产品管理总监Manish Sainani表示：“这款混合型AI产品，可以使得企业只需编写一次就能在任何地方运行，灵活接入多个NVIDIA A100 Tensor Core GPU，通过采用按需的加速计算，企业可以加快AI开发速度。”

　　据介绍，Base Command Platform为整个AI开发提供了统一的视图。该视图通过图形用户界面和命令行API以及综合监控和报告仪表盘来促进资源的轻松共享。包括NVIDIA NGC的AI和分析软件目录、与MLOps软件集成的API、Jupyter笔记本等在内的一系列丰富的AI和数据科学工具帮助研究人员可以更快的计划和安排工作负载、完善模型和获得洞察。

　　3D设计/模拟协作和安全也是布局重点

　　Das 还宣布，NVIDIA 将与全球领先的系统供应商合作提供NVIDIA Omniverse Enterprise，助力各行各业的团队轻松开展 3D 设计和模拟协作。届时，每家公司需支付的费用为 14,000 美元起。

　　安全方面，Das宣布正与红帽合作，为 OpenShift 和目前企业级数据中心中最常用的商业 Linux 版本——红帽企业 Linux（Red Hat Enterprise Linux，简称RHEL）提供 Morpheus 开发者套件。Morpheus是今年GTC大会上发布的，使用机器学习来识别、捕捉和处理威胁与异常的一款软件套件。

　　据Das 介绍，网络安全公司现在将能够在 RHEL 和 OpenShift 上使用 Morpheus，为所有企业级数据中心带来先进的安全措施。

　　写在最后

　　继在嵌入式领域、边缘市场布局了五六年后，英伟达今年明显针对企业级计算加大了投入力度。

　　任何边缘端设备，稳定性、长时间运行的故障率等都是非常重要的指标，英伟达正在通过其认证计划在这方面做出支持和保证。

　　此外，在边缘计算领域，某些情况下比数据中心更复杂，比如在面临各种各样的设备和应用选件时，如何把不同应用融合在一起成为一个成熟的产品，考验的是平台完备性。这是英伟达在边缘市场面临的挑战。

　　当然，边缘设备和数据中心其实是紧密结合的，因为模型都是从云中训练所得，这是英伟达从数据中心向边缘扩展的巨大优势。为了帮助合作伙伴的想法快速落地，中间的架构统一性、还有各种工具便利性就变得非常重要。这也将是英伟达下一步在边缘计算生态建设和产品创新的关键。

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：010-82306118；邮箱：aet@chinaaet.com。

英伟达密集落子边缘AI，企业计算成为下一个重心

日期： 2021-06-03

来源：互联网

相关内容