《电子技术应用》
您所在的位置:首页 > EDA与制造 > 业界动态 > 英伟达密集落子边缘AI,企业计算成为下一个重心

英伟达密集落子边缘AI,企业计算成为下一个重心

2021-06-03
来源:互联网
关键词: AIInsight 英伟达

  继在游戏、数据中心市场收获巨额回报之后,英伟达希望覆盖更多的AI计算领域,而下一个重点就是企业计算。在日前举办的COMPUTEX 2021上,英伟达面向企业计算发布了重大计划和创新产品。

  黄仁勋在今年4月的GTC大会上,首次强调了发展企业计算的决心。在他看来,现在正处于第二轮AI发展浪潮的起点,而这波发展将以企业和产业边缘计算为主,AI将彻底改变全球大型行业,包括制造、物流、农业、医疗健康、金融服务和运输业。

  在COMPUTEX 2021上,英伟达企业计算负责人Manuvir Das也表示,现在是实现AI大众化,将其巨大力量带给企业用户及其客户的好时机。

  英伟达企业计算负责人Manuvir Das

  面向企业级AI计算,英伟达在构建三个基本要素:普适性强、可用于制造任何系统的硬件基础,用于AI的软件平台,以及用于协作设计的软件平台。

  扩大认证服务器生态系统

  目前,面向企业级的NVIDIA EGX,英伟达正在扩大NVIDIA-Certified认证服务器生态系统,使得企业用户的使用和部署更为便捷。

  Das解释说,为助力系统制造商创建AI优化设计,并确保这些系统能够得到客户的信赖,NVIDIA 制定了一项针对GPU加速服务器的计划——NVIDIA 认证计划。

  来自研华科技、Altos、永擎电子、华硕、戴尔科技、技嘉、慧与、联想、QCT、超微等公司的 NVIDIA 认证系统正在不断增加,其中包括主流数据中心使用的一些主流 x86 服务器,它们将AI的力量带了给更多行业,包括医疗、制造、零售和金融服务。

  凭借NVIDIA认证系统,企业能够支持传统数据中心以及混合云中的各种复杂工作。其中包括在VMware vSphere上运行NVIDIA AI Enterprise和数据分析软件,来部署支持AI的企业级平台,从而实现批量运行AI工作负载;还包括在NVIDIA Omniverse Enterprise上实现设计协作、高级模拟以及在红帽OpenShift平台上实现AI部署。系统还可与 Cloudera 数据工程和机器学习无缝集成,把交付模型的时间从几个小时缩短至几分钟。

  据了解,NVIDIA 认证系统经过严格的测试,在性能、安全性和可扩展性方面延续NVIDIA 的设计最佳实践。这些系统的价格和性能水平各异,采用NVIDIA A100、A40、A30或A10 Tensor Core GPU以及NVIDIA BlueField-2 DPU或NVIDIA ConnectX-6系列网卡。

  目前,在高级AI训练和云计算服务领域,戴尔科技、慧与、宁畅和超微已经率先推出基于NVIDIA HGX加速计算平台、经过认证的新服务器。这些产品通过四或八个NVIDIA A100 GPU、NVIDIA NVLink GPU互连技术、NVIDIA InfiniBand网络以及NVIDIA AI和HPC软件栈提供领先的AI性能。

  首批NVIDIA认证系统运用BlueField-2 DPU提升安全性

  “今后,DPU 将成为所有服务器、数据中心和边缘的一个重要组成部分”,Das 表示,“NVIDIA 认证系统计划将扩展至采用 NVIDIA BlueField DPU 的系统。”

  今年下半年,几家系统制造商将首次发布经过新一类NVIDIA认证系统的服务器,将通过BlueField-2 DPU(数据处理器)在网络、存储和安全性能上实现突破。

  通过卸载CPU的工作任务,单一BlueField-2 DPU可以提供125个CPU核才能实现的数据中心服务,从而释放服务器CPU周期以支持各种关键业务应用。

  NVIDIA 认证将于2022年扩展至Arm CPU服务器

  Das 宣布,NVIDIA 认证系统计划将扩展至支持配备 Arm 核主机 CPU 的加速系统。

  此外,英伟达与技嘉科技合作开发了一款Arm HPC开发者套件,为HPC、AI和科学计算应用开发提供硬件和软件一体化的平台。该平台经NVIDIA验证,可满足严苛的HPC应用要求,包含一个来自Ampere Computing的基于Arm Neoverse的Ampere Altra处理器、两个A100 GPU、两个BlueField-2 DPU以及NVIDIA HPC SDK。

  Das 表示:“随着 GPU 和 DPU 加速器承担更多的 AI 计算工作负载,将主机 CPU 作为编排器比将它作为计算引擎更有用。”

  下一步,为了将Arm生态系统扩展至企业以实现高性能AI计算,技嘉科技和纬颖科技计划将提供新的服务器,采用基于Arm Neoverse 的CPU、NVIDIA Ampere架构GPU/BlueField-2 DPU。这款服务器预计将于明年上市,届时将被提交至NVIDIA进行认证。

  云端开发中心便于企业AI项目从原型快速投入生产

  为了帮助企业将AI项目从原型快速投入生产,英伟达最新发布了一款托管在云端的开发中心NVIDIA Base Command Platform。

  多数企业现在都知道AI对其数字化转型计划的成功至关重要,但是目前面临的一项复杂挑战是,如何将其部署并整合到企业中。NVIDIA Base Command Platform专为大规模、多用户和多团队的 AI 开发工作流程而设计,而且这些工作流程既可以在本地也可以在云中托管。凭借这款软件,研究人员和数据科学家能够同时使用加速计算资源工作,帮助企业最大程度地提高其专家级开发者和宝贵 AI 基础设施的生产力。

  谷歌云成为计划在云实例中启用Base Command Platform 来管理和编排集群的首批云服务提供商之一。谷歌云机器学习基础设施产品管理总监Manish Sainani表示:“这款混合型AI产品,可以使得企业只需编写一次就能在任何地方运行,灵活接入多个NVIDIA A100 Tensor Core GPU,通过采用按需的加速计算,企业可以加快AI开发速度。”

  据介绍,Base Command Platform为整个AI开发提供了统一的视图。该视图通过图形用户界面和命令行API以及综合监控和报告仪表盘来促进资源的轻松共享。包括NVIDIA NGC的AI和分析软件目录、与MLOps软件集成的API、Jupyter笔记本等在内的一系列丰富的AI和数据科学工具帮助研究人员可以更快的计划和安排工作负载、完善模型和获得洞察。

60b84c0623f65-thumb.png

  3D设计/模拟协作和安全也是布局重点

  Das 还宣布,NVIDIA 将与全球领先的系统供应商合作提供NVIDIA Omniverse Enterprise,助力各行各业的团队轻松开展 3D 设计和模拟协作。届时,每家公司需支付的费用为 14,000 美元起。

  安全方面,Das宣布正与红帽合作,为 OpenShift 和目前企业级数据中心中最常用的商业 Linux 版本——红帽企业 Linux(Red Hat Enterprise Linux,简称RHEL)提供 Morpheus 开发者套件。Morpheus是今年GTC大会上发布的,使用机器学习来识别、捕捉和处理威胁与异常的一款软件套件。

  据Das 介绍,网络安全公司现在将能够在 RHEL 和 OpenShift 上使用 Morpheus,为所有企业级数据中心带来先进的安全措施。

  写在最后

  继在嵌入式领域、边缘市场布局了五六年后,英伟达今年明显针对企业级计算加大了投入力度。

  任何边缘端设备,稳定性、长时间运行的故障率等都是非常重要的指标,英伟达正在通过其认证计划在这方面做出支持和保证。

  此外,在边缘计算领域,某些情况下比数据中心更复杂,比如在面临各种各样的设备和应用选件时,如何把不同应用融合在一起成为一个成熟的产品,考验的是平台完备性。这是英伟达在边缘市场面临的挑战。

  当然,边缘设备和数据中心其实是紧密结合的,因为模型都是从云中训练所得,这是英伟达从数据中心向边缘扩展的巨大优势。为了帮助合作伙伴的想法快速落地,中间的架构统一性、还有各种工具便利性就变得非常重要。这也将是英伟达下一步在边缘计算生态建设和产品创新的关键。




mmexport1621241704608.jpg


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。