记者|彭鑫
以GPU著称的英伟达希望在超算领域再次扩大应用领域。
在2022年国际超级计算大会(ISC)期间,英伟达宣布了在超级计算领域的多项进展,包括各大服务器制造商已采购英伟达CPU来生产高性能服务器,并基于其DPU产品增强量子计算能力。
“边缘、高性能计算和AI、模拟仿真、数字孪生和量子计算是现代超级计算机应用的五大工作负载。”英伟达加速计算业务副总裁伊恩·巴克(Ian Buck)在ISC上表示,从应用的角度来看,大量用户已经将高性能计算推到了边缘,或者正在测试量子计算系统。
在高性能计算领域,Nvidia擅长的GPU通常作为特定应用的加速计算,即“协处理器”,而主处理器(CPU)仍然是Intel和AMD这两家x86芯片厂商的绝对份额。根据第59届全球超级计算机500强榜单公布的统计数据,英特尔为榜单中77.6%的超级计算机提供处理器,AMD的份额为18.6%。
不过,英伟达最新的数据中心CPU“Grace”有望改变这一局面。它基于Arm指令集开发,专为包括人工智能(AI)和高性能计算(HPC)在内的应用而构建。
Grace一经推出,立刻引起了市场的关注,被视为Nvidia在Arm生态上的努力。但英伟达却频频降低声调,称与x86芯片厂商的合作关系不变。此前,黄仁勋表示,Grace将主要用于计算领域的大型数据密集型细分市场:“在其他领域,如云计算、企业计算、边缘计算、工作站和个人电脑,我们将继续提供对x86平台的支持。Grace不会对现有的CPU制造商产生‘改变游戏规则’的影响。”
目前,NVIDIA正在加速推进Grace CPU生态。Ian Buck提到,戴尔、技嘉、惠和、浪潮、联想、超微都已经计划使用Grace CPU来构建服务器。
由HPE制造并由洛斯阿拉莫斯国家实验室(LANL)运营的Venado超级计算机有望成为Nvidia实力的一个例子。英伟达表示,新的超级计算机将提供10 exaflops的AI性能,主要研究材料科学和可再生能源领域。通过英伟达的GPU、CPU和DPU,物理场计算应用的速度可以提升30倍。
另一个大的芯片战场,由英伟达推广的DPU(数据处理单元),也展示了其在超级计算机应用方面的技能。DPU作为专用芯片,处理网络、存储、任务管理等简单任务,然后将任务分配给CPU、GPU、FPGA进行计算,可以减轻CPU负载压力。
在ISC,Nvidia宣布其BlueField DPU将被洛斯阿拉莫斯国家实验室和德克萨斯高级计算中心采用。由该芯片组成的网络设施平台可以托管多个用户和应用,同时安全地隔离工作负载。
推动GPU、CPU和DPU的结合,将各种芯片单元组合成不同的解决方案,统一单元之间的接口,实现互联互通,是Nvidia近年来的既定策略,这也使得Nvidia在超算领域挤压Intel和AMD。
不过后两者竞争也不弱。目前超算领域最快的前沿计算机由AMD的CPU和GPU打造,计算能力达到1.102exaflops,英特尔力争在GPU领域有所作为,入侵英伟达的优势市场。它宣布在ISC推出新一代GPU架构。与英伟达保持一致,英特尔也计划将CPU和GPU结合到一个产品中,构建一个“超级芯片”。