耗资4亿美元!Meta将采购2000套DGX A100,打造全球最强AI超算

耗资4亿美元!Meta将采购2000套DGX A100,打造全球最强AI超算

1月25日消息,近日,Meta(Facebook母公司)宣布建造全球最强大的AI超算,名为AI Research SuperCluster(RSC)。其目标是最终运算速度(Linpack)达到220 petaflops(每秒22亿亿次)。实际上,RSC已经投入运行,但后续还会追加运算节点。

目前,RSC的配置是760套NVIDIA DGX A100 AI系统,也就是1520颗AMD 64核EPYC处理器(第二代,代号Rome)、6080颗NVIDIA A100 GPU。


△DGX A100

I/O方面,网络带宽200Gbps、175PB FlashArray、10PB FlashBlade以及46PB缓存。

根据初期测试显示,其在进行视觉运算时,工作速度较之前的AI 运算系统提升20 倍,运行NVIDIA NCCL 的速度则提升9 倍以上,且在训练大规模的语言模型上则提升3倍。这也意味着SRC 可在三周内完成拥有数百亿参数的模型,而之前的系统需花费九周的时间。

Meta指出,其研究团队目前正在使用这台超级计算机训练AI 模型,进行自然语言处理和电脑视觉研究;目标是希望SRC 有朝一日能在1 艾字节的数据集上训练包含超过1万亿个参数的模型(1 艾字节大约相当于3.6 万年的高画质影片)。

Meta也强调,尽管SRC 已开始运行,不过其仍在开发中,Meta 将努力提升SRC 中的GPU 数量,预计未来会再追加1240套DGX A100系统,单GPU规模就多达16000颗(单颗显存40GB)。这将使AI 训练性能提高2.5 倍以上。当今年夏天SRC 完全建置完成后,将成为世上最快的AI 超级电脑。

资料显示,NVIDIA DGX A100发布于2020年,单套系统售价高达19.9万美元。也就是说,RSC最终完工时,单采购DGX A100就需要花费3.98亿美元(约合人民币25亿)。

编辑:芯智讯-林子

0

付费内容

查看我的付费内容