摘要:5月10日晚间,在英特尔On产业创新峰会上,英特尔正式发布了新一代的高性能深度学习AI训练处理器Habana Gaudi2。

AI性能达英伟达A100两倍,英特尔Habana Gaudi2发布-芯智讯

5月10日晚间,在英特尔On产业创新峰会上,英特尔正式发布了新一代的高性能深度学习AI训练处理器Habana Gaudi2

早在2019年12月,英特尔就以20亿美元收购了为数据中心提供可编程深度学习加速器的厂商Habana Labs,进一步增强了英特尔的人工智能产品组合。

Habana Labs的第一代Gaudi处理器是一款可编程且可定制的AI处理器,搭载基于第二代Tensor处理核 (TPC) 并集成开发工具、库和编译器。基于ResNet-50,Gaudi可以提供每秒1650张的图片处理能力——这是在业界单一处理器中最高的计算能力。同时,Gaudi的创新架构可以实现训练系统性能的近线性扩展,即使是在较小Batch Size的情况下,也能保持高计算力。这意味着,基于Gaudi处理器的训练性能可以实现从单一设备扩展至由数百个处理器搭建的大型系统的线性扩展。

和英伟达的V100相比,基于ResNet-50基准测试,Gaudi所表现出来的计算性能、功耗比和延迟时间仍然相当出色,在速度上要比V100快3.8倍。比如,在性能方面,V100单卡大概每秒处理600多张图片,而Gaudi单卡则可以处理1600多张;在功耗方面,V100处理600多张图片的功耗达到了300瓦,而Gaudi处理1600多张图片的功耗只有150瓦左右。

除了性能,Gaudi处理器片上集成了 RDMA over Converged Ethernet (RoCE v2) 功能,能够让人工智能系统使用标准以太网扩展至任何规模。

此次发布的Habana Gaudi2,在深度学习实现重大飞跃:专用于高性能深度学习AI训练的Gaudi处理器,能够让客户以较低成本进行更多训练。

AI性能达英伟达A100两倍,英特尔Habana Gaudi2发布-芯智讯

虽然英特尔并未公布Habana Gaudi2的细节参数,但是根据英特尔展示的性能对比数据来看,Habana Gaudi2在RestNet50 Training Throughput和BERT Tralning Throughput等视频及自然语言处理的模型测试中,性能都达到了NVIDIA A100的2倍左右。

AI性能达英伟达A100两倍,英特尔Habana Gaudi2发布-芯智讯

英特尔表示,此次发布的Habana Gaudi2和Greco AI加速器是基于Synapse AI软件栈开发的,能够通过支持多样化架构,让终端用户充分利用处理器的高性能和高能效。

编辑:芯智讯-浪客剑