Arm Cortex-X4已流片:首发台积电N3E工艺,性能提升15%,功耗大降40%!还有Cortex-A720和A520

图片

5月29日,Arm发布了2023全面计算解决方案(TCS23),其中包括了第三代ARMv9 CPU内核Cortex-X4、Cortex-A720、Cortex-A520,全部都是64位CPU,以及全新的DSU-120(DynamIQ共享单元)和旗舰级GPU Immortalis-G720。

Arm称,TCS23将成为最重要的移动计算平台,为智能手机带来绝佳的解决方案。TCS23 提供一整套针对特定工作负载而设计与优化的最新 IP,可作为一个完整系统无缝地协同工作,从而满足日益增长的移动用户体验需求。

图片

图片

Arm 高级副总裁兼终端事业部总经理 Chris Bergey 表示:“TCS23包含了基于全新第五代  GPU 架构、可实现终极视觉体验的全新Arm Immortalis GPU,助力 Arm 面向下一代人工智能(AI)保持性能领先的全新 Armv9 CPU 集群,以及可为数百万 Arm 开发者提供更易访问软件的全新增强技术。Arm 正致力于移动领域实现从芯片到软件的创新,以支持由我们庞大的全球生态系统带来持续增长的沉浸式数字体验。Arm技术显而易见的将成为移动未来的基石。”

Cortex-X4性能提升15%,功耗降低40%

据Arm介绍,作为 TCS23 的一部分,全新的 Armv9 Cortex CPU 计算集群彰显了 Arm 对提供领先 CPU 性能的坚定承诺。该集群在连续三年实现两位数性能增强的同时,效率也得到显著提升。

其中,作为第四代 Cortex-X 内核,新的 Arm Cortex-X4是该高性能集群的关键组成部分,可突破旗舰智能手机的性能极限。Cortex-X4 是 Arm迄今为止打造的最快速的 CPU,与 Cortex-X3 相比,其性能提高15%。与此同时,基于相同工艺的全新高能效微架构可降低功耗达40%。Arm解释称,之所以能够实现功耗的大幅降低,主要是通过制程工艺以及降低了CPU内核工作电压实现的。

图片

这一性能和效率的提升可以将设备使用体验(如 UI 响应能力和应用程序启动时间)提升到一个新的水平,并让实现面向下一代人工智能和机器学习的应用成为可能。

Arm表示,制程工艺和计算能力更为紧密的结合是实现最高性能和最高效设计的关键。在新一代 CPU设计中,Arm 在 TSMC N3E 制程工艺上顺利完成了业内首个 Cortex-X4 流片,进一步深化了双方长期合作的伙伴关系。这项合作同时确保了Arm 生态系统已做好准备,能在流片完成后,充分发挥Arm处理器技术带来的功耗、性能、面积(PPA)优势。

图片

资料显示,台积电3nm工艺家族包括N3(N3B)、N3E、N3P、N3X、N3S等等。N3是最初版本,又称N3B,号称对比N5同等功耗性能提升12%、同等性能功耗降低27%,但性能、功耗、量产良率和进度等都未达预期,于是有了增强版的N3E。N3E修复了N3B上的各种缺陷,设计指标也有所放宽,对比N5同等功耗性能提升15-20%、同等性能功耗降低30-35%,逻辑密度约1.6倍、芯片密度约1.3倍。

图片

N3E工艺预计最快2023年年中量产,Arm、AMD、NVIDIA、博通、高通、联发科、美满电子等都会采纳。

Cortex-A720和A520

此外,Arm领先的 CPU 性能也扩展至其全新大小核,推出了全新的Arm Cortex-A720 和 Cortex-A520。Cortex-A720 是业界主流 CPU IP,作为新 CPU 集群的核心主力,可提高持续性能。而 Cortex-A520 则是Arm目前最出色的高效率核心。这些全新的 CPU 设计较前几代产品实现了 20% 的能效提升(A720能效提升了20%,A520的能效提升了22%),可惠及包括AAA级游戏、全天候生产力和后台任务等用例。

图片

其中,Cortex-A720升级到了Armv9.2指令集,同样的功耗下性能比上代的Cortex-A715更强,架构优化了内存读取,带来了大幅功耗降低,同样的面积下性能比Cortex-A78还要高。

图片

Cortex-A520相比上代的A510来说,最大的变化就是彻底放弃了32位,转向了纯64位,主打低功耗,而且面积减少22%的情况下性能还能提升8%。

图片

DSU-120:最高支持14核

同时,Arm还带来了全新的DSU-120(DynamIQ共享单元),专为满足要求苛刻的多线程使用场景而设计,支持从可穿戴设备到智能手机、笔记本电脑的众多设备,使新的 CPU 集群臻于完善。

据芯智讯了解,DSU-120最高可支持14核,也就是说理论上可以支持14核的Cortex-X4,或者10核Cotex-X4再加4个Cortex-A720之类的组合,这也将极大提升Arm PC的性能。同时,Cotex-X4功耗的大幅降低,也为提升Cotex-X4核心数的提升提供了助力。

值得一提的是,TCS23带来了全新版本的CI-700,这是专门为AAA级别游戏、120Hz帧率和HDR视频等要求较高的计算所需而设计的互联架构。Arm称,2023版的CI700相比上一版本带来了25%的互联延迟降低。

图片

根据Arm公布信息显示,其全新的TCS23相比上代在在性能提升的同时,功耗大幅降低。其中,X4超大核功耗降低了40%、Cortex-A72功耗降低了20%,Cotex-A520功耗降低22%,DSU功耗降低了18%。

Immortalis-G720 GPU:性能及能效均提升了15%

Arm 在 2022 年通过全新旗舰 GPU 产品 Immortalis-G715 的推出,带来了移动端的光线追踪的支持,极大提升了移动端的视觉体验;并携手 MediaTek 通过采用 TCS22 的天玑 9200 移动芯片组实现了这项承诺,该芯片组现已在高跑分的 OPPO 和 vivo 旗舰智能手机中搭载使用。

Arm 今年推出的最新 GPU 产品采用了全新的第五代 GPU 架构,该架构是 Arm 迄今为止最高效的 GPU 架构,重新定义了部分图形管道,以优化内存带宽,从而在移动设备上支持高几何负载的下一代游戏和实时 3D 应用,同时带来更顺畅、并与 PC 端和游戏主机媲美的游戏体验。

需要指出的是,延迟顶点着色(Deferred Vertex Shading, DVS)是Arm第五代 GPU 架构新引入的图形功能,可重新定义数据流,有助于合作伙伴扩展核心数量,达到更高的性能水平。

DVS技术的好处就是顶点着色的过程中,在执行阶段才会载入内存中,不像之前那样需要两次载入内存,因此大幅降低了对带宽的要求。在手机等移动平台的图形渲染中,内存带宽会消耗1/3的功耗,因此DVS技术可以大幅降低游戏功耗,提升续航,同时也提高了能效。

图片

此次推出的Immortalis-G720被称为是 Arm 目前性能和能效表现最为出色的 GPU,与上一代产品相比,其性能和能效分别提高了15%,系统级效率更是跃升了40%,从而带来更高质量的图形渲染,实现更身临其境的视觉感受。

据芯智讯了解,Immortalis-G720在性能及能效相比上代提升15%的同时,内核面积仅增加了2%。官方表示,其整体性能要领先竞品20%。

另外,根据Arm公布的数据显示,其基于第五代 GPU 架构的Immortalis-G720在《精灵废墟》游戏中带宽节省了41%,《原神》中节省了33%带宽,《堡垒之夜》中为26%,甚至在CAD的应用中也可以节省37%的带宽。

图片

除了Immortalis-G720之外 ,Arm 也同时推出了基于第五代 GPU 架构的Arm Mali-G720 和 Mali-G620,旨在将高端移动图形功能快速地推向更广大的消费终端市场。

图片

图片

为全球开发者提供软件和安全解决方案

凭借 TCS23,Arm 可以确保数百万基于Arm 架构、为 Arm架构应用进行开发的移动开发者们能够拥有编写更简易、更快速且更安全软件的能力与工具。

图片

Arm表示,去年以来,生成式人工智能所带来的AI体验令世界惊叹,未来AI能力将会持续进入到终端领域。而在Arm的推动下智能手机的人工智能处理能力实现了每两年翻一番。

为了进一步释放智能终端的AI能力,Arm通过其开源软件库不断提升 Arm IP 的机器学习功能,让开发者在处理人工智能和机器学习工作负载时能充分获益。据介绍,Arm NN 和 Arm Compute Library 已在安卓平台上面向 Google应用开放,目前已拥有超一亿的日活用户,助力开发者优化运行在 Armv9 CPU 和 Arm GPU 的机器学习工作负载。

图片

另外,安全问题也是移动终端设备面临的巨大威胁。Arm称,TCS2023所有新 CPU 均支持 64 位计算和 Armv9 安全创新功能,能够抵御更高级别的数字威胁。通过 Armv9 CPU,Arm 在整个移动生态系统中持续成功部署 Arm 内存标记扩展 (MTE) 功能,以消除占所有软件漏洞高达 70% 的内存安全漏洞。

据介绍,荣耀和快手都在基于Arm的MTE技术来提升安全性能。

图片

下一代全面计算解决方案TCS24曝光

除了全新发布的TCS23全面计算解决方案之外,Arm还透露了下一代的TCS24的部分信息:下一代的Cortex-X超大核代号为“lackhawk”,下一代Cotex-A系列大核代号为“Chaberton”,下一代Cotex-A系列小核代号为“Hayes”,下一代的旗舰GPU代号为“Krake”。

Arm表示,其对 CPU 和 GPU 产品路线图的承诺更胜以往,将继续在包括 Krake GPU 和 Blackhawk CPU 等关键 IP 上加大投入,以满足合作伙伴对于计算和图形性能的要求。

编辑:芯智讯-浪客剑

0

付费内容

查看我的付费内容