英特尔Meteor Lake揭秘:Chiplet与先进封装集大成者,还有AI电源管理!

在9月19日的英特尔 ON 技术创新峰会上,英特尔公布了面向笔记本电脑产品的代号为Meteor Lake的英特尔酷睿Ultra处理器,并宣布该处理器将在今年12月14日正式推出。

在此之前,英特尔曾在HotChips上公布了更多关于Meteor Lake的技术细节,其最大亮点在于采用了同时采用了英特尔目前最先进的制程技术及最先进的封装技术,以及先进的Chiplet架构与互联技术。

图片

具体来说,Meteor Lake采用了Chiplet架构,分为Base Tile(基于Intel 16制程)、Compute Tile(Intel 4制程)、GPU Tile(台积电N5)、SoC Tile(台积电N6)和I/O Tile(台积电N6),并通过英特尔3D Foveros封装技术整合在了一起。

其中,Compute Tile即CPU核心是基于EUV光刻的Intel 4工艺制造,使用第二代混合架构技术,P核心会采用全新Redwood Cove架构,E核为Crestmont架构。

GPU Tile 基于台积电5nm工艺打造,核显从 Xe LP 升级到 Xe LPG,相较于上一代的 Iris Xe 核显每瓦性能翻倍。同时,新一代核显有更高的频率,同等电压下的频率直接可以冲击到 2GHz 以上。新核显还针对 DX12U 进行了优化,支持倍帧功能,支持新特性“Out of Order Sampling”。此外,英特尔还集成了全新的 Xe 媒体引擎。

SoC Tile基于台积电5nm工艺,拥有全新的低功耗island E核心,并首次加入了集成式的神经网络处理器(NPU)可以为PC带来高能效的AI加速和本地推理体验。同时,还支持WiFi-6E ?& WiFi-6E,8K 10bit HDR 视频的编解码和AV1 编码,支持HDMI 2.1和DP2.1,集成了内存控制器等。

图片

最近英特尔又更进一步,借助2.5D EMIB封装技术,将Meteor Lake连接两颗三星LPDDR5X-7500內存颗粒(K3KL3L30CM-BGCT),组成一颗有16GB內存的系统单芯片,拥有120GB/s內存理论带宽。

图片

在此前的英特尔Hot Chips 2023活动上,英特尔还介绍了Meteor Lake的英特尔能效体系结构(Intel Energy Efficiency Architecture)。

利用AI电源管理算法

英特尔在2008年的迅驰(Centrino)平台,就以HUGI(Hurry Up,Get Idle,中文翻译是“跑快点,然后闲下来”)来描述其电源管理理念:意思是低功耗处理器要先以更高功率、更快速度完成工作,然后再尽快转换成低功耗状态,突然有效能需求再切回去,这也是我们熟知的DVFS(Dynamic Voltage and Frequency Scaling)和从Skylake开始导入的Speed Shift。

英特尔宣称Meteor Lake应用人工智能算法作电源管理及切换高效能模式和低功耗状态,能“自学”使用者行为,掌握更详细行为模式,预测使用者下一步,所以AI将带来英特尔的“Centrino Moment”(意指像当年的迅驰一样,出现节能领域的重大突破)。

英特尔表示这可提高35%系统反应速度,不影响使用者体验同时,比以前节省10%~20%功耗。这究竟是否需要动用Meteor Lake的VPU,还值得观察。

图片

▲不只CPU要跑AI,现在连CPU电源管理也要AI化了

英特尔更提出颇具争议的看法:过去节能关键指标的“每瓦性能”不再重要,因为多数笔记本电脑每天只有4分钟处于高功率状态,桌面PC则约100分钟。

乍一看,英特尔似乎想强调“做完这些工作的总能量”(逻辑近似Turbo Boost 2.0这种“预算能量”内允许超出标准设计功耗的超频方式)而不是“多少瓦数换取多少性能“”。

图片

▲英特尔称,性能和瓦数都很重要——但并非同时重要

追求低功耗甚于性能的多芯片连接

英特尔打造Meteor Lake的首要目标应该是追上苹果目前最强的M系列处理器的性能级能效表现,这充分反应在其重视降低功耗的多芯片连接构架。

相较十年前的Haswell,Meteor Lake联结Chiplet的界面是更省电的FDI(Foveros Die Interconnect),但事情却没这么单纯——关键在通信协定。

图片

▲Meteor Lake的DFI比OPIO数据传输率没有较高,但I/O密度、延迟、功耗和最大芯片数量明显胜出

Meteor Lake的CPU(Compute Tile)和SoC Tile之间是源自Nehalem的IDI(In-Die Interface)协议,最初用途是连接核心(Core)、非核心区域(UnCore)、通过环状总线存取的L3缓存內存内存块,采MESIF缓存数据一致性协定,意味缓存状态是“已修改”(Modified)、“独占”(Exclusive)、“共享”(Shared)、“无效”(Invalid)和“转发”(Forward),还要负责封包排序等,总之功能非常复杂。

Meteor Lake之前的英特尔核显也是用IDI协议,故有让绘图功能用到L3缓存的能力,像Haswell核显就需要依赖IDI配置eDRAM缓存。

但Meteor Lake放弃了IDI协议,改用了基于PCI Express的iCXL(不用PHY CXL),将GPU Tile放在远离CPU的位置,搞成很像独立显卡,这当然也有理由:省电。

图片

▲同样是FDI实体连接,但不同Tile是跑不同通信协定和信号

GPU可能不再共享L3缓存

Meteor Lake让GPU和CPU / L3缓存脱勾,代价是GPU很可能无法共享位于CPU的L3缓存,但也可缩短CPU延迟,利于提升CPU频率和L3缓存性能,并在GPU活动状态时,将CPU Tile设置成低功耗延长电池寿命(SoC Tile有独立E-Core)。这种“分而治之,尽其所能关掉不需要的功能单元”的做法堪称Meteor Lake设计的中心思想。

另外,核显缓存其实命中率不高,AMD评价过,容量起码要64MB以上才看得到明显效果。与其核显使用天高皇帝远的CPU L3缓存,还不如直接在核显内搭配更大的专用缓存。

英特尔较新款的Xe GPU核心有比AMD Vega和RDNA 2核显更大的区域缓存,减少核显依赖L3缓存。其实AMD APU也是类似方法。

图片

▲AMD以实际行动证明超高容量缓存才对GPU有实用性

Meteor Lake能效将会让人眼睛一亮吗?

不久前英特尔邀请了不少媒体参观其马来西亚槟城的封装产线,也公开Meteor Lake生产流程,代表很快就会看到原本该名为「第14代Core」的产品。不过苹果3nm制程M3家族也蓄势待发。

与AMD相比,英特尔在移动市场享有可利用Chiplet的弹性与优势,即使可能要等好一阵子,才能看出英特尔如何发挥Chiplet的可重用性,就像AMD服务器和桌面处理器路线。

编辑:芯智讯-浪客剑   资料来源:Technews

0

付费内容

查看我的付费内容