Hacker News 中文摘要

RSS订阅

英特尔Lion Cove P核与游戏工作负载 -- Intel's Lion Cove P-Core and Gaming Workloads

文章摘要

Intel最新推出的高性能CPU架构Lion Cove在指令执行效率、执行引擎重组和数据缓存层次结构上进行了多项优化,相比前代Raptor Cove在SPEC CPU2017基准测试中表现显著提升,尤其在IPC子测试中。在Arrow Lake桌面平台上,Lion Cove与AMD的Zen 5性能相当,整体优于Raptor Cove且功耗更低。然而,游戏性能是许多爱好者关注的焦点,游戏对CPU的需求与生产力工作负载有所不同。

文章总结

文章主要内容总结:

Intel的Lion Cove是其最新的高性能CPU架构,相比前代Raptor Cove,Lion Cove在每周期执行指令数(IPC)、执行引擎重组和数据缓存层次结构等方面进行了优化。Lion Cove在SPEC CPU2017基准测试中表现优异,尤其在IPC较高的子测试中,性能提升显著。在Arrow Lake桌面平台上,Lion Cove与AMD的Zen 5竞争激烈,且功耗更低。

游戏性能分析: 游戏负载通常处于IPC范围的低端,Lion Cove在游戏中的IPC表现远低于SPEC CPU2017测试。通过Top-down分析,文章详细探讨了CPU核心宽度利用率低的原因,包括错误推测、前端延迟、前端带宽、核心绑定、后端内存绑定等。

Image 1

缓存层次结构: Lion Cove采用了四级数据缓存设置,L1数据缓存分为两层(L1和L1.5)。L1.5缓存虽然命中率不高,但有效减轻了L2缓存的压力。L2缓存的命中率在《使命召唤》、《Palworld》和《赛博朋克2077》中分别为49.88%、71.87%和50.98%。L1.5和L2的累计命中率在这三款游戏中分别为75.54%、85.05%和85.83%。

Image 4

内存访问延迟: 访问L3和DRAM的开销非常高,Lion Cove的性能监控事件可以测量每个缓存层次对性能的限制。L1和L1.5在图中被统一计为“L1 Bound”,L1.5有效减少了L2的访问压力,但L3和DRAM的性能对整体性能有显著影响。

Image 6

前端性能: Lion Cove的前端性能较强,分支预测器在游戏中表现出色,但偶尔的分支预测错误仍会导致性能下降。Lion Cove的前端可以从四个来源获取微操作,其中微操作缓存(DSB)是主要来源。64 KB的指令缓存有效减少了指令访问L2的次数。

Image 12

退休阶段: 在游戏这种延迟敏感的工作负载中,退休阶段的表现呈现出“饥一顿饱一顿”的特点。大多数时候,退休阶段无法执行操作,因为长延迟指令或分支预测错误阻塞了退休。当退休阶段解除阻塞时,吞吐量会迅速增加。

Image 16

与AMD Zen 4的对比: Lion Cove在后端内存延迟方面表现不如Zen 4,但前端延迟较小。Zen 4的数据侧内存子系统更强,L3缓存更大且延迟更低。尽管Intel和AMD在架构上有不同的优势,但游戏作为低IPC工作负载,对缓存和内存延迟的敏感性使得优化策略复杂。

结论: Lion Cove在多个方面表现出色,尤其是前端和大L2缓存的优势。然而,游戏作为低IPC工作负载,核心宽度利用率低,主要挑战在于处理长延迟的内存访问。Intel和AMD将继续优化CPU设计以适应不同工作负载的需求。

Image 17

评论总结

没有有效评论