评估规格 CPU2026

2026-05-23 1 阅读 zdw
评估 SPEC CPU2026 Chester Lam May 23, 2026 15 1 2 分享 SPEC 的 CPU 基准测试套件已成为一项长期建立的行业标准,在阅读各种出版物时几乎不可能错过。英特尔使用 SPEC CPU2000 来展示 Pentium 4 相对于 Pentium III 的改进。三星使用 SPEC CPU2000 和 SPEC CPU2006 跟踪来调整其 Mongoose 内核。 SPEC CPU2017 构成了英特尔对 Lion Cove 性能预测的一部分。现在,SPEC 已将其 CPU 基准测试套件更新为 SPEC CPU2026。新套件包含 52 个工作负载,而 SPEC CPU2017 中包含 43 个工作负载。单个工作负载由更多源代码行组成,以 KLOC(千行代码)衡量。 SPEC 的目标是对其 CPU 基准测试套件进行现代化改造,同时保留 SPEC 所特有的可移植性目标。由于 SPEC 在 CPU 性能领域的重要性,我将研究新套件的工作负载,以研究它们给 CPU 带来的挑战。我对硬件而不是编译器比较感兴趣,因此我将使用带有 -O3 和本机架构/优化目标的 GCC 14.2.0。我确实尝试过 GCC 15.2.0,但遇到了各种问题,并决定坚持使用 GCC 14.2.0 以节省时间。我正在使用 Linux 测试以下所有系统。分数 SPEC CPU 分数表示相对于参考系统的加速比。每次 SPEC CPU 更新都会更新参考系统,尽管并不总是更新为与最新硬件进行相关比较的参考系统。 Ampere eMAG 8180 系统为 SPEC CPU2026 提供 1.0 的参考分数。 Ampere 的 eMAG 比用于 SPEC CPU2017 的 Sun Fire V490 更快,就像 Cessna 172 可能比 Sopwith Camel 更快一样。与现代客机相比,两者都不是很好的比较。同样,Ampere eMAG 并不是一个广泛部署的平台,即使是早于它多年的系统也远远优于它。我听说使用较慢的系统背后的部分动机是让大多数系统获得高分,但这可以通过将参考分数设置为更高的数字来实现,例如 1000,而不是 1.0。 Geekbench 6采取了更合理的方法,将Core i7-12700校准到参考分数2500。与Ampere的eMAG不同,英特尔的Core i7-12700和类似的CPU广泛部署在消费类系统中,而英特尔今天在Xeon 6中使用了类似的核心架构。英特尔和AMD最新桌面CPU的示例显示在SPEC CPU2026的整数套件中表现相似,而Zen 5倾向于拉动在浮点测试中领先。我必须在仅达到 5.5 GHz 的 Lion Cove 核心上运行 SPEC CPU2026,因为两个支持 5.7 GHz 的核心很难在不崩溃的情况下完成测试套件。我的样本似乎有问题,但我怀疑在 5.7 GHz 下完成测试的 Lion Cove 核心会缩小差距。整数套件中的各个分数显示 Zen 5 和 Lion Cove 非常匹配,正如总分数所表明的那样。绝对分数显示了 Ampere eMAG 系统的领先程度。当前的桌面内核消除了 Ampere eMAG 中的内核,尤其是 706.stockfish。即使是已有十多年历史的 FX-8350 也可能是一个更好的参考点。它在几乎所有测试中都远远超过了 eMAG 系统。对于旧的 eMAG 系统来说,浮点工作负载甚至更糟。 Zen 5 在多个浮点工作负载方面表现出色。其中部分原因是 GCC 能够生成 AVX-512 指令。我使用英特尔的软件开发模拟器来获取每个工作负载最后一次调用的指令计数,以了解正在使用的指令类型。一些 SPEC CPU2026 测试运行多个命令来针对不同的输入数据测试相同的二进制文件,但我只分析了最后一次调用以节省时间。使用 GCC 14.2.0 编译时,706.stockfish、749.fotonik3d 和 765.roms 均包含 AVX-512 代码。其他一些测试也利用了 128 位或 256 位向量。工作负载难度:IPC 平均 IPC(或每周期指令数)可以粗略地了解 CPU 内核可以在多大程度上发挥其执行资源的作用。低 IPC 通常表示缓存未命中、分支预测错误,或者不太常见的是内核架构中的特定性能危险。高 IPC 表明性能更多地受到执行延迟、执行资源或核心宽度的限制。当然,IPC 不应与实际性能混淆,实际性能取决于时钟速度以及每条指令完成的工作。在 AMD 的 Zen 5 和英特尔的 Lion Cove 上,SPEC CPU2026 的整数套件比 SPEC CPU2017 的整数套件显示出更高、更紧密的 IPC 分布。 IPC 分布感觉与 Geekbench 6 接近,后者倾向于强调核心吞吐量,很少有分支错误预测或末级缓存未命中。更新套件后,浮点工作负载在 Zen 5 上得到更广泛的分布,而 SPEC CPU2017 的浮点测试往往集中在 2-3 个 IPC 左右。 Lion Cove 较旧的浮标具有更广泛的 IPC 分布