2023/02/15
AMD社から、サーバおよびデータセンター向けプロセッサ EPYC 9004 シリーズ(開発コードネーム:Genoa)が発表されました。新たに ZEN4アーキテクチャを採用し、コア数が最大 96コアとなりメモリチャンネル数が 12になるなど大きく性能が向上したことを発表しています。
HPC テックでは定期的にベンチマークを行っており、今回は AMD EPYC 9654P(1CPU システム用)を入手し性能調査をいたしました。今回は HPL と姫野ベンチの結果を公開したいと思います。
テスト環境1 | テスト環境2 | テスト環境3 | テスト環境4 | |
CPU | 4th Gen AMD EPYC 9654P x1 Genoa (96Core, 2.4GHz) |
3rd Gen AMD EPYC 7713 x2 Milan (64Core, 2.0GHz) |
4rd Gen Intel Xeon Platinum 8490H x2 Sapphire Rapids-SP (32Core, 2.6GHz) |
3rd Gen Intel Xeon Platinum 8358 x2 Ice Lake-SP (32Core, 2.6GHz) |
MEMORY | DDR5-4800 384GB |
DDR4-3200 512GB |
DDR4-3200 1TB |
DDR4-3200 1TB |
OS | AlmaLinux8.7 | Ubuntu20.04 | RockyLinux8.7 | AlmaLinux9.1 |
各 CPU の仕様や特徴
3rd Gen AMD EPYC 7003 Series
4rd Gen Intel Xeon Scalable family
3rd Gen Intel Xeon Scalable family
CPUあたり 96コアあるため全体的に性能が高く、Intel最上位の Xeon Platinum 8490H x2(開発名:Sapphire Rapids-SP)と比べて 65%程度なので AMD EPYC 9654Pで 2CPU運用した場合は同じかそれ以上と考えられ、前世代の AMD EPYC 7713 x2と Intel Xeon Platinum 8358 x2の性能 を 1CPUで超えてしまっています。対 AMD EPYC 7713 x2 ではコア数が少ないものの動作コアクロック分性能が高く、対 Xeon 8358 x2ではコア数と SIMD使用時の動作クロック低下の少なさが要因と考えられます。
・・・・・・・・・・・ HPL-2.3 比較 ・・・・・・・・・・・
・・・・・・ HPL-2.3 スケール N=216000 ・・・・・・
メモリ帯域を使いきったためか大体 32並列程度まで加速しその後律速しています。 64並列以降はグラフ上で 32並列からかなり落ちたように見えていますが 32並列の時にたまたま上振れしたためです 。グラフでは Intel Xeon 8490Hが 120並列まで伸ばして最速に見えますが 2CPUで合計 16チャンネルを利用していることが最速の理由で、シングル利用した場合は 90,000MFlops程度になります。対 AMD EPYC 7713と 対 Intel Xeon Platinum 8358 については 16チャンネルを使ったとしてもバンド幅が 409.6GB/sで AMD EPYC 9654P の 460.8GB/sに追いつかないため妥当と考えられます。
・・・・・・ 姫野ベンチマーク スケール ・・・・・・
ベンチマークの結果、AMD EPYC 9654Pは CPU性能とメモリ性能が格段に上がり、前世代と比較して約 2倍の性能向上を確認することができました。コア数とメモリバンド幅の向上で前世代の CPU並びに Intel CPUを大きく引き離しています。新しく追加された AVX512については 256bitレジスタを使い 2クロックで動作するため、今回は Intel CPUのような性能の上がり方を見ることが出来ませんでした。
その他、OpenFOAM 22.06や NAMD 2.14、COMSOL 6.1などのベンチマークも HPCテックでは行っています。お気軽に担当営業までお問い合わせください。お待ちしております。
HPC テックでは AMD EPYC プロセッサ搭載サーバの無償貸出を行っています。サーバルーム等が無く騒音問題をクリアできないような場合は、弊社ラボにてテストを行っていただくこともできます。
詳しくは担当営業までお問い合わせください。