2022/03/02
NVIDIA A100 Tensor Core GPU 搭載サーバと静音ラックを導入頂きました。
京都工芸繊維大学 数値材料デザイン研究室 高木知弘教授、坂根慎治助教 にお話を伺いました。
京都工芸繊維大学 数値材料デザイン研究室様は、大規模 3次元フェーズフィールド凝固計算など複数の GPUを活用したシミュレーションの研究報告や論文など数多くあり、スーパーコンピュータ TSUBAME を用いた大規模計算では GPU 1基あたりのメモリサイズに制約されず計算規模を拡張するなどの結果を出されていらっしゃいます。
この度HPCテックは小型スパコンとも言えるGPU搭載サーバを、ご提案から設置まで行いました。
今回、高木先生と坂根先生より貴重なお時間をいただき、研究をされている内容や、手元で使えるGPU搭載サーバの使用感、共用利用が前提のスパコンと比べて良いところや悪いところなどをお聞きしました。
数値材料デザイン研究室様はフェーズフィールド法 (phase-field method)を中心とする様々な数値モデルや数値解析手法を用いることで、一連の加工工程で形成される材料組織を予測する技術の開発とそれらを用いた現象解明に関する研究をされています。また、材料組織予測のみではなく、フェーズフィールド法を様々な現象や分野に適用する研究も進められています。
YouTube 機械工学系 高木知弘教授の研究テーマ「材料組織の高精度予測シミュレーション」の紹介動画
Q:研究室ではどのような研究をされているのか教えてください。
Phase-field 法を用いた材料組織形成のシミュレーションに関する研究を行っています.最近では、特に凝固組織予測に注力しており、デンドライトと呼ばれる樹枝状結晶の成長シミュレーションを行っています。凝固は、固液相変態、溶質や熱の輸送、液相流動、固体運動などが同時に生じるマルチフィジックス現象ですので、このような現象を効率的に再現可能な数値計算法の構築も行っています。Phase-field シミュレーションは GPU 計算と非常に相性がいいですので、当研究室で行っているほぼすべての数値シミュレーションは GPU を用いて行っています。
Computational Materials Design Lab., Kyoto Institute of Technology
Q:フェーズフィールド法や格子ボルツマン法などの解析で GPU サーバをお使いですが、
旧 GPU と 新 GPU で違い等は感じられましたでしょうか。
感想などをお聞きしたいと思います。
新しく導入した NVIDIA Tesla A100 は非常にパワフルですね。V100 に比べると計算速度は約 1.5倍、メモリは約 2.5倍となっています。大規模計算は東工大の TSUBAME を使わせて頂いていますが,現在のTSUBAME3.0 は P100 が搭載されていますので、P100 に比べると速度は約 2倍、メモリは約 5倍であり 、A100 の 8基並列計算は P100の 40基並列に対応します。Phase-field 法と実験観察結果をデータ同化で融合する研究も行っていますが、データ同化のように複数の計算を同時に走らせるような場合に威力を発揮しています。
京都工芸繊維大学 機械工学系 数値材料デザイン研究室 ホームページ
▶ HPCT RS4E32-8GP GPU : NVIDIA A100-PCIe x8 80GB HBM2e CPU : AMD EPYC 7003 Series x2 48Core 2.3GHz RAM : DDR4-3200 Total 1,024GB SSD : 1.92TB PCIe4(OS)x1 SSD : 7.68TB PCIe4(Data)x1 OS : Ubuntu 20.04 LTS |
▶ HPCT SR80 18U 防音特化型静音ラック GPU 計算機用改 騒音減衰量:-30.2dB(A) |
▶ HPCT SR45 12U 防音特化型静音ラック GPU 計算機用改 騒音減衰量:-26.3dB(A) |
▶ HPCT R426gs-10GPDL GPU : NVIDIA Tesla V100 x8 32GB HBM2 CPU : Xeon Gold 6200 Series x2 16Core 2.8GHz RAM : DDR4-2933 Total 768GB SSD : 960GB(OS)x1 HDD : 2TB(Data)x1 OS : Ubuntu 18.04 LTS |
営業担当コメント --------------------------------------------
HPC テックでは、今回ミニスパコンとも言える NVIDIA A100 を8基搭載したハイエンドサーバ HPCT RS4E32-8GP 1台 と NVIDIA TESLA V100 32GB を 8基搭載したハイエンドサーバ HPCT R426gs-10GP 1台、サーバルームではなく居室に設置されるとのことで静音ラック HPCT SR80 のご提案をしました。大きな特徴は 1CPU あたり DDR4-3200を 8チャンネル搭載できることと、PCI-Express Gen4 に対応したことで最新アーキテクチャの GPU や NVMe SSD などを使用することができるようになったことです。
Q:大規模な計算が出来ることではスーパーコンピュータには敵いませんが、手元に置いて使える
ミニスパコンの良さなどについてお話をお聞かせください。
なんと言っても取り回しの良さが抜群です。共有利用型のスーパーコンピュータの場合、ジョブを投入してから実際に計算が回り始めるまでにリソース確保のためのタイムラグがあるのですが、研究室マシンの場合それがありません。特に、コード開発・デバッグの際に小回りが利くため重宝しております。また、数日を超えるような長時間計算を連続的に実行できる点や、データ整理のための再計算が容易な点も研究を進めるにあたっての利点かと思います。
Q:導入されてまだ日は浅いと思いますが、導入後の感想やこれからの展望をお聞かせください。
GPU 1枚当たりのグローバルメモリサイズが 80GB になったことで、これまで複数の GPU を並列しないとできないような規模の計算が 1枚の GPU で計算可能になりました。これにより、開発コストの高い複数 GPU 並列コードの実装を飛ばして、計算コストの高い数値モデルの基礎的な性能評価が行えるようになり、特に研究初動の速度感が上がったように感じます。また、研究室に在籍するメンバーが実施する計算の内、大半は A100 のリソースを使いきれないような小規模な計算が主です。そこで、A100 から新しく追加された一枚の GPU を最大 7枚の仮想 GPU に分割して個別に計算を実行するマルチインスタンス GPU (MIG) 機能なども活用して、研究室マシンの有効活用を進めていきたいと考えております。
高木先生、坂根先生、ご多忙のところ HPCテック導入事例掲載にご協力をいただき誠にありがとうございました。これからも研究活動に少しでもお役にたてる様、スタッフ一同微力ながらお手伝いをさせていただきます。