高度計算機はHPCテックにお任せください。

03-5643-2681
お問い合わせ
English

GPU Solution:NVLink

4U 8GPU NVIDIA A100 搭載 NVLINK + NVSwitch ラックマウント型計算機

 

NVIDIA A100 40GB x8、80GB x8 モデル

 ▶ A100 40GB (HBM2)  :合計 320GB GPU Memory
 ▶ A100 80GB (HBM2e):合計 640GB GPU Memory

 

 

HPCT RS4E32-8GN は 新アーキテクチャ「Ampere」をベースとした最新の NVIDIA A100 Tensor Core GPUs を8基搭載した 4U ウルトラハイエンド GPU サーバです。NVIDIA HGX A100 プラットフォームを採用し、PCIe モデルとは違い NVLINK と NVSwitch が連動し、1 つのノード内で NVLink の速度を落とすことなく全 GPU 間の通信を可能にしました。
NVSwitch とは、1台のノードで完全に接続された GPU を 8~16基サポートすることができる オンノード スイッチ アーキテクチャ です。600 GB/s という驚異の性能で、すべての GPU ペア間で同時に通信することができます。機械学習の膨大なデータセット、爆発的に増大するディープラーニングのモデル、HPC のシミュレーションなどに威力を発揮します。プロセッサには AMD EPYC 7003 シリーズ(開発コード名:Milan)を搭載し、メモリは DDR4-3200MHz を最大 4TB まで搭載することができます。

お客様の用途に合わせ幅広くカスタマイズすることができますので、担当営業までお気軽にご相談ください。設置作業などもオプションで行いますので是非ともご相談ください。お待ちしております。

 

 

 

 

 

 

▶ HPCT RS4E32-8GN 主な特徴

・4U ラックマウント
・AMD EPYC 7003 シリーズ(開発コード名:Milan)を2基搭載
 【最大合計128コア】
・NVIDIA A100-SXM4 8基搭載(40GB HBM2 or 80GB HBM2e)
 NVIDIA NVLINK + NVIDIA NVSwitch
・DDR4-3200 を32枚搭載【最大4TB】
 (搭載可能なメモリ量についてはご相談ください)
・ホットスワップ NVMe 2.5 インチ 6 ベイ搭載
 SATA SSD / NVMe U.2 SSD Hybrid Storage
・PCI-E 4.0(x16 )x8 PCI-E switch 経由
・PCI-E 4.0(x16)LP x1 and PCI-E 4.0(x8)x1 LP CPU 経由
・ネットワーク
 10GBase-T や 200Gb/s InfiniBand 等幅広く選択可
 (管理・監視用 RJ45 1GbE IPMI Management Port 搭載)
・2200W Redundant Platinum Level Power Supplies

 

 

▶ NVIDIA NVSWITCH

ディープラーニングの急速な導入により、マルチ GPU システムでは PCle 帯域幅がしばしばボトルネックとなるため、さらに高速でスケーラブルな相互接続が必要となります。
NVIDIA NVSwitch は NVLink の高度な通信機能を使い、劇的に帯域幅を拡大し遅延を減らすことが可能です。
1台のサーバにより多くの GPU を搭載し、GPU 間の全帯域幅で相互接続・高速通信を実現することでディープラーニングのパフォーマンスをさらに向上させることができます。

 

わかりやすいように 2基の GPU を接続しています。
NVSwitch を介して 8基または 16基の GPU がすべて同じように接続されます。

 

 

ー  NVLink パフォーマンス  ー

 

 

▶ AMD EPYC プロセッサ 7003 シリーズ特徴

・最新 “Zen3” コアによる性能向上
 最大 64コア/128スレッド
 コアあたり 32MB の x86 最大容量の L3 キャッシュ
 TDP 155W - 280W
・1CPU あたり 8 チャンネル DDR4-3200(4ch、6ch サポート)
 帯域幅ピーク 204.8GB/s、4TB メモリサポート
・128 レーン PCIe4
・SMT & Turbo boost
・18GT/s AMD Infinity Fabric
・セキュリティ機能の拡張
・Infinity Fabric とメモリ・クロックの同期

 

 各モデルの仕様などはこちらからご覧ください

 

   ご参考にしてください

 

 

▶ HPC 専用高性能 DRAM 搭載メモリ使用

HPCテックでは、高い品質と信頼性を要求されるスーパーコンピュータやデータセンターで利用する為に製造されたメモリを使用しています。

 

1. メモリに使用しているDRAMは全て同じ型番になるよう品番管理をしています。

   完成した製品にメモリ特性のばらつきがありません。
_

2. 高性能なDRAMにより低発熱、省電力を実現しています。

   DRAMの個数が半分なので、他の製品に比べ50~60%になります。
_

3. 製造後に実機負荷テストを全品に実施してから出荷しています。

   通常製品はテスタによるパターンテストか、抜き取りのテストのみ。
   なお、出荷済みメモリモジュールのテスト内容と結果に関するレポート提出も可能です
   (別途オプション)

   詳しくはこちらよりご覧ください

 

 

▶ 各種セットアップサービス等のご案内

HPCテックでは導入後すぐに研究開発を行っていただけるように、OS やアプリケーションのインストール、並列環境構築などを行っています。下記バナーより設定内容などをご覧いただき、もしも必要な設定などの掲載が無い場合はお気軽にお問合わせください。

   設定内容等はこちらよりご覧ください

 

 

▶ サポートサービス

標準保証ではセンドバックハードウェア保証1年が付きます。オプションにて3年センドバック保証やオンサイトサポートもご利用頂けます。また、センドバックハードウェア1年保証が終了した場合でもご希望のお客様には、有償にて保証を延長することができます。
お気軽にお問合わせください。

 

 

製品仕様

製品名

4U 8GPU NVIDIA A100 搭載 NVLINK + NVSwitch

ラックマウント型計算機

型番

HPCT RS4E32-8GN

CPU

・Dual AMD EPYC 7003/7002 Series Processors
・Socket SP3
・Supports CPU TDP up to 280W
・Up to 128 Cores (64/cpu)

GPU Support Supported GPUs ・Supports HGX A100 8-GPU
40GB (HBM2) or 80GB(HBM2e)
with NVLink/NVSwitch
GPU interconnect and PCI-E Gen4 host CPUs
CPU-GPU Interconnect ・PCI-E Gen 4 x16 Switch CPU-to-GPU Interconnect
GPU-GPU Interconnect ・NVIDIA NVLink with NVSwitch GPU-GPU Interconnect

Memory

Capacity

・32 DIMM slots
・Up to 4TB 3DS ECC DDR4-3200MH RDIMM/LRDIMM

Type

・3200MHz ECC DDR4 RDIMM/LRDIMM

On-Board Devices Chipset ・System on Chip (SoC)
SATA ・SATA3 (6Gbps)
Network Controllers ・Provided via AIOM
IPMI ・Support for Intelligent Platform Management Interface v.2.0
・IPMI 2.0 with virtual media over LAN and KVM-over-LAN support
Graphics ・ASPEED AST2600 BMC
Input / Output SATA

・4 SATA3 (6Gbps) ports

LAN

・Provided by AIOM
・1 RJ45 Dedicated IPMI LAN port

USB

・2 USB 3.0 ports (front)

VGA ・1 VGA Connector (front)
COM Port ・1 COM port (header)
System BIOS

・AMI 256Mb SPI Flash ROM

Management Software ・IPMI 2.0
・KVM with dedicated LAN
・SSM, SPM, SUM
・SuperDoctor 5
・Watchdog
Form Factor ・4U Rackmount

Dimensions

Width

・446mm

Height ・174mm
Depth ・900mm

Expansion Slots

PCI-Express

・8 PCI-E 4.0 x16 via PCI-E switch - supporting HGX A100 8-GPU's 1:1 connection to 8 NICs
・1 PCI-E 4.0 x16 LP and 1 PCI-E 4.0 x8 LP via CPUs

Drive Bays Hot-swap ・6 hot-swap U.2 NVMe 2.5" drive bays (4 via PCI-E switch, 2 via CPU, SATA/NVMe Hybrid or SAS with optional HBA)
(up to 10 hot-swap U.2 NVMe 2.5" available)
System Cooling Fans ・4 x Hot-swap 11.5K RPM heavy duty fans
Power Supply ・2200W Redundant Platinum Level Power Supplies
Total Output Power ・1000W with Input 100 - 127Vac
・2200W with Input 220 - 240Vac (for UL/cUL only)
・2090W with Input 230 - 240Vdc (for CQC only)
Input ・1000W : 100-127 Vac / 12-9.5 A / 50-60 Hz
・1800W : 200-220 Vac / 10-9.5 A / 50-60 Hz
・1980W : 220-230 Vac / 10-9.5 A / 50-60 Hz
・2090W : 230-240 Vac / 10-9.8 A / 50-60 Hz
・2200W : 220-240 Vac / 11.8-9.6 A / 50-60 Hz (for UL/cUL only)
・2090W : 230-240 Vdc / 10-9.8 A / 50-60 Hz (for CQC only)
Environmental Spec. Operating Temperature : 10°C to 35°C (50°F to 95°F)
保証期間

・標準1年センドバック
(3年センドバック及びオンサイトサポートオプション)

OS ------- 標 準 -------
・Linux x86_64

----- オプション -----
・Red Hat Enterprise Linux(有償)

特に指定がない場合は、動作検証のとれたパッケージやアップデートを適用してお届けします。
各種バージョン、その他のディストリビューションについてはお問合わせください。
その他 各種セットアップサービス等のご案内

 

【製品仕様についてのご注意】

・画像はイメージです。
・仕様は予告なく変更となることがあります。
・納品時の製品に変更や改造を加えられた場合はサポート対象外になります。
・Intel、インテル、Intel ロゴ、Xeon、Xeon Inside は、アメリカ合衆国及びその他の国における
 Intel Corporation の商標です。
・NVIDIA、NVIDIA のロゴ、 CUDA、 NVLINK、Pascal、Teslaは、アメリカ合衆国およびその他
 の国におけるNVIDIA Corporation の商標または登録商標です。
・その他、記載されている会社名、製品名、サービス名等は、各社の商標または登録商標です。

弊社では、科学技術計算や解析などの各種アプリケーションについて動作検証を行い、
すべてのセットアップをおこなっております。

お客様が必要とされる環境にあわせた最適なシステム構成をご提案いたします。

各種カスタマイズ・詳細なお見積はこちらからお問い合わせください。

製品案内