NVIDIAは、高度なAIファクトリーを支えるアーキテクチャを垣間見ることができるデータセンター規模の最新スーパーコンピューター「Eos」を紹介するビデオを公開した。
これが初披露となったEosは、極めて大規模なNVIDIA DGX SuperPODであり、NVIDIAの開発者が、アクセラレーテッド コンピューティング インフラストラクチャと完全に最適化されたソフトウェアを使用して、AIのブレイクスルーを生み出す場所でもある。
この件に関するブログが同社サイトで掲載されたので、その概要をお伝えする。
ちなみにEosは、暁の門を毎日開いているされるギリシャ神話の女神にちなんで名付けられたもので、AI技術の進歩に対するNVIDIAのコミットメントを反映したものだ。
イノベーションを促進するEosスーパーコンピューター
Eos は、NVIDIA DGX H100システム576台、NVIDIA Quantum-2 InfiniBand ネットワーキングおよびソフトウェアで構築され、合計18.4エクサフロップスの FP8 AI性能を提供する。
各DGX H100システムには、8基のNVIDIA H100 TensorコアGPUが搭載され、Eosは合計4608基のH100 GPUを搭載している。
その結果、Eosは大規模言語モデル、レコメンダー システム、量子シミュレーション、その他をトレーニングするための最大規模の AI ワークロードの処理が可能だ。
これは、NVIDIAのテクノロジが、大規模に動作することで何ができるかを示すショーケースでもある。
創薬からチャットボット、自律型マシン、そしてその先に至るまで、人々は生成AIで世界を変えようとしている。
こうしたブレイクスルーを達成するためには、AIの専門知識や開発スキル以上のものが必要となる。必要なのはAIファクトリーであり、いつでも利用可能で、AIモデルを大規模に構築する能力を高めることができる専用AIエンジンだ。
Eos がそれを実現する。世界最速のスーパーコンピューターのTOP500リストの9位にランクインした Eosは、AI技術とインフラの限界を押し広げるはずだ。
これには、NVIDIA Base CommandやNVIDIA AIEnterpriseなどの洗練されたソフトウェア製品とともに、NVIDIAの高度なアクセラーテッド コンピューティングとネットワーキングが含まれている。
■AI 能力の拡張を目指す企業にとって理想的なソリューション
Eosのアーキテクチャは、アクセラレーテッド コンピューティング ノードの大規模クラスタ間で超低レイテンシかつ高スループットの相互接続を必要とする AI ワークロード向けに最適化されており、AI 能力の拡張を目指す企業にとって理想的なソリューションとなっている。
インネットワーク コンピューティング テクノロジを搭載したNVIDIA Quantum-2 InfiniBandに基づくそのネットワーク アーキテクチャは、毎秒最大 400Gb のデータ転送速度をサポートし、複雑なAIモデルのトレーニングに不可欠な大規模データセットの迅速な移動を容易にする。
Eosの心臓部には、NVIDIAのDGX H100システムを搭載した画期的なDGX SuperPODアーキテクチャがある。
このアーキテクチャは、Aとコンピューティングの分野に、巨大なスケールでコンピューティングできる緊密に統合されたフルスタック システムを提供するために構築されている。
世界中の企業や開発者がAIのパワーを活用は極めて重要なリソースとして、あらゆる組織に活力を与えるAIを取り入れたアプリケーションへの道を加速させることを約束するものだ。
関連情報
https://blogs.nvidia.co.jp/2024/02/20/eos/
構成/清水眞希