NVIDIAは、2024年7月28日から8月1日までアメリカ・デンバーにて開催されたコンピュータグラフィクス分野の世界的カンファレンス、SIGGRAPH2024において、世界規模でのヒューマノイド開発を加速するために次世代のヒューマノイド ロボティクスの開発、トレーニング、構築のための一連のサービス、モデル、コンピューティング プラットフォームなどを世界の大手ロボットメーカーやAIモデル開発者、ソフトウェア メーカーに提供することを発表した。
本稿では同社リリースを元に、その概要をお伝えする。
NVIDIA NIMとOSMOによる開発の加速
今回の発表により、ロボットのシミュレーションと学習のための新しいNVIDIA NIMマイクロサービスとフレームワーク、マルチステージのロボティクス ワークロードを実行するためのNVIDIA OSMOオーケストレーション サービス、開発者が少量の人間のデモンストレーション データを使用してロボットをトレーニングできる AIとシミュレーション対応の遠隔操作ワークフローなどが提供される。
NIMマイクロサービスは、NVIDIA推論ソフトウェアを搭載した事前構築済みのコンテナーを提供し、開発者は展開に要する時間を数週間から数分に短縮できます。2つの新しいAIマイクロサービスにより、ロボット開発者は、NVIDIA Omniverseプラットフォーム上に構築されたロボティクス シミュレーションのリファレンス アプリケーションであるNVIDIA Isaac Simで、生成物理AIのシミュレーション ワークフローを強化できる。
MimicGen NIMは、Apple Vision Proなどの空間コンピューティング デバイスから記録された遠隔操作データに基づいて合成モーション データを生成。Robocasa NIMは、OpenUSDでロボット タスクとシミュレーション対応環境を生成する。OpenUSDは、3Dワールド内での開発とコラボレーションのためのユニバーサル フレームワークだ。
提供が開始されたNVIDIA OSMOは、オンプレミスでもクラウドでも、分散コンピューティング リソース全体で複雑なロボット開発ワークフローをオーケストレーションおよび拡張できるクラウド ネイティブなマネージド サービスだ。
OSMOはロボットのトレーニングとシミュレーションのワークフローを大幅に簡素化し、展開と開発のサイクルを数か月から 1 週間未満に短縮する。ユーザーは、ヒューマノイド、自律移動ロボット、産業用マニピュレーターの合成データの生成、モデルのトレーニング、強化学習の実施、大規模なソフトウェアインザループ (SIL) テストの実装など、さまざまなタスクを可視化して管理できる。
ヒューマノイド ロボット開発者向けのデータ キャプチャ ワークフローの進化
ヒューマノイド ロボットの基盤モデルをトレーニングするには、膨大な量のデータが必要だ。人間のデモンストレーション データをキャプチャする方法の一つは遠隔操作を使用することだが、これはますますコストがかかり、時間のかかるプロセスになりつつある。
SIGGRAPHコンピューター グラフィックス カンファレンスでデモされたNVIDIA AIおよびOmniverse対応の遠隔操作リファレンス ワークフローにより、研究者やAI開発者は、リモートでキャプチャされた最小限の人間のデモンストレーションから、大量の合成モーションおよび知覚データを生成できる。
まず、開発者はApple Vision Proを使用して、少数の遠隔操作デモンストレーションをキャプチャする。次に、NVIDIA Isaac Simで記録をシミュレーションして、MimicGen NIM を使用して記録から合成データセットを生成する。
開発者は、実際のデータと合成データを使用してProject GR00Tヒューマノイド基盤モデルをトレーニングし、開発者が時間を短縮してコストを削減することができるようにする。
次に、ロボット学習フレームワークであるIsaac Lab の Robocasa NIMを使用して、ロボット モデルを再学習するためのエクスペリエンスを生成。ワークフロー全体を通じて、NVIDIA OSMO はコンピューティング ジョブをさまざまなリソースにシームレスに割り当てるため、開発者は数週間に及ぶ管理タスクを省くことができる。
汎用ロボット プラットフォーム企業である Fourier は、シミュレーション テクノロジを使用して学習 データを合成的に生成することの利点を評価している。
FourierのCEOであるAlex Gu氏は次のように話す。
「ヒューマノイド ロボットの開発は極めて複雑で、現実世界から手間暇かけて収集した膨大な量の実際のデータが必要です。NVIDIA の新しいシミュレーションおよび生成 AI 開発者ツールは、モデル開発ワークフローの立ち上げと加速に役立ちます」
■NVIDIAヒューマノイド開発者向けテクノロジへのアクセスの拡大
NVIDIAは、ヒューマノイド ロボティクスの開発を容易にするために、3つのコンピューティング プラットフォームを提供している。
モデルをトレーニングするためのNVIDIA AIスーパーコンピューター、ロボットがシミュレートされた世界でスキルを学習して磨くことができるOmniverse上に構築されたNVIDIA Isaac Sim、およびモデルを実行するためのNVIDIA Jetson Thor ヒューマノイド ロボット コンピューターだ。開発者は、特定のニーズに合わせて、プラットフォームのすべて (または一部) にアクセスし、使用できる。
新しいNVIDIA Humanoid Robot Developer Programを通じて、開発者は新しい製品や、NVIDIA Isaac Sim、NVIDIA Isaac Lab、Jetson Thor、Project GR00T 汎用ヒューマノイド基盤モデルの最新リリースに早期アクセスできる。
1x、Boston Dynamics、ByteDance Research、Field AI、Figure、Fourier、Galbot、LimX Dynamics、Mentee、Neura Robotics、RobotEra、Skild AI などが、早期アクセス プログラムに最初に参加する企業だ。
Boston Dynamicsの最高技術責任者である Aaron Saunders氏は次のようにコメントしている。
「Boston Dynamics と NVIDIAは、ロボティクスの可能性の限界を押し広げるために、長年にわたって緊密に協力してきました。この取り組みの成果が業界全体を加速させていることを非常にうれしく思っており、早期アクセス プログラムはクラス最高のテクノロジにアクセスする素晴らしい方法です」
NVIDIAの創業者/CEO であるジェンスン フアン (Jensen Huang) 氏は次のように述べている。
「AIの次の波はロボティクスであり、最もエキサイティングな開発の 1 つはヒューマノイド ロボットです。NVIDIA は、NVIDIA ロボティクス スタック全体を進化させ、世界中のヒューマノイド開発者や企業がニーズに最適なプラットフォーム、アクセラレーション ライブラリ、AIモデルを利用できるようにしています」
関連情報(英文)
https://nvidianews.nvidia.com/news/nvidia-accelerates-worldwide-humanoid-robotics-development
構成/清水眞希