NVIDIAは、米国ネバダ州ラスベガスにて現地時間2025年1月7日より開催中の「CES2025」において、エージェント型 AI を進化させる Nemotron モデル ファミリを発表した。
本稿は同社発表ブログを元に、その概要をお伝えする。
人工知能はエージェント型AIという新たな段階へ
人工知能は、専門のエージェントのチームが複雑な問題を解決し、反復的なタスクを自動化するのを支援できる、エージェント型AIという新しい時代に入りつつある。
カスタムの AI エージェントを使用すると、さまざまな業界の企業がインテリジェンスを製造し、これまでにない生産性を実現できる。一方、これらの高度な AI エージェントには、エージェント型 AI の機能と能力に合わせて最適化された複数の生成 AI モデルのシステムが必要だ。
この複雑さにより、強力で効率的なエンタープライズ グレードのモデルの必要性がかつてないほど高まっている。
エンタープライズ エージェント AI の基盤を提供するために、NVIDIAからオープンな大規模言語モデル (LLM) の Llama Nemotron ファミリが発表された。
■Llamaで構築されたモデルは開発者によるAI エージェントの作成・展開をサポート
Llama で構築されたモデルは、顧客サポート、不正検出、製品サプライ チェーンと在庫管理の最適化など、さまざまなアプリケーションにわたって開発者がAI エージェントを作成し、展開するのに役立つ。
効果を発揮するには、多くの AI エージェントに言語スキルと、世界を認識して適切なアクションで応答する能力の両方が必要となる。
新しい NVIDIA Cosmos Nemotron 視覚言語モデル (VLM) と、ビデオ検索および要約用の NVIDIA NIM マイクロサービスにより、開発者は、自律マシン、病院、店舗、倉庫、スポーツ イベント、映画、ニュースからの画像やビデオを分析して応答するエージェントを構築できる。
ロボティクスや自律走行車向けの物理を考慮したビデオを生成したい開発者向けに、NVIDIA はNVIDIA Cosmos 世界基盤モデルも別途発表した。
オープンLlama NemotronモデルがAIエージェントの計算効率と精度を最適化
6億5000 万回以上ダウンロードされた、最も人気のある商用利用可能なオープン ソース モデル コレクションの 1つである Llama 基盤モデルを使用して構築された NVIDIA Llama Nemotron モデルは、AI エージェント開発用に最適化された構成要素を提供する。
これは、現在 NVIDIA API カタログを通じて入手可能である Llama 3.1 Nemotron 70B のような、最先端モデルの開発に対する NVIDIA のコミットメントに基づくものだ。
Llama Nemotron モデルは、強化されたエージェント機能のために、プルーニングおよびトレーニングを NVIDIA の最新技術と高品質のデータセットを用いて行なっている。
これらは、命令の追跡、チャット、関数の呼び出し、コーディング、および数学演算に優れており、幅広い NVIDIA アクセラレーテッド コンピューティング リソースで実行できるようにサイズが最適化されている。
Meta のバイス プレジデント兼 GenAI責任者である Ahmad Al-Dahel 氏は次のように述べている。
「エージェント型 AI は AI 開発の次のフロンティアであり、この機会を実現するには、効率的で正確な AI エージェントを提供するために LLM システム全体にわたるフルスタックの最適化が必要です。NVIDIA とのコラボレーションとオープン モデルへの共通の取り組みにより、Llama 上に構築された NVIDIA Llama Nemotron ファミリは、企業が独自のカスタム AI エージェントを迅速に作成するのに役立ちます」
■SAP や ServiceNowなどが新しい Llama Nemotronモデルを最初に使用する企業となる見込み
SAP や ServiceNow などの主要な AI エージェント プラットフォーム プロバイダーは、新しい Llama Nemotron モデルを最初に使用する企業の 1 つになる見込みだ。
SAP の最高 AI 責任者である Philipp Herzig 氏は次のようにコメントしている。
「複数の事業部門にまたがる複雑なタスクを解決するために連携する AI エージェントは、今日の生成 AI シナリオを超えた、まったく新しいレベルの企業生産性を実現するでしょう。SAP の Joule を通じて、何億人もの企業ユーザーがこれらのエージェントと対話し、かつてない速さで目標を達成します。NVIDIA の新しいオープン Llama Nemotron モデル ファミリは、ビジネス プロセスを変革する複数の特殊な AI エージェントの開発を促進することでしょう」
さらにServiceNow のプラットフォーム AI 担当副社長、Jeremy Barnes 氏は次のようには話す。
「AI エージェントにより、組織はより少ない労力でより多くの成果を達成できるようになり、ビジネス変革の新たな基準が確立されます。NVIDIA のオープン Llama Nemotron モデルのパフォーマンスと精度の向上により、あらゆる業界の機能にわたる複雑な問題を解決する高度な AI エージェント サービスが構築できるのです」
NVIDIA Llama Nemotron モデルは、蒸留、プルーニング、アラインメントに NVIDIA NeMo を活用します。これらの技術を使用することで、モデルはさまざまなコンピューティング プラットフォームで実行できるほど小さくなり、高い精度とモデル スループットの向上が実現する。
Llama Nemotron モデル ファミリは、ダウンロード可能なモデルとして、またクラウド、データセンター、PC、ワークステーションに簡単に展開できる NVIDIA NIM マイクロサービスとして提供される。
これらのモデルは、信頼性が高く、安全で、エージェント型 AI アプリケーション ワークフローにシームレスに統合され、業界をリードするパフォーマンスを企業に提供する。
NVIDIA NeMo でビジネス ナレッジをカスタマイズして接続
Llama Nemotron および Cosmos Nemotron モデル ファミリは Nano、Super、Ultra のサイズで提供され、あらゆる規模で AI エージェントを展開するためのオプションを提供する。
・ Nano: 低遅延のリアルタイム アプリケーション向けに最適化された最もコスト効率の高いモデルで、PC やエッジ デバイスへの展開に最適。
・ Super: 単一の GPU で優れたスループットを提供する高精度モデル。
・ Ultra: 最高のパフォーマンスを要求するデータセンター規模のアプリケーション向けに設計された最高精度のモデル。
企業は、NVIDIA NeMo マイクロサービスを使用して、特定のユースケースやドメインに合わせてモデルをカスタマイズ。データ キュレーションを簡素化して、モデルのカスタマイズと評価を加速させ、ガードレールを適用して応答を順調に進めることもできる。
NVIDIA NeMo Retriever を使用すると、開発者は検索拡張生成 (RAG) 機能を統合して、モデルをエンタープライズ データに接続することも可能だ。
また、エージェント型 AI 用NVIDIA Blueprint を使用すると、企業は NVIDIA の高度な AI ツールとエンドツーエンドの開発専門知識を使用して、独自のアプリケーションをすばやく作成できる。
実際、NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron、および NeMo Retriever は、本日別途発表されたビデオ検索および要約用の新しい NVIDIA Blueprint を強化する。
NeMo、NeMo Retriever、および NVIDIA Blueprint はすべて、NVIDIA AI Enterprise ソフトウェア プラットフォームで利用できる。
提供予定
Llama Nemotron および Cosmos Nemotron モデルは、まもなく、ホストされた API として、および build.nvidia.com および Hugging Face からダウンロードして利用できる。NVIDIA Developer Program のメンバーは、開発、テスト、研究のためのアクセスが無料となる。
企業は、アクセラレーテッド データセンターとクラウド インフラ上の NVIDIA AI Enterprise ソフトウェア プラットフォームを使用して、Llama Nemotron および Cosmos Nemotron NIM マイクロサービスを本番環境で実行できる。
関連情報
https://www.nvidia.com/ja-jp/events/ces/
構成/清水眞希