2024年は生成 AI が旋風を巻き起こし、イノベーションや創造性を高め、顧客サービスの向上、製品開発の変革、さらにはコミュニケーションの促進のため、このテクノロジをどのように活用するのがベストなのか、業界を超えて活発な議論が交わされた。
IDC によると、世界中の企業が AI ソリューションに費やす金額は、来年には3070億ドルに達し、2028年には6320 億ドルに成長すると予測されている。
そんな中、NVIDIAの各業界のエキスパートは、すでに今後1年の期待を語り始めている。
本稿では企業、研究、およびスタートアップ エコシステムにわたる AI のイノベーションを推進する企業エキスパートたちの見解を、同社掲載ブログより紹介する。
次なる大きなトレンドは自律型または「推論型」AI の一種であるエージェント AI
イアン・バック氏 ハイパースケールおよび HPC 担当副社長
推論が AI の推進力となります。AIモデルの規模と複雑さが増すにつれて、効率的な推論ソリューションの需要が高まります。
生成型 AI の台頭により、推論は単純なクエリと応答の認識から、複数のソースや OpenAI o1 や Llama 450B などの大規模言語モデルからの要約を含む複雑な情報生成へと変化し、計算需要が劇的に増加しています。新しいハードウェア イノベーションと継続的なソフトウェア改善により、パフォーマンスが向上し、総所有コストが 5 倍以上削減されると予想されます。
<すべてを高速化>
GPU の採用が進むにつれて、業界では計画から生産まですべてを高速化することを目指すようになります。新しいアーキテクチャはこの好循環に加わり、世代ごとにコスト効率と桁違いのコンピューティング パフォーマンスを実現します。
国や企業がさらに多くのワークロードを加速するために AI ファクトリーの構築を競う中、多くの企業が、数か月ではなく数週間でデータセンターを稼働させることができるプラットフォーム ソリューションやリファレンス データセンター アーキテクチャまたは設計図を探すようになると予想されます。これは、量子コンピューティングや創薬など、世界で最も困難な課題のいくつかを解決するのに役立ちます。
<量子コンピューティング — 試行錯誤を繰り返し、エラーなし>
研究者がスーパーコンピューティングとシミュレーションに注力し、この新興分野の最大の課題であるエラーを解決することで、量子コンピューティングは大きな進歩を遂げるでしょう。
量子コンピューティングにおける情報の基本単位である量子ビットはノイズの影響を受けやすく、数千回の演算を実行するだけで不安定になります。このため、現在の量子ハードウェアでは有用な問題を解決できません。2025 年には、量子コンピューティング コミュニティが困難ではあるが重要な量子エラー訂正技術へと移行することが予想されます。エラー訂正には、高速で低遅延の計算が必要です。また、専用のインフラストラクチャによってサポートされ、スーパーコンピューター内に物理的に共存する量子ハードウェアも登場することが予想されます。
AI は、これらの複雑な量子システムの管理、エラー訂正の最適化、量子ハードウェア全体のパフォーマンスの向上においても重要な役割を果たします。量子コンピューティング、スーパーコンピューティング、AI を高速量子スーパーコンピューターに統合することで、創薬、材料開発、物流など、さまざまな分野にわたる複雑な問題を解決するための量子アプリケーションの実現が促進されます。
ブライアン・カタンザロ氏 応用ディープラーニング研究担当副社長
<AI に顔をつける>
AI はより使いやすくなり、感情に反応し、創造性と多様性が増します。絵を描く最初の生成 AI モデルは、歯を描くなどの単純な作業に苦労しました。AI の急速な進歩により、画像やビデオの出力はよりフォトリアリスティックになり、AI が生成した音声はロボットのような感じが薄れつつあります。
これらの進歩は、アルゴリズムとデータセットの改良、そして 80 億人の人々に AI が意味を持つためには顔と声が必要であるという企業の認識によって推進されます。これにより、ターンベースの AI 対話からより流動的で自然な会話への移行も起こります。AI との対話は、もはや一連のやり取りのようには感じられず、より魅力的で人間らしい会話体験を提供します。
<産業インフラと都市計画の再考>
世界人口が減少する中でも、国や産業は AI が経済のさまざまな側面を自動化して現在の生活水準を維持する方法を検討し始めるでしょう。
こうした取り組みは、持続可能性と気候変動の解決に役立つ可能性があります。たとえば、農業業界では、畑を掃除し、害虫や雑草を機械的に除去できる自律型ロボットへの投資が開始されます。これにより、殺虫剤や除草剤の必要性が減り、地球がより健全な状態になり、人的資本が他の有意義な貢献のために解放されます。都市計画局では、自律走行車を考慮し、交通管理を改善するための新しい考え方が見られるようになるでしょう。
長期的には、AI は、緊急の世界的課題である炭素排出量の削減と炭素貯蔵の解決策を見つけるのに役立ちます。
KARI BRISKI氏 ジェネレーティブAIソフトウェア担当副社長
<エージェントのシンフォニー — AI オーケストレーター>
企業は、顧客サービス、人事、データ セキュリティなどを支援するために社内ネットワーク全体で機能する半自律型のトレーニング済みモデルである AI エージェントを多数導入することになります。これらの効率を最大化するために、多数のエージェント間で機能し、人間の問い合わせをシームレスにルーティングし、集合的な結果を解釈してユーザーへの推奨やアクションを実行する AI オーケストレーターの増加が予想されます。
これらのオーケストレーターは、PDF からビデオ ストリームまで、より深いコンテンツ理解、多言語機能、および複数のデータ タイプへの対応力にアクセスできます。自己学習型データ フライホイールを搭載した AI オーケストレーターは、ビジネス固有の洞察を継続的に改善します。たとえば、製造業では、AI オーケストレーターがリアルタイム データを分析し、生産スケジュールやサプライヤーとの交渉に関する推奨事項を作成することで、サプライ チェーンを最適化できます。
エンタープライズ AI のこの進化により、業界全体で生産性とイノベーションが大幅に向上するとともに、よりアクセスしやすくなります。ナレッジ ワーカーは、AI を活用した専門家のパーソナライズされたチームを活用できるため、生産性が向上します。開発者は、カスタマイズ可能な AI ブループリントを使用して、これらの高度なエージェントを構築できます。
マルチステップ推論により AI の洞察力が強化されます。AIは長年にわたり、特定のクエリのコンテキストを詳しく調べることなく、特定の質問に対する回答を提供することに長けていました。アクセラレーテッド コンピューティングと新しいモデル アーキテクチャの進歩により、AI モデルはますます複雑化する問題に対処し、より正確でより深い分析で応答できるようになります。
AI システムは、マルチステップ推論と呼ばれる機能を使用して、大規模で複雑な問題を小さなタスクに分割し、場合によっては複数のシミュレーションを実行して、さまざまな角度から問題を解決することで、「思考時間」の量を増やします。これらのモデルは各ステップを動的に評価し、状況に関連し、透明性のある応答を保証します。マルチステップ推論では、さまざまなソースからの知識を統合して、AI が論理的な接続を作成し、さまざまなドメイン間で情報を統合することも必要です。
これは、金融やヘルスケアから科学研究やエンターテインメントに至るまで、さまざまな分野に影響を与える可能性があります。たとえば、多段階推論を備えたヘルスケア モデルは、患者の診断、投薬、および他の治療への反応に応じて、医師が検討すべきいくつかの推奨事項を提示できます。
AI クエリ エンジンを起動します。企業や研究機関がペタバイト単位のデータを保有している場合、データに迅速にアクセスして実用的な洞察を提供することが課題となります。
AI クエリ エンジンは、企業がそのデータをマイニングする方法を変え、企業固有の検索エンジンは、自然言語処理と機械学習を使用して、テキスト、画像、ビデオなどの構造化データと非構造化データをふるいにかけ、ユーザーの意図を解釈し、より関連性の高い包括的な結果を提供できるようになります。
これにより、よりインテリジェントな意思決定プロセス、顧客エクスペリエンスの向上、業界全体の生産性の向上が実現します。AI クエリ エンジンの継続的な学習機能により、自己改善型のデータ フライホイールが作成され、アプリケーションの効率性が高まります。
インフラとしてAIをどう構築するか?
チャーリー・ボイル氏 DGXプラットフォーム担当副社長
エージェント AI により、企業にとって高性能な推論が不可欠になります。エージェントAI の登場により、複数のモデルからなる複雑なシステムからのほぼ即時の応答に対する需要が高まります。これにより、高性能な推論が高性能なトレーニング インフラストラクチャと同じくらい重要になります。IT リーダーは、エージェント AI の需要に対応してリアルタイムの意思決定に必要なパフォーマンスを提供できる、スケーラブルで専用に構築され、最適化された高速コンピューティング インフラストラクチャを必要とします。
<企業は AI ファクトリーを拡張してデータをインテリジェンスに変換>
企業の AI ファクトリーは、生データをビジネス インテリジェンスに変換します。来年、企業はこれらのファクトリーを拡張して、膨大な量の履歴データと合成データを活用し、消費者行動やサプライ チェーンの最適化から金融市場の動き、工場や倉庫のデジタル ツインに至るまで、あらゆるものの予測とシミュレーションを生成します。AI ファクトリーは、早期導入者が将来のシナリオに反応するだけでなく、それを予測して形作るのに役立つ重要な競争上の優位性になります。
<冷却係数 – 液冷式 AI データ センター>
AI ワークロードが成長を牽引し続ける中、先駆的な組織はパフォーマンスとエネルギー効率を最大化するために液冷式に移行します。ハイパースケール クラウド プロバイダーと大企業が先頭に立って、数十万の AI アクセラレーター、ネットワーク、ソフトウェアを収容する新しい AI データ センターで液冷式を使用します。
企業は、大規模なインテリジェンス製造の設計、導入、運用にかかる経済的負担を軽減するため、AI インフラストラクチャを自社で構築するのではなく、コロケーション施設に導入することを選択することがますます増えるでしょう。あるいは、必要に応じて容量をレンタルするでしょう。こうした導入により、企業は最新のインフラストラクチャを自社でインストールして運用する必要なく活用できるようになります。この変化により、液体冷却が AI データセンターの主流ソリューションとして業界全体で採用されるようになるでしょう。
ギラッド・シャイナー氏 ネットワーキング担当上級副社長
<ネットワークに別れを告げ、コンピューティング ファブリックにようこそ>
データ センターのアーキテクチャが統合コンピューティング ファブリックに変わり、数千のアクセラレータが何マイルにも及ぶケーブルと複数のデータ センター施設にまたがるスケールアップおよびスケールアウト通信を介して効率的に相互通信できるようになると、データ センターにおける「ネットワーキング」という用語は時代遅れに感じられるようになるでしょう。
この統合コンピューティング ファブリックには、スケールアップ通信を可能にするNVIDIA NVLinkのほか、インテリジェント スイッチ、SuperNIC、DPU によって実現されるスケールアウト機能も含まれています。これにより、アクセラレータとの間でデータを安全にやり取りし、オンザフライで計算を実行してデータ移動を大幅に最小限に抑えることができます。ネットワークをまたがるスケールアウト通信は、大規模な AI データ センターの展開に不可欠であり、数か月や数年ではなく数週間で稼働させるための鍵となります。
エージェント AI ワークロードが拡大し、モノリシックでローカライズされた AI モデルではなく、連携して動作する複数の相互接続された AI モデル間での通信が必要になるにつれて、リアルタイムの生成 AI を実現するにはコンピューティング ファブリックが不可欠になります。
<分散 AI>
イーサネット設計への新しいアプローチが登場し、数十万の GPU が単一のワークロードをサポートできるようになるため、すべてのデータ センターが高速化されます。これにより、マルチテナント生成 AI クラウドとエンタープライズ AI データ センターの AI ファクトリー展開が民主化されます。
この画期的なテクノロジーにより、AI をエンタープライズ プラットフォームに迅速に拡張し、AI クラウドの構築と管理を簡素化することもできます。
企業は、電力制限と再生可能エネルギー源の近くに構築する必要性から、データセンター リソースを地理的に分散させ、数百マイルまたは数千マイル離れた場所に構築するようになります。スケールアウト通信により、このような長距離間での信頼性の高いデータ移動が保証されます。
LINXI (JIM) FAN氏 シニア研究科学者、AIエージェント
ロボット工学はヒューマノイドへと進化します。ロボットは任意の言語コマンドを理解し始めます。現在、産業用ロボットは手動でプログラムする必要があり、予測できない入力やプログラムされた以外の言語にはインテリジェントに反応しません。視覚、言語、任意のアクションを組み込んだマルチモーダル ロボット基盤モデルは、この「AI 脳」を進化させ、より高度な AI 推論を可能にするエージェント AI も進化させます。
もちろん、インテリジェント ロボットがすぐに家庭、レストラン、サービス エリア、工場などで見られるようになるとは思わないでください。しかし、高齢化社会と労働力の減少に対する解決策を政府が模索する中、こうした使用例はあなたが思っているよりも近いかもしれません。物理的な自動化は徐々に進み、10 年後には iPhone と同じくらいどこにでもあるようになるでしょう。
AI エージェントは推論がすべてです。9月に OpenAI は、複雑な推論を実行するために強化学習でトレーニングされた新しい大規模言語モデルを発表しました。Strawberry と呼ばれる OpenAI o1 は、答える前に考えます。ユーザーに応答する前に、長い内部思考チェーンを生成し、間違いを修正し、難しいステップを単純なステップに分解することができます。
2025 年は、多くの計算がエッジでの推論に移行し始める年になります。小さな言語モデルが数マイクロ秒単位で次々にクエリを実行してから答えを導き出すため、アプリケーションは 1 回のクエリに数十万のトークンを必要とします。
小型モデルはエネルギー効率が高く、ロボット工学にとってますます重要になり、日常の仕事で人間を支援できるヒューマノイドやロボットの作成や、モバイル インテリジェンス アプリケーションの促進につながります。
ボブ・ペッテ氏 エンタープライズプラットフォーム担当副社長
<持続可能なスケーラビリティの追求>
企業がさまざまなビジネス プロセスを強化するために新世代の半自律型 AI エージェントを導入する準備を進めるにつれ、効果的な大規模展開のために堅牢なインフラストラクチャ、ガバナンス、人間のような機能の構築に重点が置かれるようになります。同時に、AI アプリケーションは、薄型軽量のラップトップやコンパクトなフォーム ファクターなどのワークステーションでより高度な AI 機能を直接実行できるようにするために、ローカル処理能力をますます活用するようになり、AI 駆動型タスクのレイテンシを削減しながらパフォーマンスを向上させるようになります。
適切なハードウェアおよびソフトウェア プラットフォームに関するガイダンスを提供する検証済みのリファレンス アーキテクチャは、パフォーマンスを最適化し、AI の導入を加速するために不可欠です。これらのアーキテクチャは、投資が現在のニーズと将来の技術進歩に一致するようにすることで、AI 実装の複雑な領域を進む組織にとって不可欠なツールとして機能します。
<AI による建設、エンジニアリング、設計の革新>
建設、エンジニアリング、設計業界向けにカスタマイズされた生成 AI モデルが増加し、効率が向上し、イノベーションが加速すると予想されます。
建設業界では、エージェント AI が現場のセンサーやカメラから収集された膨大な量の建設データから意味を抽出し、より効率的なプロジェクト タイムラインと予算管理につながる洞察を提供します。
AI は、現実のキャプチャ データ (LIDAR、写真測量、放射輝度フィールド) を 24 時間 365 日評価し、品質、安全性、コンプライアンスに関するミッション クリティカルな洞察を導き出します。その結果、エラーや作業現場での負傷が減少します。
エンジニアにとっては、物理学に基づいたニューラル ネットワークに基づく予測物理学により、洪水予測、構造工学、建物の個々の部屋や階に合わせた気流ソリューションの計算流体力学が加速され、設計の反復が迅速化されます。
設計においては、検索拡張生成により、建物の設計と建設のための情報モデリングが地域の建築基準に準拠していることが保証され、設計段階の早い段階でコンプライアンスが可能になります。拡散 AI モデルにより、建築家や設計者がキーワード プロンプトとラフ スケッチを組み合わせて、クライアントへのプレゼンテーション用に詳細な概念イメージを生成できるようになり、概念設計と敷地計画が加速します。これにより、研究と設計に集中する時間が確保されます。