小学館IDをお持ちの方はこちらから
ログイン
初めてご利用の方
小学館IDにご登録いただくと限定イベントへの参加や読者プレゼントにお申し込み頂くことができます。また、定期にメールマガジンでお気に入りジャンルの最新情報をお届け致します。
新規登録
人気のタグ
おすすめのサイト
企業ニュース

【CES2024】NVIDIAが生成AIパフォーマンスを強化するTensorコアGPU、LLM、RTX PCとワークステーション用ツールを発表

2024.01.11

AIモデルを構築するための新しい PC 開発者ツール

NVIDIAは最近、開発者がPCクラスのパフォーマンスとメモリ フットプリントを使用して、事前トレーニング済みの生成AIモデルと LLM を迅速に作成、テスト、カスタマイズできるようにするために、統合された使いやすいツールキットである NVIDIA AI Workbenchを発表した。

今月後半にベータ版がリリースされるAI Workbenchは、Hugging Face、GitHub、NVIDIA NGCなどの一般的なリポジトリへの合理的なアクセスを提供するとともに、開発者がプロジェクトを簡単に再現、共同作業、移行できるようにする簡素化されたユーザー インターフェイスを提供する。

プロジェクトは、データセンター、パブリック クラウド、NVIDIA DGX Cloudなど、事実上どこにでも拡張でき、その後、推論や簡単なカスタマイズのために PC またはワークステーション上のローカル RTX システムに戻すことができる。

NVIDIA は、HPと協力して、RTXで高速化された AI モデルとソフトウェア開発キットを含むNVIDIA AI Foundationモデルとエンドポイントを、データ サイエンスの一元化プラットフォームであるHP AI Studioに統合することで、AI モデル開発を簡素化している。

これにより、ユーザーは PCやクラウド全体で最適化されたモデルを簡単に検索、インポート、展開できるようになる。

PC ユースケース向けの AI モデルを構築した後、開発者は NVIDIA TensorRT を使用してモデルを最適化して、RTX GPU の Tensor コアを最大限に活用することが可能だ。

NVIDIAは最近、LLMを高速化するためのオープンソース ライブラリである TensorRT-LLMfor Windowsにて、TensorRTをテキストベースのアプリケーションに拡張した。

TensorRT-LLM の最新アップデートが利用可能になり、Phi-2が他の推論バックエンドと比較して最大5倍高速に動作し、PC用に最適化済みのモデルのリストに追加された。

RTXアクセラレーテッド生成AIが新しいPC体験を強化

CESでは、NVIDIAとその開発パートナーは、次のようなPC向けのAIを活用した新しい生成アプリケーションとサービスをリリースする。

●NVIDIA RTX Remix は、クラシック ゲームの見事なRTXリマスターを作成するためのプラットフォームだ。今月後半にベータ版がリリースされ、クラシック ゲームの基本テクスチャを最新の4K解像度の物理ベースのレンダリング マテリアルに変換できる生成 AI ツールが提供される。

●NVIDIA ACE マイクロサービスは、生成AIを活用したスピーチおよびアニメーションの生成モデルを含み、開発者はインテリジェントで動的なデジタル アバターをゲームに追加できる。

●TensorRT アクセラレーションは、Stable Diffusion XL (SDXL) Turboおよび潜在一貫性モデル (LCM) のためのアクセラレーションに対応する。これら2つは、最も一般的な Stable Diffusion アクセラレーション手法であり、TensorRTは、従来の最速の実装と比較して、両方のパフォーマンスを最大60%向上させる。

SDXL、SDXL Turbo、LCM – Low-Rank Adaptation (LoRA) のアクセラレーション、改善された LoRA サポートを含む、Stable Diffusion WebUI TensorRT拡張機能の更新バージョンも利用可能になった。

●AIを使用し、フレームレートをネイティブ レンダリングと比較して最大4倍向上させるフレーム生成機能を備えた NVIDIA DLSS 3 は、『Horizon Forbidden West』、『Pax Dei』、『ドラゴンズドグマ 2』など、発表された14の新しい RTX ゲームのうちの12タイトルに搭載される。

●今月下旬に公開される NVIDIAテクノロジーデモである Chat with RTX を使用すると、AIエンスージアストは、RAG (Retrieval-Augmented Generation) として知られる一般的なテクノロジを使用して、PC LLM を自分のデータに簡単に接続できる。

TensorRT-LLMによって高速化されたこのデモにより、ユーザーはメモ、ドキュメント、その他のコンテンツと迅速にやり取りできるようになる。

また、オープンソースのリファレンス プロジェクトとしても利用できるため、開発者は同じ機能を独自のアプリケーションに簡単に実装が可能だ。

関連情報
https://www.nvidia.com/ja-jp/

構成/清水眞希

@DIMEのSNSアカウントをフォローしよう!

DIME最新号

最新号
2024年5月16日(木) 発売

新NISAで狙え!DIME最新号は「急成長企業55」、次のNVIDIAはどこだ!?

人気のタグ

おすすめのサイト

ページトップへ

ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 第6091713号)です。詳しくは[ABJマーク]または[電子出版制作・流通協議会]で検索してください。