台北でのCOMPUTEXカンファレンスのオープニングを飾ったライブ基調講演で、フアン氏は約3,500人の満員の聴衆を前に、新しいビジネスモデルを実現し、現在のビジネスモデルもより効率的にするアクセラレーテッドコンピューティングサービス、ソフトウェア、およびシステムについて説明。「アクセラレーテッドコンピューティングとAIは、コンピューティングにおける再発明を示しています」と語った。
- Advertisement -
再発明の威力を実証するため、フアン氏は背にした巨大な8Kのディスプレイに、カラオケの曲と同じように歌うことができる、自身の基調講演のテーマソングを生成するテキストプロンプトを表示した。フアン氏は時折、観衆に語りかけながら、束の間、聴衆を先導してこの新しい歌を口ずさんでみせたという。
フアン氏は次のようにコメントしている。
フアン氏:私たちは現在、世界中のほぼすべてのコンピューティングおよびクラウド企業に採用されているアクセラレーテッドコンピューティングとAIによる、新しいコンピューティング時代の転換点にいます。
- Advertisement -
現在4万社の大企業と1万5千社のスタートアップ企業が、NVIDIAテクノロジを使用しており、昨年だけでもCUDAソフトウェアが2,500万回ダウンロードされているという。
エンタープライズAIの新しいエンジン
究極のAIパフォーマンスを必要とするエンタープライズ向けに、フアン氏は、大規模メモリのAIスーパーコンピューターである「DGX GH200」を発表した。NVIDIA NVLinkを使用して、最大256基のNVIDIA GH200 Grace Hopper Superchipを結合し、単一のデータセンター規模のGPUとして実行可能にするという。
フアン氏によると、GH200 Superchipは現在量産段階にあり、エネルギー効率の高いNVIDIA Grace CPUと高性能なNVIDIA H100 Tensor コア GPUが1つのスーパーチップに組み合わされている。
DGX GH200は、1エクサフロップスのパフォーマンスと144テラバイトの共有メモリを搭載している。これは1台のNVIDIA DGX A100 320GBシステムと比べて、約500倍以上の性能をもたらすという。これにより、開発者は、生成AIチャットボット用の大規模な言語モデル、レコメンダーシステム用の複雑なアルゴリズム、不正検出やデータ分析に使用されるグラフニューラルネットワークの構築が可能になる。
Google Cloud、Meta、Microsoftは、将来のハイパースケール生成AIインフラストラクチャの青写真として使用できるDGX GH200を最初に活用することが予想されている。
- Advertisement -
フアン氏:DGX GH200AIスーパーコンピューターは、NVIDIAの最先端のアクセラレーテッドコンピューティングとネットワーキングテクノロジを統合して、AIのフロンティアを拡大します。
NVIDIAは独自の大規模AIスーパーコンピューター、NVIDIA Heliosを構築しており、今年中に稼働予定だ。NVIDIA Quantum-2 InfiniBand ネットワーキングとリンクされた4台のDGX GH200システムを使用して、大規模なAIモデルをトレーニングするためのデータスループットを強化する。
DGX GH200は、イベントで発表された数百のシステムの頂点を形成する。これらのシステムが、生成AIと高速コンピューティングを何百万ものユーザーに提供している。
全体像に目を向けると、フアン氏は、NVIDIAの最新のHopper、Grace、Ada Lovelace、BlueFieldアーキテクチャを搭載した400以上のシステム構成が市場に投入されることを発表した。これらは、AI、データサイエンス、ハイパフォーマンスコンピューティングにおける最も複雑な課題に取り組むことを目的としている。
あらゆるサイズでのアクセラレーション
あらゆる規模のデータセンターのニーズに適合するために、フアン氏は、アクセラレーテッドサーバーを構築するためのモジュラーリファレンスアーキテクチャであるNVIDIA MGXを発表した。システムメーカーはこれを使用して、AI、HPC、NVIDIA Omniverse の幅広いアプリケーションに適合する100を超える異なるサーバー構成を迅速かつコスト効率よく構築できるという。
MGXを使用すると、メーカーは共通のアーキテクチャとモジュール式コンポーネントを使用してCPUとアクセラレーテッドサーバーの構築が可能になる。NVIDIAのGPU、CPU、データプロセッシングユニット(DPU)、ネットワークアダプターのフルラインに加えて、さまざまな空冷および水冷シャーシでのx86およびArmプロセッサをサポートする。
QCTとSupermicro は、MGXデザインを8月に初めて市場に投入する。COMPUTEXで発表されたSupermicroのARS-221GL-NRシステムはGrace CPUを搭載し、同じくイベントで発表された QCTのS74G-2UシステムはGrace Hopperを搭載している。
ASRock Rack、ASUS、GIGABYTE、PegatronもMGXを使用して次世代アクセラレーション コンピューターを作成する予定。
5G/6Gで求められるGrace Hopper
フアン氏は、NVIDIAが将来の5Gおよび6Gワイヤレスおよびビデオ通信の形成に貢献していると述べた。デモでは、Grace Hopper上で実行されるAIが、どのように今日の2Dビデオ通話をよりリアルな3D体験に変換し、驚くべき臨場感を実現できるかが示された。
新しい種類のサービスの基礎を築くにあたって、フアン氏は、NVIDIAがソフトバンクと協力して日本にデータセンターの分散ネットワークを構築していると発表した。そこでは、5Gサービスと生成AIアプリケーションを共通のクラウドプラットフォーム上で提供する予定だ。
このデータセンターは、モジュラーMGXシステムのNVIDIA GH200 SuperchipとNVIDIA BlueField-3 DPU、およびNVIDIA Spectrum Ethernetスイッチを使用して、5Gプロトコルに必要な高精度のタイミングを提供する。このプラットフォームは、エネルギー消費を削減しながらスペクトル効率を高めることでコストを削減するという。
同システムを活用して、ソフトバンクは、自動運転、AI、拡張現実と仮想現実、コンピュータービジョンおよびデジタルツインのための5G/6Gアプリケーションの実現を目指している。
クラウドネットワークの加速
これとは別に、フアン氏は、イーサネットベースのAIクラウドのパフォーマンスと効率を向上させることを目的としたネットワーキングプラットフォームであるNVIDIA Spectrum-Xを発表した。Spectrum-4 イーサネットスイッチとBlueField-3 DPUおよびソフトウェアを組み合わせて、従来のイーサネットファブリックと比較してAIパフォーマンスと電力効率を1.7倍向上させるという。
NVIDIA Spectrum-X、Spectrum-4 スイッチ、および BlueField-3 DPUは、Dell Technologies、Lenovo、Supermicroなどのシステムメーカーから現在入手可能だ。
ゲームキャラクターに命を吹き込む
生成AIは人々の遊び方にも影響を与えるという。フアン氏は、開発者が音声、対話、アニメーション用のカスタムAIモデルを構築および展開するために使用できるファウンドリサービスである、NVIDIA Avatar Cloud Engine (ACE) for Gamesを発表した。これにより、プレイアブルではないキャラクターに対話スキルが与えられ、進化する本物そっくりの性格で質問に応答できるようになるという。
NVIDIA ACE for Gamesには、プレーヤーの音声を検出して書き起こすためのNVIDIA Riva などのAI基盤モデルが含まれている。このテキストは、NVIDIA NeMo に、NVIDIA Omniverse Audio2Faceでアニメーション化されたカスタマイズされた応答を生成するよう促すという。
Windows上で生成AIを加速
フアン氏は、生成AI時代におけるWindows PCのイノベーションを推進するために、NVIDIAとMicrosoftがどのように協力しているかを説明した。
新しく強化されたツール、フレームワーク、ドライバにより、PC開発者にとってAIの開発と導入が容易になるとしている。例えば、GPUアクセラレーテッドAIモデルを最適化して展開するためのMicrosoft Oliveツールチェーンと新しいグラフィックスドライバは、NVIDIA GPUを搭載したWindows PCでのDirectMLのパフォーマンスを向上させる。
このコラボレーションにより、400を超えるAIアクセラレーションWindowsアプリおよびゲームのパフォーマンスを向上させるTensorコアを搭載したRTX GPUにより、1億台のPCのインストールベースが強化および拡張されるとしている。
世界最大級の産業をデジタル化する
ジェネレーティブAIは、7000億ドル規模のデジタル広告業界にも新たな機会を生み出しているという。例えば、世界最大のマーケティングサービス機関であるWPPは、NVIDIAと協力して、Omniverse Cloud上に世界初のジェネレーティブAI対応コンテンツエンジンを構築している。
フアン氏はデモで、クリエイティブチームがAdobe Substance 3Dなどの3Dデザインツールを接続し、NVIDIA Omniverseでクライアント製品のデジタルツインを構築する様子を紹介した。責任を持って入手したデータに基づいてトレーニングされ、NVIDIA Picassoで構築された生成AIツールのコンテンツによって、バーチャルセットを迅速に作成可能。WPPのクライアントは、この完全なシーンを使用して、グローバル市場やユーザーがあらゆるウェブデバイスで体験できる広告、ビデオ、3D体験の数々を生成できる。
フアン氏:今日、広告は検索されますが、将来的には、情報を扱う際に、その多くが生成されるようになるでしょう。コンピューティングモデルが変わりました。
工場が切り開くAIの未来
推定1,000万台の工場がある46兆ドルの製造業は、産業のデジタル化のための豊かなフィールドだと言える。
フアン氏:世界最大の産業は、物理的なものを作っています。それらを最初にデジタルで構築することで、何十億ものコスト削減が可能になります。
基調講演では、Foxconn Industrial Internet、Innodisk、Pegatron、Quanta、Wistronなどの電子機器メーカーが、完全にデジタルなスマート工場というビジョンを実現するために、NVIDIAの技術を使ってデジタルワークフローを構築している様子を紹介した。
彼らはOmniverseと生成AI APIを使用して設計と製造ツールを接続し、工場のデジタルツインを構築できるようにしている。さらに、ロボットのシミュレーションとテストにはNVIDIA Isaac Simを、自動光学検査にはビジョンAIフレームワークであるNVIDIA Metropolisを使用している。
最新のコンポーネントであるNVIDIA Metropolis for Factoriesは、カスタム品質管理システムを作成でき、メーカーに競争優位性をもたらす。企業の最先端AIアプリケーションの開発に役立っているという。
AIが組立ラインをスピードアップ
例えば、ノートパソコンやスマートフォンなど、世界中で300種類の製品を製造しているペガトロンは、Omniverse、Isaac Sim、Metropolisを使って仮想工場を作成している。これにより、シミュレーション環境で工程を試すことができ、時間とコストを削減できる。
また、ペガトロンは、NVIDIA DeepStreamソフトウェア開発キットを使用して、インテリジェントビデオアプリケーションを開発し、スループットを10倍に向上させたという。
世界最大のテクノロジーメーカーのサービス部門であるFoxconn Industrial Internetは、NVIDIA Metropolisパートナーと協力して、回路基板の品質保証検査ポイントの大部分を自動化することに取り組んでいる。
Quanta社の子会社であるTechman Robot社が、NVIDIA Isaac Simを利用して、台湾の大手企業の製造ラインでの検査を最適化した様子をビデオで紹介した。これは実質的に、ロボットのシミュレーションを使用して、より良いロボットの作り方をロボットにトレーニングさせるというものだ。
さらに、フアン氏は、次世代の自律移動ロボット(AMR)フリートを実現するための新しいプラットフォームを発表した。アイザックAMRは、自律型移動ロボットのシミュレーション、配備、フリート管理を支援する。
フアン氏:ADLINK、Aetina、Deloitte、Quantiphi、Siemensなどの大規模なパートナーエコシステムが、これらすべての製造ソリューションの市場投入を支援しています。
これは、NVIDIAが、加速されたコンピューティングによって企業が生成的なAIの恩恵を感じられるよう支援していることを示す、もう1つの例だとした。