- NVIDIA が自動運転におけるロングテールの課題に対処するために設計されたオープンVLA モデルを初公開、Alpamayo ファミリーには、AV 開発向けのシミュレーション ツールとデータセットも含まれる
- Alpamayo 1、AlpaSim、Physical AI Open Dataset により、人間のような判断力で認識、リーズニング、行動する車両の開発が可能に。開発者はモデルをファインチューン、抽出、テストすることが可能になり、安全性、堅牢性、拡張性が向上する
- Alpamayo を活用することで、JLR、Lucid、Uber などのモビリティ業界における主要な企業や、Berkeley DeepDrive などの AV 研究コミュニティが、安全かつリーズニングベースのレベル 4 自動運転の展開ロードマップを迅速に推進することが可能になる
NVIDIA は、安全なリーズニングベースの次世代自動運転車 (AV) 開発を加速させるために設計されたオープン AI モデル、シミュレーション ツール、データセットから構成される NVIDIA Alpamayo ファミリーを発表した。
- Advertisement -
自動運転車は、膨大な範囲の条件下で安全に動作しなければならない。「ロングテール」と呼ばれる稀で複雑なシナリオは、自律システムが安全に習得すべき最も困難な課題の一つであり続けている。従来の AV アーキテクチャでは、認識と計画が分離されているため、新たな状況や異常な状況が発生した場合の拡張性が制限される可能性がある。
近年、エンドツーエンド学習は著しい進歩を遂げているが、このようなロングテールの稀なケースを克服するには、特にモデルが学習経験の範囲外の状況に直面した際に、因果関係を安全にリーズニングできるモデルが必要である。
Alpamayo ファミリーは、思考の連鎖に基づくリーズニングベースの視覚言語行動 (VLA) モデルを活用し、AV の意思決定に人間に近い思考を導入している。これらのシステムは、新たな、または稀なシナリオを段階的に検討し、運転能力と説明可能性を向上させる。これはインテリジェント車両の信頼性と安全性の向上に不可欠であり、NVIDIA Halos 安全システムによって裏付けされる。
- Advertisement -
NVIDIA 創業者/CEO ジェンスン フアン氏は次のようにコメントしている。
フィジカル AI にとっての ChatGPT の瞬間が到来しました。つまり、マシンが現実世界を理解し、リーズニングし、行動し始めるのです。ロボタクシーは、真っ先にその恩恵を受けます。Alpamayo は自動運転車にリーズニング能力をもたらし、稀なシナリオを熟考させながら、複雑な環境でも安全に運転し、運転判断を説明することを可能にします。安全でスケーラブルな自動運転の基盤となります。
リーズニングをベースとした、自動運転のための完全でオープンなエコシステム
Alpamayo は、オープン モデル、シミュレーション フレームワーク、データセットという 3 つの基本的要素を統合し、自動車開発者や研究チームが利用できる一貫性のあるオープンなエコシステムを形成する。
Alpamayo モデルは、車両内で直接実行されるのではなく、大規模な教師モデルとして機能し、開発者がファインチューニングを行い完全な自律運転スタックの基盤へと集約できる。
CES で NVIDIA は以下を公開した
-
Alpamayo 1: AV 研究コミュニティ向けに設計された業界初の Chain-of-Thought リーズニング VLA モデルが、Hugging Face で公開された。100 億個のパラメータを持つアーキテクチャの Alpamayo 1 は、映像入力を用いてリーズニング トレースとともに軌跡を生成し、各決定の背後にあるロジックを示す。
開発者は Alpamayo 1 を車両開発向けの小型ランタイム モデルに適用することも、リーズニングベースの評価ツールや自動ラベリング システムなどの AV 開発ツールの基盤として活用することもできる。Alpamayo 1 では、オープン モデル ウェイトとオープンソースの推論スクリプトを提供する。
Alpamayo ファミリーの将来のモデルでは、より多くのパラメータ、より詳細なリーズニング能力、入出力の柔軟性の向上、商用利用の選択肢が含まれる予定である。 - AlpaSim: 高精度な AV 開発のための、完全なオープンソースのエンドツーエンドのシミュレーション フレームワークであり、GitHub で公開中である。リアルなセンサー モデリング、設定可能な交通動態、スケーラブルな閉ループ テスト環境を提供し、迅速な検証とポリシーの調整を可能にする。
- Physical AI Open Dataset: NVIDIA では、最も多様性のある AV 向けの大規模オープンデータセットを提供している。広範囲な地域と条件下で収集された 1,700 時間以上の走行データが含まれ、リーズニング アーキテクチャの進化に不可欠な、稀で複雑な実世界のエッジケースを網羅している。これらのデータセットは Hugging Face で利用できる。
これらのツールを組み合わせることで、リーズニングベースの AV スタック向けに自己強化型開発ループが実現される。
- Advertisement -
自動運転業界全体が Alpamayo を支持
Lucid、JLR、Uber、Berkeley DeepDrive などのモビリティ業界のリーダーや業界のエキスパートがレベル 4 の自動化を可能にするリーズニングベースの自動運転スタック開発に向け、Alpamayo に高い関心を寄せている。
Lucid Motors ADASおよび自動運転担当 バイス プレジデント Kai Stepper氏は次のようにコメントしている。
フィジカル AI への移行は、単にデータを処理するだけでなく、実世界の行動をリーズニングできる AI システムの必要性が高まっていることを示唆しています。進化の重要な要素は、高度なシミュレーション環境、豊富なデータセット、そしてリーズニング モデルです。
JLR製品エンジニアリング担当エグゼクティブ ディレクター Thomas Müller氏は次のようにコメントしている。
オープンで透明性のある AI 開発は、責任ある自動運転技術の進歩のために不可欠です。Alpamayo などのモデルのオープンソース化により、NVIDIA は自動運転エコシステム全体のイノベーションを加速させ、開発者や研究者に複雑な実世界のシナリオに安全に対処するための新しいツールを提供しています。
Uber 自律移動および配送部門グローバル責任者 Sarfraz Maredia氏は次のようにコメントしている。
ロングテールで予測不可能な運転シナリオへの対処は、自動運転における本質的な課題の 1 つです。Alpamayo は、フィジカル AI の加速、透明性の向上、安全なレベル 4 自動運転の展開に向けた、エキサイティングな新たな可能性を業界に提供します。
S&P Global シニア プリンシパル アナリスト Owen Chen氏は次のようにコメントしている。
Alpamayo 1 により、車両は複雑な環境を解釈し、未知の状況を予測し、未経験のシナリオでも安全に判断できるようになります。このモデルのオープンソース性により、業界全体のイノベーションが加速され、パートナー各社が独自のニーズに合わせてテクノロジを調整し、改良することができます。
Berkeley DeepDrive 共同ディレクター Wei Zhan氏は次のようにコメントしている。
Alpamayo ポートフォリオの追加は、研究コミュニティにとって大きな飛躍です。NVIDIA がAlpamayo のオープンな提供を決定したことは変革的であり、そのアクセス性と機能性により、私たちは前例のない規模でのトレーニングが可能になります。自律運転をメインストリームに推進するために必要な柔軟性とリソースが得られます。
Alpamayo 以外に、開発者は NVIDIAおよび NVIDIA Omniverseプラットフォームを含む、NVIDIA の豊富なツールとモデル ライブラリを活用できる。開発者は、独自の車両データをもとにモデル リリースをファインチューンし、NVIDIA DRIVE AGX Thorアクセラレーテッド コンピューティングで構築された NVIDIA DRIVE Hyperionアーキテクチャに統合し、商用展開前にシミュレーション環境でパフォーマンスを検証できる。