この進歩は、ロボットの実用性を大幅に向上させ、最近会話AIに革命をもたらした大規模言語モデル(LLM)に類似した、ロボットの「大規模行動モデル(LBM)」の構築に向けた一歩になるとしている。
- Advertisement -
TRIのCEOであり、トヨタ自動車のチーフ・サイエンティストであるギル・プラット氏は、次のようにコメントしている。
プラット氏:私たちのロボット工学の研究は、人に取って代わるのではなく、人を増幅させることを目的としています。この新しいティーチング技術は、非常に効率的であり、また非常に高いパフォーマンスの行動を生み出すため、ロボットは様々な面でより効果的に人を増幅させることができます。
ロボットに新しい行動を教えるためのこれまでの最新技術は、時間がかかり、一貫性がなく、非効率的で、制約の多い環境で行われる限定されたタスクに限定されることが多かったという。ロボット工学者は、洗練されたコードを書いたり、行動をプログラムするために何度も試行錯誤を繰り返したりするのに何時間も費やす必要があった。
- Advertisement -
TRIはすでに、液体を注いだり、工具を使ったり、変形可能な物体を操作するなど、新しいアプローチを使って60以上の難しい器用なスキルをロボットに教えている。これらの成果は、新しいコードを1行も記述するとなく実現された。唯一の変更は、ロボットに新しいデータを供給することだけだった。この成功を踏まえ、TRIは年内に数百、2024年末までに1,000の新しいスキルを教えるという意欲的な目標を掲げている。
また今回の発表では、ロボットが新しいシナリオで機能し、幅広い行動を実行するように教えることができると強調している。これらのスキルは、「ピック・アンド・プレイス」、つまり単に物を拾って新しい場所に置くだけにとどまらないという。
TRIのロボットは現在、多様で豊かな方法で世界と対話できるようになり、いつの日かロボットが日常的な状況や予測不可能で変化し続ける環境で人々をサポートすることを可能にすると同社は考えている。
TRIのロボット研究担当副社長であり、MITの電気工学・コンピューターサイエンス、航空宇宙学、機械工学のトヨタ教授でもあるラス・テドレイク博士は、次のようにコメントしている。
テドレイク氏:これらのロボットがこなす作業を見ていると、ただただ驚くばかりです。この新しいアプローチで非常にエキサイティングなのは、新しいスキルを追加できる速度と信頼性です。これらのスキルは、学習された表現のみを使用して、カメラ画像と触覚センシングから直接動作するため、変形可能な物体、布、液体など、従来ロボットにとって非常に困難であったものを含むタスクでも、うまく動作できます。
- Advertisement -
技術的詳細
TRIのロボット行動モデルは、教師からの触覚的デモンストレーションとゴールの言語記述から学習。その後、AIベースの拡散ポリシーを使用して、実演されたスキルを学習する。このプロセスにより、何十回ものデモンストレーションから新しい行動を自律的に展開することができる。このアプローチは、一貫性と再現性があり、実行可能な結果を生み出すだけでなく、圧倒的なスピードでそれを実現する。
この斬新な開発におけるTRIの研究の主な成果は以下の通り。
- 普及政策:TRIとコロンビア大学のソング教授のグループの共同研究者は、行動学習に対する新しい強力な生成的AIアプローチを開発しました。Diffusion Policyと呼ばれるこのアプローチは、デモンストレーションから簡単かつ迅速に行動を教えることを可能にする
- カスタマイズされたロボットプラットフォーム:TRIのロボットプラットフォームは、ハプティックフィードバックと触覚センシングを可能にすることに特に重点を置き、器用なデュアルアーム操作タスクのためにカスタムメイドされている
- パイプライン:TRIのロボットはすでに60の器用なスキルを習得しており、年内に数百、2024年末までに1,000を目標としている
- ドレイク:最先端のツールボックスとシミュレーション・プラットフォームを提供するロボット工学のためのモデルベース設計。ドレイクの高いリアリズムのおかげで、シミュレーションと現実の両方で、他の方法では不可能な規模と速度で開発を推進。同社の社内ロボットスタックは、ドレイクの最適化およびシステムフレームワークを使用して構築されており、ロボット工学コミュニティ全体の研究を促進するために、ドレイクをオープンソースにした
- 安全性:TRIにおけるロボット工学の取り組みの中核。ドレイクと同社のカスタムロボット制御スタックによって強力なセーフガードを備えたシステムを設計し、ロボットが自分自身や環境と衝突しないといった安全保証を遵守