※本記事は、AI for Goodウェビナー「Collective robotics: Multi-robot coordination in complex environments」の内容を基に作成されています。ウェビナーの詳細および動画は https://www.youtube.com/watch?v=tXWHEsNd1Yw でご覧いただけます。
登壇者は、ケンブリッジ大学コンピュータサイエンス・テクノロジー学科准教授のAmanda Prorok氏、ミネソタ大学教授のMaria Gini氏、LAAS-CNRSシニアサイエンティストのRachid Alami氏、ペンシルベニア大学准教授のAni Hsieh氏の4名で、デラウェア大学機械工学科教授のHerbert Tanner氏がモデレーターを務めました。
本記事では、ウェビナーの内容を要約・編集しております。なお、本記事の内容は登壇者の見解を正確に反映するよう努めていますが、要約や解釈による誤りがある可能性もありますので、正確な情報や文脈についてはオリジナルの動画をご覧いただくことをお勧めいたします。また、AI for Goodの最新情報については、公式サイト(https://aiforgood.itu.int )およびネットワーキングコミュニティ「Neural Network」(https://aiforgood.itu.int/neural-network )もご参照ください。
1. 開会・登壇者紹介
1-1. AI for Goodウェビナーの概要と登壇者
Gila Martinez: 本日はITU主催のAI for Goodウェビナー「複雑環境におけるマルチロボット協調」にご参加いただき、ありがとうございます。AI for Goodは、ITUが40の国連姉妹機関と連携し、スイスと共同で開催している、行動志向のグローバルかつ包摂的な国連プラットフォームです。AIの実践的な応用を特定し、国連の持続可能な開発目標(SDGs)の達成に向けてその解決策をグローバルに展開することを目標としています。本セッションは、AIを活用したロボットが人間の可能性を引き出し、SDGsの推進にどう貢献できるかを探るロボティクス・プログラミングトラックの一環として開催されます。モデレーターをご紹介します。デラウェア大学教授のHerbert Tanner氏です。
Herbert Tanner: ありがとうございます。皆さん、集団ロボティクスとマルチエージェントシステムに関するこの刺激的なパネルディスカッションへようこそ。私はデラウェア大学機械工学科の教授であり、自律ロボットシステムセンターのディレクターを務めています。本日は、マルチロボットシステムの科学的研究において顕著な業績を残した4名の優れた研究者をお迎えしています。まず、ミネソタ大学コンピュータサイエンス・エンジニアリング学科の工学部特別教授であり、自律型マルチロボットシステムの意思決定を研究するMaria Guiniです。次に、CNRSのシニアサイエンティストであり、トゥールーズ人工・自然知能研究所で認知・インタラクティブロボティクスの学術チェアを務め、マルチロボット協調・計画・人間ロボットインタラクションに取り組んできたRashid Alamiです。続いて、ペンシルベニア大学機械工学・応用科学科の准教授であり、GRASPラボの副ディレクターとして、マルチエージェントシステムの推定・制御・計画アルゴリズムを設計してきたAni Hsieです。そして最後に、ケンブリッジ大学コンピュータサイエンス・テクノロジー学科の教授でありペンブルック・カレッジのフェローとして、レジリエントなマルチロボットシステムに関して特に注目される研究を行っているAmanda Prorokです。各パネリストによる約10分間のプレゼンテーションを行い、その後パネルディスカッションを行います。最後に聴衆の皆さんからのご質問にお答えします。プレゼンテーションの順番はAmanda、Maria、Rashid、そしてAniとなります。
2. 第1講演:マルチロボットシステムにおける通信の学習(Amanda Prorok)
2-1. 集団知性の本質と実世界への応用事例
Amanda: 本日は、マルチロボットシステムにおける通信の学習についてお話しします。まず、ムクドリの群れが作り出す美しい飛行パターンの映像をご覧ください。この群れの動きは、個々の鳥が局所的なインタラクションのみに基づいて行動した結果として生まれるものです。より高次の目標は群れ全体には見えていないにもかかわらず、あのように滑らかでエレガントな動きのパターンが創発する。これが集団知性の魔法であり、その美しさの本質です。
この集団知性は実世界にも応用されています。物流倉庫の自動化や輸送、農業といった分野では、すでにマルチロボットチームが実用化されています。また、環境モニタリングや監視、建設、さらには宇宙探査においても、複数のロボットが協力して作業を行う集団知性のアプローチが非常に有望であることが示されています。ここで重要なのは、単純な協調であれ、より高度な形の協力であれ、複数のロボットが連携して動くことでシステム全体のパフォーマンスが向上するという点です。私の研究が問いかけるのは、「どうすればロボットたちをうまく連携させられるか」ということです。
2-2. 協調的意思決定が困難な理由と解決アプローチ
Amanda: 協調がなぜ難しい問題なのかを説明します。課題は大きく3つあります。第1に、協調的な意思決定そのものが計算量的に困難であり、多くの解法が計算不可能(intractable)であるという問題があります。第2に、解法を分散化しようとすると、ロボット同士が何を、いつ、どのように通信すべきかを決める必要があります。第3に、仮に最初の2つの問題を解決できたとしても、実世界には予期せぬ出来事が溢れており、遅延・誤検出・システム障害に対する頑健性を解法に組み込む必要があります。
これらの問題には、第一原理に基づく古典的なアプローチと、データ駆動型のアプローチの2種類で取り組むことができます。私たちが注目するのは後者です。データ駆動型アプローチの利点は、問題のスケールや種類を超えて汎化できる可能性があることです。そして、エージェント間の関係はグラフとして表現できるという性質を活用することで、学習問題を効率化できます。具体的には、ロボットが自身の局所的な観測をエンコードし、互いに巧みにやり取りするためのメッセージング戦略を自動的に学習するニューラルネットワークを構築します。メッセージを受け取ったロボットはその情報を取り込み、下流のタスクを解くために何をすべきかについてスマートな意思決定を行うことができます。
2-3. グラフニューラルネットワークによる分散通信戦略の学習と実験成果
Amanda: このアプローチを実際に適用した研究を紹介します。私たちが挑んだのは、コンピュータサイエンスで最も難しい協調問題の一つとして知られる「マルチエージェント経路探索(Multi-Agent Pathfinding)」です。この問題はNP困難なアルゴリズムのクラスに属します。私たちが示したのは、このきわめて難しい協調問題を解くための局所的な通信と意思決定の方策を、データから自動的に合成できるということです。特筆すべきは、この解法が完全に分散化されている点です。つまり、ロボットの数を数百・数千に増やしても計算上のコストが増大しないという、スケーラビリティの高い解法を実現しました。
2-4. シミュレーションから現実へのギャップを埋める3つのアプローチ
Amanda: しかし、シミュレーション上で優れた解法を構築できたとしても、私たちが本当に求めているのはそれを実世界に移行することです。ロボティクスとコンピュータサイエンスの分野では、この問題を「シミュレーション・リアリティギャップ(sim-to-real gap)」と呼んでいます。私たちはこの課題に対して3つのアプローチで取り組んでいます。
1つ目は「混合現実(Mixed Reality)を活用した学習」です。実世界の1台のロボットが、仮想環境上の他のロボットたちと協調しながら学習します。これにより、ロボットが学習中に他の実機を壊すことなく安全にインタラクションしながら、実世界の信号から学習して集団的な意思決定方策を改善していくことができます。
2つ目は「グラフニューラルネットワークを用いた実世界での通信劣化への頑健性の検証」です。実世界では通信品質が低下することがありますが、純粋にシミュレーションで訓練した方策が、実世界での通信劣化に対しても非常に頑健であることを示しました。これはグラフニューラルネットワークに基づく通信設計がもたらす重要な知見です。
3つ目は「実世界でのパートナー間通信に依存したロボットの学習」です。この研究では、ターゲットがロボットの視界に入っていない状態で、視覚センサーのネットワークが盲目のロボットをターゲットへと誘導するという問題に取り組みました。環境中に分散配置されたセンサーがロボットに移動方向を伝えることで、ロボットは緑色のボックスという目標に到達できます。驚くべき点は、ロボットもセンサーも事前に位置情報を与えられていないにもかかわらず、自身の視覚的な周囲環境と互いの通信から学習することで、ロボットを最も有望な方向へ誘導する戦略を自律的に形成できるということです。このシステムはプラグアンドプレイで動作し、キャリブレーションや位置設定は一切不要で、すべてデータ駆動型の通信戦略によって実現されます。
2-5. 環境そのものを最適化するという発想の転換
Amanda: ここで一つ、視点を根本的に変えてみたいと思います。私たちはとかくロボット自体を問題の対象として捉え、アルゴリズムを改善しようとします。しかし私のラボでは、問題の立て方を逆転させました。「ロボットやそのアルゴリズムを改善できない場合でも、ロボットが動作する環境を改善できるのではないか」という発想です。
この考えを具体化した実験をご紹介します。ロボットには固定された方策が与えられており、それぞれが目標地点へ向かおうとしています。しかし、障害物が多い敵対的な環境では、ロボットが目標に到達することが非常に困難になります。そこで私たちは、ロボットのアルゴリズムに応じて環境を設定・再設定できる戦略を考案しました。映像で確認できるように、環境にほんのわずかな小さな変更を加えるだけで、ロボットが目標をはるかにスムーズかつ効率的に達成できるようになります。これは「環境もまた最適化の対象として捉える」という、マルチロボット研究における新たな視座を提示するものです。
2-6. 今後の展望と残された課題
Amanda: 最後に、私が考えるこの分野のフロンティアと今後の課題を整理します。まず展望として、新しいニューラルネットワークアーキテクチャが分散方策の学習を大きく促進しており、スケーラビリティを保ちながら高い性能を実現できるようになっています。これらの方策はシミュレーションから実世界へのギャップをエレガントに乗り越える可能性を示しています。私が特に興奮しているのは、計算不可能な問題をスケーラブルに解くことを学習によって実現するという「聖杯」の追求と、環境を共同最適化するというアイデアです。また、集団知性を通じて予期せぬ障害への回復力を持たせることも重要な方向性です。
課題としては、第1に解釈可能性の問題があります。ロボットがデータ駆動型の方策で動いているとき、人間がその内部で何が起きているかを理解できるかが問われます。第2に、データ駆動型の解法を開発する際の効率性と、実世界への円滑な移行の問題があります。第3に、特にシステムが安全性が重要な環境や人間とロボットが共存する環境で動作する場合の、保証と認証の提供が必要です。これらの課題に取り組むことが、マルチロボット研究コミュニティ全体にとっての急務であると考えています。
3. 第2講演:大規模マルチロボットの協調と意思決定(Maria Gini)
3-1. ロボット数のスケールと協調の必要性
Maria: 私が取り上げるのは、ロボットが1台や10台ではなく、1,000台・1万台という規模に達したとき、どのように連携させるかという問題です。まず基本的な考え方を整理します。ロボットが1台であれば制御は比較的容易で、これまでに多くの研究が積み重ねられてきました。複数のロボットがいれば並列で作業できるためより有用ですが、制御は格段に難しくなります。開発するプログラムは、ロボットの台数に対してスケールし、故障に対して頑健でなければなりません。そうなると、ロボット同士をどのように協調させるかという問いが浮かび上がります。集中管理型にするか、分散型にするか、あるいは各ロボットが完全に独立して動くのか。さらに、ここで一つ重要な問題を提起しておきます。大勢のロボットの中に、本来の役割を果たさない個体がいるとき——競合他社や悪意ある第三者によってプログラムされた場合も含めて——それをどう検出するかという問題です。これは後ほど改めて取り上げます。
大規模ロボット群の歴史を振り返ると、初期の代表的な事例として「Swarmbot」プロジェクトがあります。100台のロボットが一列に並んで、前のロボットに追従するだけという単純な行動をとるものでした。また、ハーバード大学の「Kilobot」は1,000台の非常に小型のロボットで構成されますが、動きは極めて遅く、できることも限られていました。初期の大規模ロボット研究の多くは、特定の状況に向けてロボットを精密に設計するエンジニアリング的アプローチであり、汎化性に乏しいものでした。現在私たちが目指しているのは、こうした制約を超えた、より汎用的な協調の実現です。
群れのロボットにしばしば用いられるインスピレーションの源がアリのコロニーです。アリは分散して動き回り、食料を運びます。1万台のロボットが食料を拾い集めながら動き回るシミュレーションを見ると、この群れをどう協調させるか、どうすれば目的を達成できるかという問いの深さが伝わるかと思います。実用例としては、Amazonの物流倉庫ロボットのようにすでに展開されているものもあれば、薬や新聞を届けるドローンのような将来的な応用も考えられています。
3-2. パリ市街地火災シミュレーションによる協調効果の実証
Maria: 協調がもたらす効果を最も鮮明に示す例として、ロボカップ救助シミュレーターを用いたパリ市街地の火災救助シミュレーションを紹介します。このシミュレーションでは、赤い点が消防車、青い点が警察車両、白い点が救急車、緑の点が救助を必要としている人々を表しています。パリはセーヌ川によって分断されており、川を渡れる橋は数か所しかありません。この地理的制約がロボットの行動に大きく影響します。
まず、協調なしの場合を見てみます。各消防車が独自に判断して行動し、互いに情報を交換しません。その結果、シミュレーション終了時には地図上の広大なエリアが茶色や黒に変わり、ほとんどが焼け落ちてしまいます。ロボットはそれぞれ懸命に動いているにもかかわらず、協調がないために全体としての成果は非常に乏しいものになります。
次に、同じ状況・同じロボットで協調ありの場合を見ます。ロボット同士がメッセージを交換し、コミュニケーションを取りながら行動します。すると赤い点、つまり消防車が同じ火災に複数方向から同時に攻め込む様子が確認できます。火災は依然として拡大しますが、その被害は大幅に抑制され、街の損害は協調なしの場合に比べて著しく小さくなります。この実験が示すのは、ロボットがそれぞれ個別に動くことも有用ではありますが、協調できる場合には格段に優れた成果が得られるという事実です。
3-3. オークションアルゴリズムによる分散タスク割り当て
Maria: 続いて、数台から数十台程度のロボットが監視ミッションを行うシナリオに話を移します。ここでの課題は、タスクに優先順位や時間制約がある場合——たとえば特定の部屋をある時間帯に監視しなければならない、重要エリアを先に確認しなければならないといった制約——に、どうロボットがタスクを割り当てるかです。
私たちが採用したアプローチは、オークションのメカニズムに基づくアルゴリズムです。仕組みはeBayのオークションに例えるとわかりやすいです。各ロボットはまず自分自身のスケジュールを構築します。スケジュールはタスクを円で表し、それらを時間軸で結んだ構造として管理されます。新しいタスクが与えられると、各ロボットは「自分はすでにこれをコミットしているが、この新しいタスクを追加できるか、追加するとどれだけコストが増えるか」を計算します。このコストは主に、新しい場所へ移動するために必要な時間として定義されます。そして各ロボットがスケジュール上の最適な挿入位置を見つけ、入札額をオークショニアに送ります。各ロボットが並列にこの計算を行うため、計算量を大幅に削減できる点がこのアーキテクチャの大きな利点です。オークショニアは最善の入札を選択し、処理を継続します。
この手法の有効性を、車両ルーティング問題(Vehicle Routing Problem)を用いて検証しました。これはロボットが複数の場所を訪問しながら時間制約を満たすという、構造的に同類の問題です。結果として、私たちのアルゴリズムでは何も指示しなくても各ロボットが自然に担当エリアを分担し、担当エリア内でのみ動き回るという振る舞いが現れました。同じエリア内のタスクは移動距離が短く、コストが低いため、経済的な観点からエリア分担が自律的に生まれるのです。比較対象として用いた他のアルゴリズムではこのような分担が生まれず、結果として効率が低下しました。
3-4. 大規模協調の限界と敵対的ロボットへの対処という未解決問題
Maria: ここまでの議論を踏まえ、いくつかの重要な問いと課題を提示して締めくくります。まずロボットの制御という観点では、遠隔操作も可能ですが、私たちが本当に関心を持っているのは、ロボットに何をすべきかを「プログラムする」アプローチです。Amandaが言及したような学習については今回は触れず、私は純粋な意思決定と分散型の意思決定の実現に焦点を当てています。
台数が限られた場合、オークションのような手法で個々のロボットが慎重に計画を立てることができます。しかし、1,000台規模になると、こうしたアルゴリズムが本当に機能するかどうかは明らかではありません。私は1万5,000台のロボットを使ったシミュレーションを行ったことがありますが、大規模な協調では、たとえば1つのオブジェクトを1台のロボットだけが拾いに行くことを保証するような調整が非常に複雑になります。適切な手法が何かは、まだ十分に解明されていない未解決の問題です。
そしてもう一つ、冒頭で予告した問題に戻ります。競合他社や敵対者、あるいは単にいたずら目的でシステムに侵入したロボットが、正しい行動をとっていない場合、群れの中でそれをどう検知するかという問題です。そのようなロボットを隔離したり、対処したりするにはどうすればよいか。これも現在も議論が続くオープンな課題であり、科学者として真剣に考え続けなければならないテーマです。
4. 第3講演:人間とロボットの協働における認知・対話能力(Rashid Alami)
4-1. 将来の公共空間における人間・ロボット共存シナリオ
Rashid: 私が長年取り組んできたマルチロボット協調の研究から、今はそれを人間との協働にどう結びつけるかという問いへと軸を移しています。Mariaが先ほど触れた方向性とも重なる部分があります。今日お話ししたいのは、ロボットチームと人間の未来に関するアイデアと、いわば「夢」についてです。
まず、将来の公共空間を想像してみてください。2000年代のある時点、カメラやWi-Fiネットワークが整備された公共の場所に、複数の種類のロボットが存在しています。サービスロボットの一団がそれぞれの任務を遂行し、清掃ロボットのチームが作業を行い、半自律型の車椅子が人を運び、コンパニオンロボットが主人に付き添って空間を移動しています。そこにはもちろん人間もいます。この多様なロボットと人間が同じ空間に存在するとき、どうすれば互いに干渉し合わず、人間にとって意味のある形で共存し、有用なサービスを提供できるのか。これが私の研究の出発点にある問いです。
私がこれまで関わってきたプロジェクトでは、空港で人々を案内するガイドロボット、自宅での「フェッチ・アンド・キャリー(物を取って運ぶ)」タスクを行うアシスタントロボット、公共空間でのインフォエンターテインメントサービスロボット、そして工場で人間の同僚とスペースを共有しながら作業するチームメイトロボットなどを扱ってきました。これらの経験を通じて見えてきたのは、かつての高層ビル建設の作業員たちが梁の上で肩を並べて作業していたように、将来は人間とロボットのチームがともに大規模なミッション——摩天楼の建設や基地の建設など——を遂行する姿です。そのような未来においては、すべてのロボットが人間とインタラクションする能力と、他のロボットとインタラクションする能力の両方を備えている必要があります。それは効率性のためだけでなく、ロバスト性・コンプライアンス・協調のためでもあり、さらには異なる会社・異なるチームのロボットであっても、互いの活動を促進し合えるような関係を築くためでもあります。
4-2. 汎用的インタラクション能力と人間対応型タスク計画
Rashid: こうした将来像を踏まえると、ロボットに求められるインタラクション能力は大きく2種類に分けられます。一つは「ドメイン・タスク依存型の能力」です。たとえば清掃チームが協力してフロアを清掃するような、特定のタスクに固有の制約と方法に基づく協調能力です。これは人間とロボットが同じチームとして共同作業を行う場合にも該当します。もう一つは「汎用的なインタラクション能力」です。ある会社の清掃ロボットが別の会社の配送ロボットと廊下ですれ違うとき、両者はチームメンバーではありませんが、少なくとも空間を適切に共有できる基本的な能力を持っていることが望ましい。また、通行人——タスクのパートナーではない人間——と遭遇した場合でも、インフラが提供する汎用的な機能を活用して適切に対応できるべきです。
ロボットが人間と協働するうえで特に重要なのは、人間と作業を効果的に進めるための協調能力を構築することです。ここで私たちが参照するのは、マルチエージェント研究・対話研究・発達心理学・そして人間同士のジョイントアクション研究など、多岐にわたる分野の知見です。とりわけジョイントアクションは重要な概念です。人間がどのように協力し、タスクを共有し、共同でそれを遂行しているか——その際にどのようなシグナルが使われ、どのような役割分担が生まれ、どのようなツールが用いられているか——を理解し、ロボットが同様のことを人間との、あるいは他のロボットとのインタラクションの中で実現できるようにすることが目標です。
そのうえで私が強調したいのは、ロボットは人間と「対等ではない」という点です。人間は常にタスクに縛られているわけではありません。いつでも注意を切り替え、離脱し、目標を変える自由を持っています。ロボットはこの人間の自由度と柔軟性に適応しなければなりません。同時に、ロボット自身の振る舞いは「読みやすく(legible)」「受け入れやすく(acceptable)」「快適(comfortable)」でなければならない。これが私のチームが「人間対応型タスク・動作計画(Human-Aware Task and Motion Planning)」と呼ぶアプローチの核心です。具体的には、コスト推定を用いて複数の計画候補の中から最善のものを選択します。ロボットはタスクについて推論しながら人間を観察するだけでなく、自分自身が人間から観察されているという事実についても推論します。その上で人間の精神状態——タスクや環境についての人間の知識——を推定・予測し、自身の計画と行動において「適切さ(pertinence)」を維持しようとします。
4-3. 視点取得と人間の意図・知識状態の推定
Rashid: 人間とロボットが対面で協力し合う場合、相手の立場に立って物事を考える能力——「視点取得(Perspective Taking)」——が不可欠です。これによって相手が何をしているか、タスクをどう理解しているか、どう話しかければよいかをより的確に解釈できるようになります。たとえば相手が見えていないものを指し示して「あそこにあるよ」とは言えません。少なくとも通常の方法では通じない。こうした基本的な認識が、ロボットと人間の協働を成立させるための土台となります。
私たちがまず構築しようとしているのは、まさにこの視点取得の能力です。少なくとも「フェッチ・アンド・キャリー」のような既知のタスクや比較的単純な応用においては、この能力を実装することは技術的に可能であり、ロボットにとって非常に強力な力になると考えています。実際に私のグループでは、人間の視点を推定し、その情報をロボットの計画に組み込む仕組みを構築しており、この研究は心理学者・哲学者・ロボット工学者が連携した学際的な取り組みとして進められています。
スライドで示しているように、人間とロボットがマルチモーダルなインタラクションの中でスペース・タスク・意思決定を共有するシナリオにおいて、ロボットは単に外部の観察者として人間を見るのではなく、人間からも観察されているという意識を持ちながら、人間の精神状態とタスクに関する知識を推定・予測し、それを自身の振る舞いに反映させます。このアプローチは、ロボットが一方的にタスクを遂行するのではなく、人間との協働の質を継続的に評価し維持するための基盤となるものです。単に適応を繰り返すだけでは不十分で——適応し続けることで人間をかえって煩わせることもあります——ロボットは「自分のインタラクションの質が全体として適切であるか」を大局的に評価する能力を持つことが重要です。私たちはこれを「pertinence(適切さ)」と呼んでいます。ロボットが自らの行動の適切さを確保し、それが損なわれていると判断した場合には必要な対処を取れるようにすること——それが今私たちが目指している研究の方向性です。
5. 第4講演:環境モニタリングへのマルチロボット応用(Ani Hsieh)
5-1. 気候変動・自然災害への対処とロボットチームの必要性
Ani: 私のグループが主に取り組んでいるのは、環境モニタリングのためにロボットチームや集団を活用するという科学的・技術的課題です。具体的には、海洋がどのように変化するかをより深く理解し予測するために、海洋でのデータ収集を改善したいと考えています。海洋は地球全体の気候や気象パターンを左右する存在であり、私たちは今まさにその気候変動の影響を日々目の当たりにしています。
現在私たちが直面している課題をいくつか挙げます。台風「ハイネムル」の衛星画像をご覧ください。これは熱帯性低気圧から非常に短期間でカテゴリー3〜4の嵐へと急激に発達しました。また、米国とヨーロッパ両方でより大規模で消火困難な山火事が増加しています。私が住んでいるフィラデルフィアでは、2年前にハリケーン・アイダの影響で深刻な洪水が発生しました。さらに気候変動やその他の地政学的影響により、世界規模で人口の大移動が起きており、人々は非常に長い距離を非常に過酷な地形を越えて移動しています。これらの課題に加え、こうした問題がなかったとしても、私たちは経済活動のために自然環境に依存しており、事故が起きれば環境的な悪影響だけでなく、地域経済にも深刻なダメージをもたらします。だからこそ、ロボットチームは大規模な環境を持続可能・公平・回復力のある形でモニタリング・管理・保護するために、不可欠なツールであるというのが私の主張です。
5-2. 大規模環境監視の課題と異種センサーネットワークによるアプローチ
Ani: 自然環境の重要性にもかかわらず、その多くはいまだ十分に探索されておらず、そのダイナミクスの複雑さへの理解も不十分です。理由の一つは、これらが非常に広大な環境であり、著しいダイナミクスを持つことから、ロボットを展開すること自体が非常に難しいという点にあります。
現状では、「ヘラクレス」のような大型の遠隔操作型潜水艇(ROV)や、オレンジ色の船体が特徴的なセルドローンのような遠隔操作船が使われています。これらは大型で、ほとんどが遠隔操作、あるいは人間が直接操縦するものであり、極めて高価なため大量に展開することができません。しかし環境の空間的・時間的変動を本当に理解するには、その状態空間と時間を同時にサンプリングできる能力が必要です。海洋学者はアルゴスフロートやラグランジュドリフターといった受動的な装置を使うこともありますが、これらは静的な環境ではその場に留まるものの、海洋では海流に流されてしまいます。データを適応的に収集するためには、本物の自律型ロボットが必要です。
そこで私のグループが目指しているのは、静的・局所的な固定センサーと動的・移動型プラットフォームを組み合わせた、大規模でスマートかつ適応的な環境モニタリングネットワークの構築です。このネットワークは衛星・海面・水中・空中・受動型など多様なプラットフォームを含む異種ネットワークであり、継続的・持続的な環境サンプリングを実現します。収集された多解像度データを融合することで一貫した環境ダイナミクスの把握が可能になり、その環境モデルが自律型プラットフォームの展開戦略にフィードバックされ、ネットワーク全体がオンデマンドで感知ローテーションを適応させることができます。結果として、高品質なデータが高品質なモデルをもたらし、より効果的なサンプリング戦略へとつながる好循環が生まれます。
重要な哲学的立場として、環境をセンサーやロボットで埋め尽くすことが目標ではありません。限られた感知リソースで何を実現できるか、そして通信が著しく制約される中でどうやってそれを達成するか、という問いに向き合うことが私たちのアプローチの核心です。海中や見通し線が確保できない環境では、利用できる通信技術は非常に低帯域かつ損失の多いものに限られます。したがって、どのようなマルチロボット戦略も、非常に限られたネットワーク接続性の下で機能しなければなりません。
5-3. 環境エネルギーの活用・省電力機体の設計・実験による知見
Ani: こうした制約に対してチャンスがあるとすれば、環境そのものが持つ力を活用できるという点です。たとえばフィリピン諸島周辺の海流を利用したエネルギー最適経路の一群を示す図があります。海洋電流を計画と制御に活かすことで、海洋ロボットのナビゲーション能力を大幅に拡張できます。しかしそのためには、関連する環境特性をモデル化する必要があり、何を追跡すべき特性として捉えるかを判断すること自体が非常に難しい知覚の問題です。
こうした課題に対して私のグループでは、サイクルのすべての部分に取り組んでいます。まずロボットをどこに送るかの計画についてです。Amandaのグループとの共同研究として、異なる種類と能力を持つ異種チームを対象に、どこに展開するかを決定する研究を行いました。また、通信リンクが断続的にしか確立されないような環境で、環境の力を活用して通信ネットワークを形成する方法も研究しています。この研究ではHerbertのグループとも連携しており、青いロボットが持つ情報を赤いロボット——常には通信できない——へと時間をかけて伝播させる様子が映像で確認できます。
データの融合については、実際の実験映像で示します。流体中に色素を拡散させ、ロボット群が搭載センサーによるデータを通じてそのフィールドを再構成します。ロボットたちは動画の中で動き回りながら、サンプリング位置を継続的に更新し、新しい情報をモデルの記述にリアルタイムで融合させています。さらに、こうした複雑な環境プロセスについて私たちが持っている膨大な物理的知識と、収集したデータの両方を活用して、より予測精度の高いモデルを構築することも取り組んでいます。
機体設計の観点では、環境の力をより効果的に活用しつつ、長時間その環境に留まりながらデータ収集と探索を行える、新しいタイプの機体を設計することも研究しています。一つは形状を変化させることができる折り紙ボールで、形状変化を通じて環境ダイナミクスとのインタラクションを改善できます。もう一つは「Modbot」と呼ばれる非常に低コストの単一モーター型フロートです。これらは流れに抗して自力推進する能力はありますが、根本的に動力が不十分なプラットフォームです。しかしそのような制約の中でいかに賢く動くか、という問いそのものが私たちの研究課題となっています。
Ani: まとめると、私が提示したいのは「システムレベルの共設計(co-design)問題」としてのマルチロボット環境モニタリングです。ロボットの構成要素を個別に改善するのではなく、ロボットが実際に環境とどのようにインタラクションするかを考慮しながらシステム全体を設計し、最適化によって機体の運用寿命を延ばし、通信を維持し、データ収集の質を高めるという発想です。この研究は工学・科学・政策立案者の間の幅広い連携を必要とするチームとしての取り組みであり、気候変動という私たちの時代の最大の挑戦に対してロボット技術がどう貢献できるかを示す一例です。
6. パネルディスカッション
6-1. 自律性とAIの関係:適応的自律性とスケールの2軸
Herbert: パネルディスカッションに移ります。まず全員に問いかけたいテーマがあります。私たちはよく「自律性」と「人工知能」という言葉を使いますが、この2つはどういう関係にあるのでしょうか。自律性はAIの一部なのか、あるいはAIが自律システムの重要な要素なのか。両者は共存できるのか、あるいは独立して存在できるのか。AIなしの自律性、自律性なしのAIはあり得るのでしょうか。
Maria: AIというのは突き詰めれば、意思決定を行うシステムを作ることだと思います。ですから自律性はAIの核心にあるものです。ただし「自律性」をどう捉えるかによります。固定されたルールに従って動くロボットは、確かに自分で動いてはいますが、私はそれを本当の意味での自律性とは呼びません。それは硬直した動きです。私たちが話しているシステムの多くは、何らかの学習能力や環境への適応能力を持っています。現在の状況に合わせて意思決定し、適応できること——それがより重要な意味での自律性だと思います。
Herbert: つまりMariaの見解では、自律性は適応性と結びついているわけですね。さらに一歩進めれば、レジリエンス——予期せぬ状況への対応能力——とも関係してくる。そしてAmandaへのパスにもなりますが、AIをマルチロボットシステムに適用する際の主要な課題はスケールと計算複雑性なのか、あるいはそれ以外にも重要な問題があるのでしょうか。
Amanda: 非常に興味深い問いです。データ駆動型の手法をマルチエージェント・マルチロボットシステムに適用する際、学習アルゴリズムの効率が低くなる傾向があります。単一ロボットの環境でロボットが見る必要があるサンプル数と、マルチロボットチームが見る必要があるサンプル数を比べると、後者ははるかに多い。なぜかというと、チームの規模が大きくなるほどシステムが取り得る構成の組み合わせが爆発的に増えるからです。つまりロボットが多ければ多いほど、チームが取り得る状態の組み合わせも多くなり、そのすべての構成を学習しなければなりません。これが学習アルゴリズムの効率を著しく低下させます。
Rashid: スケールには2つの方向性があると思います。一つはエージェントの数——多数のロボット——というスケール。もう一つはAmandaが触れた自律性の問題で、エージェントが直面する状況の多様性というスケールです。たとえロボットが1台や2〜3台であっても、非常に多様な状況に対応できる必要がある。AIはこの2つの方向でのスケールに対応しなければなりません。そしてマルチロボットの文脈では、「協調とは何か」「共存とは何か」「リソースの共有とは何か」「他者の行動を促進するとは何か」といった問いも重要になってきます。少数のエージェントが行動し反応し合う状況においても、これらは深く考えるべきテーマです。
6-2. レジリエンスとロバストネスの違い、および深層学習の貢献
Herbert: Amandaに特に聞きたいのですが、マルチロボットシステムにおけるレジリエンスをどう定義しますか。また、私たちが真に回復力のあるロボットシステムを開発することを妨げているものは何でしょうか。
Amanda: レジリエンスの核心は「想定外の出来事を捉える」ことにあります。ここでロバストネスとの違いを明確にしておきたいと思います。ロバストネスはよく研究されてきた概念で、古典的なアプローチでは、たとえ非常に悪い事態をモデル化しようとしていても、起こりうることについては何らかのモデルを前提としています。そのモデルに基づいて制御戦略を設計します。しかしレジリエンスが対象とするのは、本当にモデルが存在しないことです。なぜなら想定外——「分布外(out of distribution)」の事象——だからです。ブラックスワンイベントのようなものです。モデルがなければ何に対してレジリエントであるべきかもわかりません。これは絶望的な問題のように聞こえますが、マルチロボットの視点から考えると、実は突破口が見えてきます。
集団というものは冗長性・相補性・多様性という独自の特性を持っています。集合体はある時点では最適に動いていないかもしれません。冗長なリソースや潜在的・休眠中の能力を抱えているからです。しかし想定外の何かが起きたとき、その集合体は新しい状況に応じて自己を再編成し、事前にモデルを持っていなかったその想定外の事象に対応できるようになります。これが古典的なロバストネスのアプローチとレジリエンスをシステム全体の特性として捉える考え方の本質的な違いです。
特にレジリエンスに固有の概念として「satisficing(十分に満足できる解を見つける)」という考え方があります。タスクはこなしているが特に優れているわけではない、基本的にはサバイブしている状態。しかしサバイブしているからこそ、いくつかのスキルや能力を温存しており、より長い期間にわたって生き延びられる。これがトレードオフであり、システムをどう考えるべきかです。私たちは数学者・制御工学者・ロボット工学者・コンピュータサイエンティストとして常に何らかの目的を最適化しようとしてきました。しかし一歩引いて、私が本当に大切にしているのは持続可能性ではないか、柔軟性と適応性ではないかと問い直し、そこから問題の定式化を根本的に見直す必要があります。
Herbert: 深層学習はマルチロボットシステムにどのような貢献ができると思いますか。古典的な解析的アプローチでは得られないものを、深層学習は提供できるのでしょうか。
Amanda: 深層学習や機械学習・データ駆動型アプローチが大きく前進できる分野は2つあります。第1はレジリエンスと直接つながる部分です。難しい事例・逆境的な事例をデータとして生成し、ロボットが置かれるであろう困難な状況をシミュレーションして、そうした想定外の事象に事前に対処する方法を学習させることができます。モデル化できないものに対してモデル駆動型アプローチは使えませんが、想定外の事象についてのナラティブを作り、シミュレーションを通じてそれを再現することはできます。複雑ではありますが、生成は可能です。ここにデータ駆動型アプローチが従来のアプローチに対してエッジを持つ部分があります。
第2はマルチロボット・マルチエージェントの観点から非常に興味深い領域で、計算不可能な問題に対してトラクタブルな解を得るというアイデアです。計算上の問題を扱えるような小さい問題サイズに対して、最適解が何かを知っており、その解を求める計算上の問題も解決できます。その最適な振る舞いをクローニングし、機械学習器にそれをコピーさせ、得られた方策をはるかに大きなシステムに展開する。従来の方法では計算不可能だったはずのそのシステムが、クローンされた方策によって理想的・最適な振る舞いをコピーして動くようになります。そして驚くべきことに、これは通常スケールします。課題はもちろん汎化の保証ができないことですが、ある程度汎化特性を担保できる有望な方向性はあります。そこが究極のゴールです。
6-3. AIの訓練コストと環境負荷:「AIはタダではない」という気づき
Herbert: Amandaが指摘した重要な点を少し掘り下げたいと思います。AIは「タダではない」というメッセージです。エネルギーコストの問題は、コミュニティとしてまだ十分に考えられていないように思います。
Amanda: そうです、これは重要な点です。データ駆動型の手法をマルチエージェント・マルチロボットシステムに適用する際、学習アルゴリズムの効率が非常に低いという問題があります。大きなチームは多くの状態の組み合わせを持ち、それらすべての構成を学習するには膨大なデータと時間が必要です。シミュレーションも無料ではありません。実際に私のラボでは、こうした訓練の環境負荷について真剣に考え始めています。いくつかの方策を訓練するだけで、かなりのエネルギーを消費します。これを軽視することはできません。
Ani: 同感です。スケーラビリティの問題として、より大きなシステム・より複雑な環境を作れば作るほど、ロボットが対処しなければならない事柄が増え、それは暗黙的により多くのデータが必要になることを意味します。データ駆動型アプローチに「フリーランチ」はありません。データはすなわち時間であり、多くの場合エネルギーでもあります。この対応策として私たちが取り組んでいるのは、一つにはより良いアルゴリズムを開発すること。もう一つは、すでに訓練済みのモデルを凍結して保存し、再訓練なしに他のタスクに再利用できるかを検討することです。訓練に投じたリソースを節約するための、いわば「ビルディングブロック」としてのモデル活用です。
Herbert: これは私たちコミュニティ全体が真剣に考えなければならない問題です。エネルギー利用の観点から、訓練モデルのコストを定量化しようとする非常に最近の研究も出てきています。マルチロボットの文脈においても、この問題は避けて通れないと思います。
6-4. ロボットと雇用・社会的公平性:教育・創造性・アクセスの問題
Herbert: Mariaが「ロボットは人を強化するものであり、置き換えるものではない」というタイトルのAAAI講演で指摘したように、新しい技術は常に一部の雇用を奪いながら別の雇用を生み出してきました。マルチロボットシステムという文脈で、この雇用の給与と奪取のバランスをどう見ていますか。
Maria: 現時点では、ロボットの導入が経済全体を改善するという経済データがあります。ロボットは昼夜問わず働き、耐久性もある。そして重要なことは、ロボットはもともと危険な作業を代替するために導入されてきたという事実です。今日では自動車のスプレー塗装や溶接を人間が行うことは考えられません。それは人命を守ることにつながっていました。次のフロンティアは農業だと私は思います。農業の仕事の多くは非常に単純で危険で疲弊するものであり、高い教育を必要としません。ロボティクスはそうした仕事を代替することになるでしょう。
問題は「世界がその後に生まれる別の仕事に対応できているか」です。ロボット工学者・設計者としての私たちの責任は、ロバスト性・信頼性・スケーラビリティ・シンプルなインターフェースを確保することです。そして世界全体の観点では、より多くの教育が根本的な解答になります。貧困や無意味な仕事からの脱却の鍵は教育であり、教育はすべての人に平等にアクセスできるわけではありません。ロボットを修理し、動かし、より良いものにする人材、そして新しいアイデアを生み出す創造的な人材が必要です。ソーシャルネットワークはコンピュータサイエンティストが発明しましたが、世界中の人々に引き継がれ、設計者が想像もしなかった使われ方をしています。アフリカでは女性たちが夜明けに起きて何マイルも歩いて職場に向かう際に、アプリを使って互いにつながり、一人で歩かずに済むようにしているという話を聞いたことがあります。誰もそのような用途を想定してアプリを作ったわけではありません。人間の知性と創造性を信じること、そして適切なツールを与えられた人々が何を生み出すかに期待すること——それが私の立場です。
Herbert: 教育と公平性の問題、そして創造性という点を強調していただきました。ロボティクスが以前は不可能だったタスクを可能にするという側面についてはどうでしょう。
Maria: 個別配送の問題はよく語られますが、まだ実現していません。毎朝ドローンが新聞を届けるようになるかは正直わかりません。ただ、アメリカ中を走り回る大型トラックの自動化は現実的です。高速道路での自動運転が実現すれば、ドライバーは別の仕事ができるようになります。孤立した地域への物資輸送も有望な応用です。重要なのは人々の創造性です。アプリが登場して以来、誰も想像しなかった膨大な数のアプリが生まれました。適切なツールが与えられれば、人々は驚くべきものを創り出します。私はそれを非常に楽しみにしています。
Maria: また、AIについての公平性・公正性・意思決定の透明性という問題も忘れてはなりません。AIが下す意思決定が解釈可能であること、公平であること、バイアスがないこと、そしてこの技術が一部の特権的な人々だけのものではなく、すべての人がアクセスできるものであること——それが根本的なメッセージです。これは単にロボティクスの問題ではなく、AI全体に言えることです。
6-5. 人間の意図推定・空間共有ルール・多ロボット研究の優先課題
Herbert: Rashidに聞きます。ロボットが人間の精神状態や意図についてモデルを構築する「Theory of Mind(心の理論)」という概念について、人間とロボットの協働においてこれはどれほど重要なのでしょうか。
Rashid: 少なくともface-to-faceの協力・インタラクションにおいては、「相手の立場に立つ」という能力は非常に重要です。これによって相手が何をしているか、タスクをどう理解しているか、どう話しかければよいかをより正確に解釈できます。相手が見えていないものを指し示して伝えることはできません。私たちがまず構築しようとしているのはこの視点取得(Perspective Taking)の能力です。少なくともフェッチ・アンド・キャリーのような既知のタスクや単純な応用においては、この能力は実装可能であり、すでに取り組んでいます。これがロボットにとっていかに強力かを実感しています。
Herbert: ロボットの大群が人間と相互作用する場面を想像すると、これは途方もなく複雑な問題に見えます。どのような協調アーキテクチャが有効でしょうか。階層型か、反応型か。
Rashid: おっしゃる通り、この規模では膨大であり非常に複雑です。しかし私が考える方向性があります。まず分散化が必要です。ローカルに処理を行うことで、偶発的な事態への対応力やロバスト性が高まります。ある種の集中化も必要ですが、それは主に「バックグラウンド知識」のレベルでのものであるべきです。システム間で事前に共有される高次の知識——最も高いレベルの集中化はそこにある。ローカルには分散、必要に応じてローカルな階層を持つが、基本的には局所的な集中化のみ。そして、共有されたバックグラウンド知識・グローバルな知識と価値観を活用しながら、それを段階的に強化・充実させていく。
もう一つ重要な点は謙虚さ(modesty)です。問題を特定のドメインにまずインスタンス化して考えることです。近い将来に最低限達成できそうなことを目指すとすれば、たとえば空間共有の問題です。人間も異なるロボットも、異なる企業のロボット同士でも、分散した形で効率的に空間を共有できるようになること。人間同士には交通ルールがあります。それをロボットとの共存にまで拡張することは想像可能ではないでしょうか。
Herbert: 完全な分散でも完全な集中でもなく、その中間のどこかに答えがある。どこにスライダーを置くかを見極めるのが私たちの課題ですね。
Rashid: その通りです。多くの場合、分散と共有されたグローバル知識の両方が存在します。分散で処理しながら、場合によってはグローバル知識が助けになる。そしてグローバルな価値観・知識も共有されます。
Herbert: 最後に、マルチロボット研究コミュニティが今後取り組むべき最も重要な優先課題を3つ挙げるとしたら何でしょうか。
Ani: 自律性とAIは同じではないということをまず強調したいと思います。ロボットは物理的な環境の中で生きており、それがゲームを変えます。AIはツールですが、それだけではありません。フィジカリティと身体性が重要です。マルチロボットの文脈では特に、ロボット同士だけでなく環境や他のアクターとのインタラクションも考慮しなければなりません。私が特に期待しているのは、大規模サンプリングを活用して自然界について私たちが知らないことを明らかにすること——新しい物理を発見し、日常的に接している複雑なシステムへの新たな物理的洞察を得ることです。
Rashid: 私は以前から言っていますが、未来においてロボットが一人でいることは非常にまれになります。月や火星ならあるかもしれませんが、そこでさえ今や複数います。ロボットは常に人間や他のロボットとともにいます。そこで重要な能力の一つは、空間を正しく共有することです。大小のロボット、歩行・走行・飛行するロボット、あらゆるロボットが人間や他のロボットとタスクを遂行しながら物理空間を適切に共有できること——これは汎用的な能力として各システムに統合されなければならないのに、現実にはどう分離するかが明確でなく、本当の課題として残っています。
Maria: 私はもう少し広い視点から話したいと思います。まずAIが人類全体にとって善であること、一部の富裕層や特権的な人々だけのためのものではないことを確保しなければなりません。システムが下す意思決定が解釈可能であること、公平であること、偏りがないこと、そしてすべての人がこの技術にアクセスできること——それが根本的な優先課題です。
6-6. 質疑応答:デザイナーの役割・ブラックボックス問題・情報と意思決定のループ
Herbert: 聴衆からいくつかの質問が届いています。まず、HRI(人間ロボットインタラクション)の未来におけるデザイナーの役割についてです。
Rashid: 非常に重要な問いです。今まさにそれは始まっています。私たちはデザイナーの同僚たちと科学的なレベルで、またシステム構築のレベルで協力しています。コデザイン——ユーザーと共に設計すること——は重要な側面です。できればデザインのトレーニングを受けた人々に助けてもらいながら、ユーザー自身と直接コデザインすることが理想的です。これは非常に一般的なレベルでも研究できますが、特定のシステムを構築するアプリケーションの場面でもより効率的に実施できます。
Herbert: ニューラルネットワークをブラックボックスとして使う場合、システムが安全・効率的に動作することを保証するのは難しいのではないでしょうか。パフォーマンスや安全性の保証はどうやって得るのでしょうか。
Maria: 大きな問題だと思います。AIコミュニティとして、私たちはある意味で自分たちの代わりに意思決定できるものを作り出してしまいました。その意思決定がどのように行われているかを正確に理解していなければ、それが100%正しいとは言えません。言語を扱う生成系AIのシステムがその良い例です。AI研究者のコミュニティとして、ロボティクスへの影響を考える前に、まずこの問題を整理しなければなりません。大きな問題であり、どう解決するかはまだわかりませんが、必ず解決されると思います。
Rashid: 「セーフ・オートノミー」「セーフ・AI」という新しい研究領域が生まれてきており、学習を行いながらもパフォーマンス保証を考える研究者が出てきています。しかしそれ以上に、私は将来のロボットに自分自身のパフォーマンスを継続的・包括的に自己評価する能力を持たせることが重要だと思います。一つのアルゴリズムを評価するだけではなく、自分が全体としてどれだけうまくやっているかを評価すること。人間ロボットインタラクションの文脈では、ロボットがインタラクションの質を推定しようとする研究を始めています。単に適応し続けるだけでは不十分です——適応し続けることで相手を煩わせることもある。全体的な質、「pertinence(適切さ)」を評価し、適切でないと判断したら対策を講じる。これが重要だと思います。
Herbert: 最後に、情報と意思決定の役割についての聴衆からの質問です。特に新しい情報をリアルタイムでどう取り込み、意思決定にフィードバックするループをどう捉えるかについて。
Ani: 人間も同じことをしていると思います。環境についての事前モデルを持ち、環境とインタラクションし、状況を評価し、そのモデルを更新するかしないかを判断し、意思決定を行う。これがまさに私たちがロボットにやらせたいことです。適応するというアイデア、調整できるというアイデア——新しい情報を何らかの形で同化し、既存の知識体系と比較して、それに基づいて情報や意思決定を更新できること。これが私たちのシステムに実現させたいことの本質です。
Rashid: 情報については広い概念です。ロボットが受け取る情報、それをどう使うか、タスクを効果的に遂行するためにどんな情報が必要か、そして十分な情報と適切な情報を確実に抽出できているか。これはよく忘れられがちです。エンジニアは最適性を追い求めるあまり、何かを見落とすことがある。タスクを達成するために必要十分な情報を抽出することの重要性を、私たちはもっと意識すべきだと思います。
Herbert: 本日は皆さんの貴重な知見と視点を共有していただき、誠にありがとうございました。Amanda、Maria、Rashid、そしてAni、皆さんの発表とディスカッションに心から感謝申し上げます。参加者の皆さんも積極的にご質問いただきありがとうございました。
