※本記事は、Wendy Ju氏(コーネル大学 情報科学准教授)による講演「都市におけるロボット:都市ロボットに対する暗黙の社会的期待の発見」の内容を基に作成されています。本講演は、国際電気通信連合(ITU)が50以上の国連パートナーと連携して主催し、スイス政府との共催で開催されるプラットフォーム「AI for Good」のディスカバリーイベントとして配信されました。 モデレーターはITU AI・ロボティクス・プログラムオフィサーのGuillem Martinez Rouraが務めました。講演の詳細およびオリジナル動画は https://www.youtube.com/watch?v=FODWIRR3aak でご覧いただけます。 本記事では講演内容を要約しております。なお、要約や解釈による誤りがある可能性もありますので、正確な情報や文脈についてはオリジナルの動画をご視聴いただくことをお勧めいたします。また、AI for Goodのネットワーキングコミュニティプラットフォーム「ニューラルネットワーク」(https://aiforgood.itu.int/neural-network )もあわせてご参照ください。
1. イントロダクション
1-1. AI for Good プラットフォームと本セッションの位置づけ
Gile Martino(ITU): 本日はAI for Goodディスカバリーイベント「都市におけるロボット——都市ロボットに対する暗黙の社会的期待の発見」へようこそ。AI for Goodは、国際電気通信連合(ITU)が主導し、50以上の国連機関と連携してスイスと共同開催する、国連の人工知能に関する主要プラットフォームです。そのミッションは、AIが人類に奉仕する可能性を引き出すこと、すなわちマルチステークホルダー型のプラットフォームとして、解決策・標準・スキルを推進することにあります。本セッションはAIおよびロボティクス・ディスカバリーシリーズの一環であり、自律型・知能型システムにおける研究とイノベーションを取り上げ、これらの技術が人類の最大の課題にどのように貢献できるかを探るものです。
本日のセッションでは、配達・清掃・安全管理・都市モニタリングなど、さまざまな用途においてロボットが都市空間で活動し始めている現状を掘り下げます。ロボットの展開を成功させるためには、技術的な能力だけでなく、公共の場でのインタラクションを形成する暗黙の社会的規範を理解することが不可欠です。本日の発表者はフィールド実験の知見をもとに、現実の都市環境がロボットにとってナビゲートすべき「語られざる期待」をいかに浮かび上がらせるかを示してくれます。
1-2. 発表者紹介と研究の背景
Gile Martino(ITU): 本日の発表者をご紹介します。Wendy JはコーネルTech(ニューヨーク市ルーズベルト島)の情報科学准教授です。それではWendy、よろしくお願いします。
Wendy J(コーネル大学): ありがとうございます。本日は都市環境におけるロボットの研究についてお話しします。私が使用しているのは「トラッシュバレルロボット」、つまりゴミ箱型のロボットです。これは特別に高度なシステムではありませんが、ロボットが都市空間に入り込んだときに人々がどのようにインタラクションするかを理解するという目的には十分に機能します。
私のキャンパスはニューヨーク市内のコーネルTechです。ルーズベルト島に位置し、背後にはマンハッタンが広がっています。日常的にニューヨーク市内を歩き回っているからこそ、私たちが開発している技術が実際に世の中に出たときにどうなるかを考慮できていないことに気づかされます。コーネルTechはコーネル大学の大学院・研究センターであり、応用科学キャンパス建設のための4億ドルの競争に勝利して設立されました。その設立条件として、外部との連携を通じてデジタル技術が人々の役に立っているかを真剣に考えることが求められており、それはまさにAI for Goodのミッションと合致しています。キャンパスのミッションは、技術を世界的な課題に応用し、外部パートナーと連携することです。
今回お話しする研究は、私が2018年にコーネルTechに着任する以前、スタンフォード大学のリサーチサイエンティストとして在籍していた時期にまでさかのぼります。スタンフォードでの実験が、現在の研究の出発点となっています。
2. Wizard of Oz プロトコルによる先行実験(スタンフォード)
2-1. 実験設計と手法の概要
Wendy J(コーネル大学): スタンフォードでの実験では、トラッシュバレルロボットをキャンパス内に展開しました。この研究で採用したのが「Wizard of Oz プロトコル」と呼ばれる手法です。通常の自動化システムであれば、あらかじめプログラムされた一定の動作しかできません。しかしWizard of Ozスタディでは、実際に自動化されたシステムを使うのではなく、人間のオペレーター(「ウィザード」)がリモートでロボットを操作します。これにより、私たちがあらかじめ想定していなかった状況にもロボットが柔軟に対応できるようになります。
ウィザードは、現場で何が起きているかをすべて人間として理解した上で即興的に対応できます。ただし、実際に使えるインタラクションの手段はロボットが持つ能力の範囲に限られます。つまり、ウィザードはロボットを通じて適切な行動をとることで、自動化が実現したときにインタラクションがどうあるべきかを私たちが把握できるようにしてくれます。重要なのは、私たちは参加者に嘘をつくわけではありませんが、ロボットがどのように動いているかも説明しないという点です。人々が自然にとる行動こそが、ロボット研究者として知りたいことであり、そこには私たちが決して事前に想定できなかったような行動が数多く現れます。
2-2. 観察された行動と予想外の気づき
Wendy J(コーネル大学): 実験動画を見て明らかになることがいくつかあります。まず、人々はロボットに対して頻繁に話しかけます。ゴミを捨てるだけなら、わざわざロボットに話しかける必要はないはずです。しかし、ロボットが自分の期待通りに動かないとき——たとえばゴミを求めて近づき続けているように感じたとき、あるいはどこかで動けなくなってしまったとき——人々はロボットに向かって話しかけ、ロボットが自分の言葉を理解しているかのように期待します。実際にはロボットは言葉を返さないにもかかわらず、です。
当初私たちが想定していたのは、人々がロボットの用途を理解できるか、そしてどのようにインタラクションすればよいかを把握できるか、という点でした。インタラクションの理解そのものは問題ありませんでした。ゴミを持っていないときには「ゴミはないよ」と説明するなど、人々はロボットに対して状況を言語化しようとします。
しかしもっと興味深い場面もありました。ある子どもが、ゴミをエサに見立ててロボットをおびき寄せようとしたのです。ゴミを手に持ち、ロボットの前を歩いて誘導しようとする様子は、まるで犬に食べ物を差し出して誘う行動にそっくりでした。私たちはロボット開発において「人間的な等価物」を考えがちです。テーブルを片付けたりゴミを回収したりするバスパーソンのような役割をイメージしていました。ところがこの子どもの行動を見て、私たちは大笑いしながら「この子はゴミ箱がゴミを乞うていると思っているんだ」と気づきました。
さらに分析を進めると、実はこれは子ども特有の行動ではなかったことがわかりました。大人も同じことをしているのです。箸袋を手に持ちながらロボットに向かって口笛を吹く人物の映像——まるでベーコンを持って犬を呼んでいるかのようなその行動は、フィールドで実際にインタラクションを研究しない限り、決して気づけなかったものです。ロボットを「道具」として設計した私たちの想定とは全く異なる「動物的な存在」としてのモデルが、人々の中に自然と形成されていたことは、非常に示唆に富む発見でした。
3. ニューヨーク市での実地実験
3-1. アスタープレイスでの実験——インタラクションパターンと暗黙の期待
Wendy J(コーネル大学): スタンフォードでの実験を経てニューヨークに移った私は、同様の研究を大陸をまたいだ別の都市でも再現できるかどうかに強い関心を持ちました。スタンフォードと同じ行動パターンが、数年後のニューヨークでも観察されるのかを確かめたかったのです。
その前提として、都市空間におけるロボット展開の文脈を整理しておく必要があります。過去50年間、ロボットは工場や建設現場のような産業環境に限られてきました。しかし今、ロボットは私たちの日常的な近隣空間へと展開されつつあります。その先駆けとなった事例のひとつが、NYUのCasey Kinszerによる「Tweenbot」です。一方向にしか進めない段ボール製の小さなロボットに「ワシントンスクエアパークの反対側の角に行きたい」と書いた旗を立てただけのシンプルなアート作品ですが、通行人たちが自発的にロボットを助けて目的地まで誘導するという行動が自然に生まれました。これはアートプロジェクトでしたが、研究としての示唆も大きいものでした。2009年にはウィーンの市街地広場で自律型の都市探索ロボットが展開され、画面を通じて人々に道案内をしたり、周囲の環境をイメージングしたりするという実験も行われています。観光案内のようなアプリケーションが可能だという認識が広がり始めた時期です。
現在はそうした試みが商用実践へと移行しつつあります。たとえばServe Roboticsは比較的最近上場した企業で、世界各地でさまざまな配達ロボットを展開しています。また、混雑した場所でのスリや不審な活動を監視する警備ロボット、映像を記録して後から参照できるようにする監視目的のロボット、芝刈りや街路清掃といった日常的な作業を担うロボットも普及し始めています。スカンジナビアの企業Prombiaによる街路清掃ロボットは、雪や泥にも対応できる設計が印象的でした。こうしたロボットは、必要に応じてオンデマンドで展開できる点でも優れており、人々の周囲で安全に運用できれば非常に有用です。
一方で、商用ロボットが都市の社会的文脈に対応しきれていない事例も数多く存在します。ある配達ロボットが警察の封鎖(ポリスコードン)に遭遇したとき、それが何を意味するかを理解できず、ただ突破しようとし続けました。最終的には警察官たちもロボットを止める方法も回避させる方法もわからず、通過させるしかなかったという出来事が記録されています。こうした事例が示すのは、技術的な移動能力だけでは不十分であり、都市の社会的文脈を理解する能力がいかに重要かという点です。
このような背景のもと、私はニューヨーク市内でのフィールド実験に取り組みました。最初の実験地として選んだのは、マンハッタンにある台形型の交通島「アスタープレイス」です。この場所を選んだ理由は、近くにカフェがあり、昼食時には多くの人々が金属製のテーブルや椅子に座って飲食するため、ゴミが発生しやすい環境だからです。実験は昼食時間帯を中心に2時間程度実施しました。使用したロボットは、リサイクルされたホバーボードを動力源とし、360度カメラを搭載したトラッシュバレルロボット2台です。一般ゴミ用とリサイクル用の2台を分けて展開し、スタンフォード同様にWizard of Ozプロトコルを採用しました。
実験で観察されたインタラクションには、典型的な構造がありました。人々がゴミを差し出す際には、腕を伸ばしてテーブルから少し距離を置くような動作によってゴミがあることを示し、ロボットがそれを受け取ったあとに元の姿勢に戻るという、一種の言語的なやり取りに似た流れが繰り返し見られました。一方で、そうした前置きなしにロボットに近づいてゴミを直接投入するだけの「ドライブバイ」と呼べる行動パターンも存在しました。また、ロボットがどちらに進むかわからないために、人々がロボットの動きを読みながら道を譲り合う場面も繰り返し見られました。
スタンフォードで観察された主要な行動——ロボットが詰まったときに助けようとすること、常に話しかけること、ゴミでおびき寄せようとすること——はニューヨークでも同様に観察されました。しかし、それに加えてニューヨークでは私たちが予想していなかった発言がいくつか記録されました。
まず、ある参加者が「彼らはまだ学習中だよ、まだ子犬みたいなもの(still pups)」と言いました。公共の場に展開されたロボットが使われていく中で改善・成長していくという期待は、私たちにとって非常に驚きでした。展開後に変化するという前提を持っている人がいるとは思っていなかったからです。次に、ある女性が2台のロボットを「バディ(仲間)」と呼び、お互いの存在を認識して連携して動いているという前提で話していました。実際には2台のロボットは互いを認識していませんが、人々がそのような協調動作を当然のこととして想定していることがわかりました。さらに、「もう十分長く座っていると感じてロボットが来たんだと思う」という発言もありました。これはロボットが個々の利用者の滞在時間を把握しているという期待を示しており、確かに考えてみれば、座ったばかりの人にすぐ近づくのは不自然で、ある程度の時間が経てばゴミを回収しないのも不自然です。ロボットが人の滞在時間を追跡する必要があるという設計上の示唆が、フィールドでの人々の発言から自然に導き出されたのです。
3-2. TikTok拡散が明らかにした「誰のロボットか」問題
Wendy J(コーネル大学): 現代の実験では全員がカメラを持っています。実験中も多くの人がトラッシュバレルロボットを動画撮影していましたが、最も興味深い映像のいくつかは私たちが撮ったものではなく、後から私たちのもとに届いたものでした。あるTikTok動画が送られてきたのですが、そこにはキャプションとして「Eric Adamsがニューヨーク市の清掃予算でこんなことをしている」という皮肉めいたコメントが添えられていました。当時のニューヨーク市長の名前を出して、清掃予算をロボットに無駄遣いしているという解釈です。
この出来事が明らかにしたのは、私たちが設計段階でまったく問いかけていなかった問題でした。「これは誰のロボットなのか」という問いです。私たちはロボットをある種、誰かのものになりうる汎用的なものとして想定していました。しかし実際に道でロボットと出会う人々にとって、「誰のロボットか」は非常に重要な問題でした。実際、私たちに話しかけてきた人々の大多数が「ロボットはどんな仕組みで動いているのか」ではなく「このロボットは誰のものか」を尋ねてきました。ホバーボードを動力源にした設計を誇りに思っていた私としては少々残念でしたが、それが現実でした。
さらに、そのTikTok動画に寄せられたコメントも示唆に富んでいました。「全区に展開すべきだ」という声がある一方、「特にニューヨーク市では予算の無駄遣いだ、犯罪が増えているのに」という批判や、「ブロンクスじゃ長持ちしないだろう」という声、そして「ブロンクスにも清掃が必要な地域がたくさんあるのに、なぜここだけ」という意見もありました。私たちが最初の実験地として選んだアスタープレイスは、NYU大学やクーパー・ユニオンに近いミッドタウン・マンハッタンの比較的裕福なエリアで、通勤者や観光客が多く集まる場所です。そのことへの批判として、常住住民が多くアシスタンスが行き届いていないアウターボロー(外縁区)にこそロボットが必要だという主張が多く寄せられたわけです。この問いかけが、私たちの次の取り組みへの動機となりました。
3-3. アウターボロー展開——公平性の追求と新たな発見
Wendy J(コーネル大学): この公平性への問いに動機づけられ、私たちはニューヨーク市内の複数の地域での展開に取り組みました。現時点ではダウンタウン・ブルックリンのアルビー・プラザ、スタテンアイランドのテッパン・パーク、クイーンズのアストリア・パーク、ブロンクスのリトル・イタリーと、ニューヨーク市内の多様なエリアすべてで展開を実施しています。まだすべての結果を発表できているわけではありませんが、各地での実験映像からは興味深い知見が得られています。なお、アウターボローでの展開はメディアとの連携も不可欠でした。外縁区にトラッシュバレルロボットが現れること自体がニュースになるほど注目を集め、そうした報道を通じて日常の住民にとってこのような技術が何を意味するかを広く伝えることができました。
アルビー・プラザでの映像では、学生と思われる若者たちがロボットに対して礼儀正しく接する様子が印象的でした。ゴミがないときには「ゴミはないよ」とロボットに説明し、インタラクションの終わりを伝えようとする行動が繰り返し観察されました。人々はロボットに謝るような素振りも見せながら、ロボットが次に取るべき行動を理解できるよう積極的に説明しようとしていました。
特に印象的だったのはアイスクリームを食べていた女性とのやり取りです。ロボットが最初に近づいたとき、彼女は少し楽しそうな様子でアイスクリームをまだ食べている最中だと説明しました。ところがその後、ロボットが再び彼女のテーブルに近づいてきたとき、彼女は明らかに苛立ちを見せ「まだゴミはない、あっちへ行って」とはっきり伝えました。このやり取りから見えてくるのは、人々がロボットに対して「一度会ったことを覚えていること」、そして「最初に伝えた内容を記憶していること」を当然のように期待しているという事実です。
アウターボローでの展開がマンハッタンと異なるもう一つの点は、同じ人物と複数回出会えることです。マンハッタンは通勤者や観光客が多く、同じ人に再び会う機会はほとんどありません。一方アウターボローでは、広場を自分たちの「居間」のように使っている住民が多く、同じ人物との継続的なインタラクションが自然に発生します。「また来たね、あとで来て」と親しみを込めて話しかけてくる住民もいて、そうした場所ならではの関係性の中でロボットへの期待がより鮮明に現れてきます。
また、こうした実験全体を通じて繰り返し観察されたのが、人々がロボットの振る舞いに対して積極的に指示やフィードバックを与えるという行動です。「もっとうまくやれるはずだ」「ここにゴミがある」「そっちじゃない」といった言葉を絶えずロボットに投げかけています。現時点で市場に出回っている商用ロボットの中に、こうした人々の発話を受け取って学習する機能を持つものは一つも存在しません。しかし人々は、まるでロボットが聞いて理解しているかのように、常に話しかけ続けるのです。
4. 都市環境とロボット適性の分析
4-1. ジャニターとの協働実験——歩道ナビゲーションの課題
Wendy J(コーネル大学): フィールド実験を重ねる中で私たちが着目したのは、ロボットが実際に役立てる場所と、そうでない場所の違いです。ゴミ回収という観点では、トラッシュバレルロボットが拾えると便利なゴミが多く落ちている場所ほど、歩道のナビゲーションが困難なケースが多いという現実がありました。そこで私たちは、実際に清掃作業を行うジャニター(清掃員)に密着し、ロボットが彼の仕事をどのように補助できるかを探る実験を行いました。
研究グループのメンバーがジャニターと会話した後、彼が実際に作業を始めると、学生たちはその後をついて回りました。この追跡実験の中で明らかになったのは、歩道上の段差や障害物がロボットにとっていかに難しい課題であるかという点です。私たちはロボットをより速く動かすようにプログラムして段差を乗り越えさせようとしましたが、それだけでは不十分な場面が多くありました。
さらに根本的な課題として浮かび上がったのが、ニューヨーク市特有の廃棄物処理の慣行です。ニューヨークでは、ゴミは容器ではなくビニール袋に入れて路上に出す方式が一般的です。ところが、リサイクル品を探す人々がその袋を開封してしまうことがあり、結果として袋に入れてきちんと出されたゴミが路上に散乱するという状況が生じます。ジャニターはこうした状況に対応するために、歩道から車道に出て作業するといった柔軟な動きを日常的に行っています。しかし現状のトラッシュバレルロボットにはそのような歩道外への移動能力が備わっておらず、ジャニターの仕事を真に補助するためには歩道の外にも出られる設計が必要であることが、この実験を通じて明らかになりました。
4-2. 都市フィンガープリンティングによるロボット展開マッピング
Wendy J(コーネル大学): フィールド実験と並行して私たちが取り組んでいるのが、「都市フィンガープリンティング」と呼ぶアプローチによる都市環境の大規模分析です。これはUberやLyftのタクシーに搭載されたダッシュカメラの映像データを活用し、コンピュータビジョンによって都市環境を解析するというものです。マンハッタン全域にわたる大量のダッシュカメラ映像データセットを用いることで、私たちが日常的に感覚として持っている都市の特徴を、定量的・空間的に分析することが可能になりました。同様の分析はサンフランシスコでも実施しており、非常に高い密度でデータが得られています。
この手法によって可視化できるのは、たとえば警察の展開が多い場所、許可を受けていない仮設足場が存在する場所、あるいは人や障害物が密集して歩行空間が狭くなっている「最も閉所感の強い」エリアといった情報です。こうした情報を都市全体にわたって地図上にマッピングすることで、ロボットが展開しやすい場所と困難な場所を事前に把握できるようになります。この分析はAAAI 2025で発表した研究であり、世界規模で展開していくことの意義も大きいと考えています。
重要なのは、このマッピングの活用方法が一義的ではないという点です。ロボットを展開しやすい場所を見つけることは確かに有用ですが、どのエリアにロボットを入れるべきか、あるいは入れたくないかを決めるのは、最終的にはそのコミュニティ自身であるべきだと私は考えています。このマップはその判断を支える情報基盤として機能するものです。
また、こうした都市環境の理解を深めるためにロボット自身を活用するという逆方向のアプローチも考えられます。ロボットがセンシングしながら移動することで、より細かい粒度での環境情報が収集でき、展開マッピングの精度をさらに高めることができます。都市環境の理解とロボットの展開は、互いを高め合う循環的な関係にあるといえます。
Gile Martino(ITU): 非常に興味深い取り組みですね。ロボットが都市を理解するためのデータを都市から収集し、その理解がさらにロボットの展開を最適化するという、双方向の関係が成り立っているわけですね。
Wendy J(コーネル大学): まさにそうです。私の研究はニューヨーク市内に絞ったものですが、それだけでも非常に多様な環境や文脈、そしてインタラクションのパターンがロボットには求められることがわかります。こうした研究は世界規模で行われる必要があります。ロボットによる支援が求められる場所はどこにでもあり、それぞれの地域でどのような形が適切かを考えていくことが重要です。
5. 主要な発見と理論的考察
5-1. 人々の暗黙的な社会的期待の全体像
Wendy J(コーネル大学): 一連のフィールド実験のまとめとして、いくつかのテイクアウェイをお伝えします。都市ロボットはすでに社会的な都市環境に導入されつつあります。そしてロボットはそこで多くの課題に直面しています。なぜなら人々はロボットがどのようにインタラクションすべきかについて潜在的な理解を持っており、その理解こそがロボットのパフォーマンスにとって本質的に重要であるからです。そして人々はその期待を常に言語化して伝え続けています。ロボットがそうした入力に対してオープンでなければ、フラストレーションが生まれるだけです。
これらの実験全体を通じて得られた最も重要な知見は、都市空間に展開されたロボットに対して人々が非常に具体的かつ一貫した暗黙の期待を持っているという事実です。これらの期待は事前に教えられたものではなく、ロボットとのインタラクションの中で自然に表出してくるものです。
まず、人々はロボットが自分のことを認識して記憶していることを当然のように期待します。アルビー・プラザでアイスクリームを食べていた女性の例が象徴的ですが、一度「まだ食べている」と伝えたにもかかわらず再び近づいてきたロボットに対して苛立ちを見せたのは、「一度伝えたことは覚えているはず」という前提があったからです。次に、複数のロボットが互いを認識し協調して動いているという想定も広く見られました。2台のトラッシュバレルロボットを「バディ」と呼び、連携して仕事をしていると話していた女性がその典型です。さらに、ロボットが使われていく中で学習・改善していくという期待も複数の参加者から観察されました。「まだ子犬みたいなもの、学習中だよ」という発言はその期待を端的に示しています。加えて、利用者の滞在時間や文脈をロボットが把握しているという想定も見られ、「もう十分長く座っていたから来たんだと思う」という発言にそれが現れていました。
そしてこれらの期待すべてに共通しているのが、「話しかければロボットは理解してくれる」という前提です。ロボットが言葉を返さなくても、詰まったとき、期待通りに動かないとき、インタラクションを終わらせたいとき——あらゆる場面で人々はロボットに向かって話しかけ続けます。現時点で市場に出回っている商用ロボットにこうした発話を受け取って学習する機能は存在しませんが、人々はロボットがいつかそれを実現すると信じているかのように、絶えずフィードバックを与え続けています。
こうした研究はニューヨーク市に限らず、世界規模で行われる必要があります。人々が支援を必要としている場所はどこにでもあり、それぞれの地域でどのような形のロボット展開が適切かを考えていくことが重要です。フィールド実験のための新しい手法を開発し、都市規模の研究を実施することが、多様な展開先にロボットを適応させるための鍵となります。
5-2. モラベックのパラドックスと社会的インタラクションの難しさ
Gile Martino(ITU): 発表を通じて特に印象的だったのは、人々がいかに素早くロボットに知性を投影するかという点です。自分のことを理解してくれる、以前の出来事を覚えている、他のロボットと連携している——そうした期待がごく自然に生まれていました。これは現在のロボットの実際の能力と、人々が公共空間で自然に期待することの間のギャップについて何を示唆しているのでしょうか。
Wendy J(コーネル大学): 1980年代にHans Moravecが提唱した「モラベックのパラドックス」がここで非常に重要になります。このパラドックスが示すのは、チェスや囲碁のように人間が難しいと感じることは機械にとって比較的容易である一方、物を認識したり拾い上げたりといった人間が当たり前にできることは、ロボットや機械にとって実は非常に難しいという逆説です。
社会的インタラクションはまさにこのパラドックスの典型です。進化的に考えれば、人間という種が誕生する以前から動物たちは社会的なインタラクションを行っていました。意図を読み取り、コミュニケーションをとり、協調するという能力は、私たちが意識することもないほど深く身体に染み込んでいます。だからこそ人々は、それがロボットにとって「知性的な偉業」であるとは思わないのです。ゴミ箱型のロボットに対してさえ、当然のように社会的なインタラクションを期待します。
しかしロボティクスの研究者の立場からすると、この映像を見せると「これは悪夢だ、どうすればいいかわからない」という反応が返ってくるほど、実装は極めて困難です。都市空間においてこのパラドックスは特に鮮明に現れます。機能的なロボットと社会的なロボットを分けて考えることが多かったのですが、私の研究が示しているのは、どれほど純粋に機能的なロボットであっても、人の周囲にいる限りは社会的なインタラクションが発生するという現実です。人々はゴミ箱に自分の孫の話をするわけではありませんが、それでも多くのインタラクションが起きており、ロボットがその文脈や環境、インタラクションの展開の仕方について具体的なことを学習することを期待しています。そしてそれはLLMが会話のトレーニングを受けてきたような類のものとは本質的に異なります。ただ私は楽観的です。こうした課題に正面から向き合うことは可能であり、人々の周囲でロボットを使う以上、向き合わなければなりません。
5-3. 信頼・ガバナンス・プライバシーへの市民の感度
Gile Martino(ITU): もう一つ興味深かったのは、人々がロボットの仕組みよりも「誰のロボットか」を気にするという点です。これは公共空間における信頼と正当性について何を示しているのでしょうか。ロボットへの社会的受容はデザインと同じくらい、ガバナンスや説明責任の問題なのでしょうか。
Wendy J(コーネル大学): そう思います。私たちは常に意識しているわけではありませんが、自分たちの生活を取り巻く社会的な制度や仕組みをしっかりと感知しています。新しい技術を目にしたとき、人々が最初に問うのは「これは誰のものか、そしてその存在と自分はどういう関係にあるのか」ということです。カフェのロボットなら自分は客です。市のロボットなら自分は納税者であり、あるいは訪問者です。そのような帰属関係が、そのロボットとどう接するべきかという規範を決定します。
興味深いことに、「どの機関のロボットか」によってインタラクションの規範がどう変わるかを意図的に検証する実験はまだ実施できていません。しかしアスタープレイスでの経験を踏まえると、これは非常に重要な変数であり、ぜひ今後取り組むべき研究課題です。ロボットはどこに置かれるか、地面はどのような状態か、周囲の人々は何をしているか、誰のロボットか——こうしたすべての文脈的要素がインタラクションのあり方を規定します。つまりすべてのロボットについて、その文脈に即した研究を積み重ねていく必要があります。
プライバシーについても、市民の感度は非常に高いことが見えてきています。人々は、複数日にわたって同じロボットと継続的なインタラクションを成立させるために十分なセンシングや記録をロボットが行うことは許容する傾向があります。しかしその情報が政府と共有されることには強い抵抗感を示します。ロボットがどのように情報を取得し、誰がそれを見られるのかを明確に伝えることは、展開にあたっての重要な設計課題です。データのキャプチャ・保存・共有の方法を市民はすでに強く意識しており、その透明性を確保することなしに都市ロボットへの信頼を築くことはできません。
6. 規制・標準化と今後の展望
6-1. 商用展開の現状と課題——LLMによる改善の可能性と限界
Gile Martino(ITU): 発表の中で、真の意味での都市展開に対応できている商用ロボットはまだ存在しないとおっしゃっていました。多くの企業がまず移動・ナビゲーションに注力している一方で、人々はより高度な社会的理解を期待しています。こうした人間とロボットのインタラクションをより高いレベルで実現するために、今後どのような発展が必要で、いつ頃それが可能になるとお考えですか。
Wendy J(コーネル大学): 社会的なロボットの中には、非常に高度な音声インタラクション機能を持ち、長い会話ができるものも存在します。LLM技術がそうした方向をさらに加速させていくことは間違いないでしょう。ただ、私の研究が示しているのは、機能的なロボットと社会的なロボットを分けて考えるという従来の枠組みでは捉えきれない現実です。純粋に機能的なゴミ箱型ロボットに対してさえ、人々は社会的なインタラクションを行います。長い会話をするわけではないものの、文脈や環境、インタラクションの展開について非常に具体的なことをロボットが学習・理解することを期待しています。
問題はそのような期待に応えるためのデータです。LLMは会話のトレーニングを受けていますが、人々がゴミ箱ロボットに向かって「そっちじゃない」「もう少し近づいて」と言うような、都市の公共空間での身体的・文脈的なインタラクションに関するデータはほとんど存在しません。そのデータを得るためにはロボットを実際に展開する必要があり、しかしロボットを展開しなければデータが得られないというニワトリと卵の問題が生じています。私たちはWizard of Ozプロトコルによってこの問題を研究レベルでは解決しようとしていますが、商用展開においてこの課題にどう向き合うかは依然として大きな問いです。
6-2. 規制・標準化への提言とコミュニティ主導ロボットの可能性
Gile Martino(ITU): 規制という観点からはどうでしょうか。都市部における歩道走行ロボットに対して、何らかの規制を導入している都市や国はあるのでしょうか。またITUとしては、自律型都市配達ロボットの相互運用要件を定めた勧告ITU-T Y.4607を策定しています。標準化やその他の手段を通じて、都市空間に展開される体現型AIシステムのインタラクション層が適切な手法・良好な実践に準拠することをどのように担保できるとお考えですか。
Wendy J(コーネル大学): 規制としては、たとえばアメリカのペンシルベニア州がロボットの歩道走行を時速15マイルまで許可するという内容のものを設けていたと記憶しています。ただ時速15マイルというのは、重量のある機械が人に倒れかかったり轢いたりする可能性を考えると非常に速く、私が規制を設けるならもっと遅くするでしょう。現状を見ると、この技術はいずれ普及するという認識のもとで何らかのガバナンスが必要だという感覚は広がっています。しかし具体的にどのような規制が必要かはまだ見えていません。なぜならロボットが実際に展開されておらず、何が危険で何が問題になるかを私たちはまだ十分に理解していないからです。
私が今行っているような研究こそが、規制を作る前にやるべきことだと思います。フィールド実験を通じて初めて、何が理にかなっていて、どのような悪用ケースが起きうるかが見えてきます。企業に対して都市でのベータ展開を奨励するだけでは不十分で、それはあまりにも無責任です。
標準化という観点では、速度や高さのような一般的な基準は確かに作れます。人が轢かれたり子どもの上に機械が倒れたりすることを防ぐためのルールは比較的明確に定義できます。しかし最も重要な多くの事項は、実際にフィールドに出てみなければ理解できません。私が最も重要だと考えるのは、ロボットを展開する前に必ず「監督付きパイロット展開期間」を設けることを規範として確立することです。この期間においては、すべてのロボットをリアルタイムで同期的に監視する体制が必要です。現場で何かが起きたとき、人間がその場を目撃していれば何をすべきかはわかります。しかし事前にそのシナリオをプログラムしていなければ、ロボットが適切に対処できる可能性は非常に低いのです。
完全自律化への過度なこだわりも問題です。完全に自律化できるまで展開しないという姿勢よりも、不完全であっても実際に展開して文脈的な要因についての情報を集め、それに対処していく方がはるかに重要です。規制や標準が担うべきは、こうしたパイロット展開から解決策へと移行するプロセスを適切に管理することかもしれません。
Gile Martino(ITU): 最後の質問として、これまでのフィールドスタディ全体を踏まえると、都市ロボットが技術的に機能するだけでなく、社会的に受け入れられ真に役立つ存在になるためには、何が変わる必要があるとお考えですか。
Wendy J(コーネル大学): まずロボットには近接性と空間に関する基本的な理解が必要です。次に、人々からの指示を受け入れて修正される能力が重要です。ウェイポイントの設定のような判断は、もともと私たちが行っていましたが、本来はそのロボットを実際に使うコミュニティの人々がそれを行うべきです。また、建設現場の交通誘導のような例外的な状況——通常の公共空間の使い方が一時的に崩れ、普段とは異なる行動が求められる場面——をロボットが認識する能力も欠かせません。人間でさえそのような場面では戸惑いますが、少なくとも「これは通常ではない状況だ」とは認識します。ロボットはその認識すらできておらず、また誘導員の指示を受け取る能力もありません。
こうした課題はすべてインタラクションの問題です。自律的に動く機械であっても、人の周囲にいる限りインタラクションの問題は避けられません。そしてロボットが人を信頼できるかどうか、つまりロボットが「この指示に従うべきか否か」を判断する能力も、今後重要な研究課題として浮かび上がってくるでしょう。
また私が強く関心を持っているのは、コミュニティが自ら主導するロボットの可能性です。ブルックリンのネービーヤードの住民たちとの取り組みでは、彼らが日々悩んでいるゴミや犬のフンといった問題を出発点に、住民が自分たちで運営できるロボットをともに開発しようとしています。展開するプラットフォームとしてはトラッシュバレルのような移動型のものが使えますが、その上に何を載せるかはコミュニティのニーズによって変わりえます。低コストでコミュニティが主体的に運営できるロボットが都市に増えていくことが、私が目指す姿です。技術的に機能するだけでなく、それを使う人々のために、彼ら自身が必要だと特定したニーズに応える形で設計されたロボットこそが、都市空間に本当に溶け込んでいける存在だと考えています。
