※本記事は、世界経済フォーラム(World Economic Forum)年次総会2026のパネルセッション「Living Autonomously」の内容を基に作成されています。動画は https://www.youtube.com/watch?v=aH6yvNxJ50 でご覧いただけます。
登壇者:
- Daniela Rus — MIT コンピュータ科学・人工知能研究所(CSAIL)ディレクター
- Jake Loosararian — Gecko Robotics 共同創業者兼CEO
- Shao Tianlan — Mechmine Robotics 創業者兼CEO
- Jamie Heller(モデレーター) — Business Insider 編集長
セッション概要:自動運転車が道路を走り、ドローンが無人で戦場を飛行し、アルゴリズムが患者を診断し、デジタルコンパニオンがセラピーを提供する時代——フィジカルAIは日常の瞬間を自動化されたものへと変えつつあります。親密な関係から紛争に至るまで、あらゆるものが機械を介して仲介される中、何を自律システムに委ね、何を委ねるべきでないのか、私たちはその判断を下す準備ができているのでしょうか。
本記事では、セッションの内容を要約しております。なお、本記事の内容は登壇者の見解を正確に反映するよう努めていますが、要約や解釈による誤りがある可能性もありますので、正確な情報や文脈については、オリジナルの動画をご視聴いただくことをお勧めいたします。世界経済フォーラムの詳細情報は http://www.weforum.org/ でご覧いただけます。
1. イントロダクションとパネル概要
Jamie Heler(モデレーター): 皆さん、こんにちは。Business Insiderの編集長、Jamie Helerです。本日のパネルは「Living Autonomously(自律的に生きる)」と題しまして、ロボティクス、ロボット、そしてロボットと共に生きるということをテーマにお話しいたします。本日は、まさにこの分野の最前線にいらっしゃる3名の素晴らしいパネリストをお迎えしています。
まず、Gecko Roboticsの共同創業者兼CEOであるJake Lucerarian氏です。次に、MITのコンピュータ科学・人工知能研究所(CSAIL)のディレクターであるDaniela Rus氏です。そして、Mechmine Roboticsの創業者兼CEOであるTianlin Shiao氏です。お三方とも、本日はお越しいただきありがとうございます。
ロボティクスの分野ではここ数年、非常に多くの進歩がありました。まずはお一人ずつ、直近12ヶ月で最もエキサイティングだと感じていることを教えてください。
2. 直近12ヶ月で最もエキサイティングな進展
2.1 Jake Lucerarian:フィジカルAIとデータ駆動型ROIの追求
Jake Lucerarian: 私たちにとって最もエキサイティングだったのは、ロボットやAIモデルの実際のユーザーたちが「AIのROIとは何なのか」という問いに極度に集中し始めたことです。「AI、AI、AI」と騒がれる中で、「AIの投資対効果は実際どうなのか」という問いが浮上し、それがユーザーをある方向へ導いていきます。ROIを突き詰めると、AIモデルに供給される情報やデータセットそのものを精査する必要が出てきます。そしてさらに、「そもそもAIへの莫大な投資から本当にリターンを得るために必要なデータセットを、私たちは持っているのだろうか」という根本的な問いに行き着くのです。この問いを追求していくと、必然的にフィジカル(物理的)な領域へと向かうことになります。これがまさに「フィジカルAI」がこれほど話題になっている理由です。
Geckoでは、私たちが製造するさまざまなロボットや、統合している外部のロボットから情報やデータセットを収集し、それをCanal Leverと呼ぶ単一の情報基盤に集約しています。これにより、これまで存在しなかった情報やデータセットを使って、さまざまな意思決定を行えるようになります。
Jamie Heler: そのデータというのは、ロボットが思考し行動するためのデータなのか、それともロボットが収集して企業を支援するためのデータなのか、どちらでしょうか。
Jake Lucerarian: 両方ですが、実際に最も注目されているのは、顧客がこれまで一度も持ったことのないデータセットです。私たちの場合、それは「Built World(建造された世界)の健康状態の診断」と呼んでいるものです。橋、発電所、船舶、あらゆる物理的な構造物がどれだけ健全かを診断します。その情報データを使って、資産の最適化や長寿命化、故障予測などを行い、顧客に数十億ドル規模のリターンを生み出しています。そして、ロボットがそのデータを収集する過程で得られる情報を活用して、ロボット自体をよりスマートにし、より自律的に動作できるようにします。これにより、通常は情報が得られないような環境における基盤モデルの構築という非常に興味深い可能性が生まれます。つまり、私たちはまずROIを生み出せるデータから出発し、そのデータを使って他社には実現できないほど強力なロボティクスシステムを構築するのです。
2.2 Daniela Rus:ロボットの身体と頭脳の共同設計、物理AIとLiquid Networks
Jamie Heler: Daniela、あなたの研究室では何が最もエキサイティングでしたか。
Daniela Rus: 一つだけ選ぶのは非常に難しいのですが、私たちはロボットの能力の拡張に注力しています。それはロボットの「身体」と「頭脳」の両方を拡張するということです。身体が重要なのは、ロボットはその身体が可能にすることしかできないからです。そしてその身体が機能するためには、優れた頭脳が必要です。現在、私たちはAIを使って、タスクの仕様に応じてロボットの身体と頭脳を同時に設計、つまり「共同設計(Co-design)」する新しい技術を開発しています。これにより、わずか数時間でカスタムロボットを設計し、数日で工業グレードの製造が可能になります。
これは非常に重要な問題を解決します。現在、私たちは固定されたアーキテクチャのロボットを持っていて、そのアーキテクチャにタスクを適応させなければなりません。しかし、この技術によってロボットのアーキテクチャをタスクに合わせてカスタマイズし適応させることができるのです。この方向で、身体の部分では新しい素材、ソフトマテリアル、AIで設計された素材を使った研究を進めています。
頭脳の部分については、私たちは「フィジカルAI」を開発しています。これは皆さんが日常的に使っている大規模言語モデルとは異なる種類のAIです。フィジカルAIには物理世界の理解が組み込まれており、大規模言語モデルにはそれがありません。また、他にもいくつかの重要な特性があります。
第一に、「コンテキスト内でタスクを学習する」のではなく、「スキルとしてタスクを学習する」ことを可能にします。コンテキスト内での学習では、新しいコンテキストごとに再学習が必要になりますが、スキルとして学習すれば——これは人間の学び方と同じです——そのスキルをさまざまな異なるコンテキストに適用できます。
第二に、より適応的なソリューションを実現します。今日のモデルは学習後に「凍結」されます。つまり、実環境に展開された後は学習を続けることができません。しかし私たちのフィジカルAIソリューションでは、学習後も入力に基づいて適応し続けるAIを実現できます。これは画期的なことです。
Jamie Heler: それはまだ始まったばかりなのでしょうか、それとも実際に動き始めているのでしょうか。この科学の進展のどの段階にいるのですか。
Daniela Rus: すでに実現しています。私の研究室ではこれらの問いを長年研究してきましたし、私たちの会社Liquid AIはすでにこのフィジカルAIモデルをビジネスに提供しています。Liquid Networksと呼ぶ技術を使った、小型でコンパクトなモデルを提供しており、これらはオンデバイスで動作します。つまりクラウドへの接続が不要ということです。それはエネルギー効率を意味し、プライバシーを意味し、そしてレイテンシーのリスクなしに高い能力を発揮できることを意味します。
2.3 Tianlin Shiao:10,000台出荷の加速曲線とワールドモデルによる操作学習のブレークスルー
Jamie Heler: Tianlin、物事はどれくらいのスピードで進んでいるのか、そして今あなたの会社で最もエキサイティングなことは何か教えてください。
Tianlin Shiao: 直近12ヶ月で、私たちは10,000台以上のロボットを出荷しました。この数字は、会社設立後の最初の8年間の累計を上回っています。インテリジェントロボットの採用が加速するという非常に明確なトレンドが見えています。フィジカルAIは、将来のビジョンや単なるコンセプトから、現実世界で非常に役に立つプロダクトへと変わりつつあります。始めることは常に非常に難しいのです。最初の10,000台には8年かかりましたが、次の10,000台にはわずか1年しかかかりませんでした。
技術面では、昨年、以前は非常に難しいと思っていたことが手の届く範囲になったことを発見しました。シミュレータの改善、より入手しやすい実世界データ、AIモデルの進歩など、インフラの改善によるものです。フィジカルAIは——ヒューマノイドだけでなく——あらゆる種類のロボットを強化し、数百日以内に非常にインパクトのあることを実現すると、私は非常に楽観的かつ確信を持っています。
Jamie Heler: 「非常に難しいと思っていたことができた」というのは、3Dビジョンに関することでしょうか。少し詳しく教えていただけますか。
Tianlin Shiao: 例えば、ロボットに瓶から何かを取り出させたいとします。瓶を開けて、中を見て、取り出す。この動作は、人間なら3歳くらいで獲得する能力ですが、ロボットにとっては非常に困難でした。しかし今では、いわゆるワールドモデルのようなものを学習させることができます。ビジョン、ロボットの視覚、ロボットの動作——すべてを一つの統一された空間に整列させ、ロボットに何をすべきかを指示できるのです。これはほんの数年前には想像もできなかったことですが、今やすでに手の届く範囲にあります。
3. ロボティクスの実展開事例と産業応用
3.1 港湾自動化・倉庫自動化の最前線(Venty Technologies, Symbotic)
Daniela Rus: 一つ付け加えたいのですが、すでに世界中で実際に展開され、人々に価値と貢献をもたらしている、非常に多くの素晴らしいアプリケーションが存在しています。例えば、私たちの会社Venty Technologiesは港湾オペレーションの自動化を行っており、コンテナの移動を担っています。ロボットの全フリートが24時間365日、人間のドライバーなしで稼働しています。ただし、悪天候時や大量の移動が必要な場合には人間のドライバーもループに入り対応します。これは、ロボットを「協働者」として捉える非常に興味深いアプローチです。ロボットを作業環境に持ち込み、業務の一部を担わせるツールとして活用するのです。港湾は慢性的にドライバーが不足していることで有名ですし、世界的にもトラックドライバーの不足が問題になっています。ですから、この業界にオートノミーやロボティクスの概念を持ち込むことは非常に重要です。物資がはるかに速く移動するようになります。
もう一つ、Symboticという会社の例も紹介したいと思います。Symboticは倉庫の保管システムを自動化しており、箱のデパレタイズ(荷降ろし)とリパレタイズ(再積載)を行い、毎日数百万個の箱を移動させています。このオペレーションを通じて食品のコストを下げ、食品がある場所から別の場所へ届くスピードを加速させています。非常に魅力的な産業用アプリケーションです。
3.2 非構造化環境への展開課題:ドロイド vs ヒューマノイド、デプロイメント問題とロングテール
Jamie Heler: では、工場や倉庫のような超構造化された環境ではなく、病院やホテル、あるいは現場作業者がいるような半構造化環境について聞かせてください。どの程度安全なのか、どんな問題が残っているのでしょうか。
Jake Lucerarian: 私たちはフィジカルインテリジェンスやロボティクスというと、非常に特定の機能に注目しがちです。例えば、鉱山で自律走行車両が鉱石や資材を採掘場から精錬所まで運ぶようなシステムは、もうかなり前から存在しています。私が考える大きな変化は、ロボティクスシステムがはるかにインテリジェントになりつつあるということです。そしてここで重要なのは、「汎用型」ではなく「より特化型」で考えるべきだということです。私はこれを、ヒューマノイドではなく「ドロイド」と呼んでいます。
これは「デプロイメント(実展開)」という非常に大きな問題に関わってきます。Andreessen Horowitzが非常に優れた記事を出していましたが、今のロボティクスにとってデプロイメントこそが最大の課題なのです。大きなインパクトを生み出し、明確なロードマップを描くための能力という点で、デプロイメントが問題になっています。典型的なロボティクス企業は単一のプロダクトを作り、それを大量生産しようとします。しかしそうすると、最終的にはコモディティ化して不公平な優位性を失ってしまう道に進むことになります。鍵となるのは、ドロイドからより汎用的なヒューマノイドへと至る道筋の中で、次にどのようなロボティクスシステムを作るべきかを知ることです。
私たちGeckoでは、実はロボットを販売していません。ロボットを自社で製造し、顧客の環境に自ら展開しています。どうすればロボットをよりスマートにできるか、より良い情報やデータセットを収集できるかを自分たちで解明し、特定のロボティクスプラットフォームに固定してしまい、システムやハードウェアが進化するたびにアップグレードし続けなければならないという状況を避けています。これは多くのロボティシストにとって重要なパラダイムシフトだと思います。環境について学ばなければならないのです。前方展開(Forward Deploy)して、環境のできる限り近くでロボットを構築する必要があります。そうすることで、インターネット上にもYouTube上にもどこにも存在しない、その環境がどのようなものであるかという情報やデータセットを獲得できるのです。これが鍵です。
Daniela Rus: Jakeに同意した上で付け加えますと、非構造化環境には本質的な技術的課題が存在します。非構造化環境では、ロボットが事前に調整されていない状況が長いロングテールとして存在し、そのロングテールの各状況への対処法を学ぶことが技術的な課題になります。知覚の問題、つまりロボットが自分の世界を正しく理解する能力も課題です。ロボットを世界の中で移動させることにはかなり長けてきましたが、操作——世界を物理的に扱うこと——にはまだ課題が残っています。そしてそこで進歩を遂げるには、より優れたセンサーが必要です。私たちのロボットには、皮膚のようなセンシングに相当するものがまだありません。技術的な課題は多数ありますが、それでも今の機械が実現できることを見れば、技術が適合する幅広い応用分野を見出すことができます。
ロボットソリューションの開発と展開において重要なのは、「このアプリケーションが何を必要としているか」「その技術はこのアプリケーションに適合しているか」「あるいは、アプリケーションが必要としているが技術がまだ対応できていない状況はないか」を問い続けることです。
4. テレオペレーションの現実と安全性・リスク管理
4.1 テレオペレーションの実態とヒューマノイドの「汚い秘密」
Jake Lucerarian: 私がもう一つぜひ触れたいのは、テレオペレーションの役割と、一般の人々がどう受け止めるべきかという点です。テック業界のリーダーたちが、このパネルの登壇者も含めてかもしれませんが、「ロボット革命が3年で来る」「ロボットが洗濯物を畳んで皿洗いもしてくれるようになる」と言っているのを聞いている一般の方々に、ここで一つ知っておいていただきたいことがあります。この業界の「汚い秘密(dirty little secret)」とは、もしそれを望むなら4万ドルを支払う覚悟が必要で、しかも自宅の中で何が起きているかを誰かに見られる可能性があるということです。シャワーから出てきたところに、誰かがテレオペレーションでロボットを操作しているかもしれないのです。
Jamie Heler: テレオペレーションとは何か、少し説明していただけますか。
Jake Lucerarian: 基本的に、ヘッドセットを装着した人間がロボットの操縦を手助けしているということです。皆さんがオンラインで目にするロボットの動画の大半は、実は裏側で誰かがロボットを操作しています。面白い動画があるのですが、閉じたドアの向こうで誰かがヘッドセットを外すと、ロボットがガクッとなって倒れてしまうんです。ですから、「ロボットと自律的に共に生きる」ということを考えている一般の人にとって重要なのは、テレオペレーションが完全な自律に至るための前提条件であるということを理解することです。私たちはまだ環境を学習している段階なのです。
さらに言えば、ロボットが展開される環境を理解しなければならないという事実は、ロボティシストの思考を変えるべきだと思います。「ロボットの性能に関する情報をどう得るか」だけでなく、「顧客の現場でどのようなアクションが取られているかについての情報をどう得るか」を考えるべきです。例えば「鉄鋼をどう製造するか」ということを、ロボティシストがもっと考えるべきなのです。「なぜこのアラームの時にこのバルブを回すのか」というような、産業の文脈を理解する必要があります。もちろんこれはより一般的な場面にも当てはまりますが、ロボットが自分のいる環境を理解し学習し始めるとき、同時に人間の専門知識——特にこうしたセクターで退職しつつある熟練労働者たちがどのような行動をなぜ取るのか——をも理解し学習しているのです。物理世界を理解し、頭脳やワールドモデル、基盤モデルを構築することには非常に大きな力があるということを、ロボティシストは認識すべきです。むしろそれが産業そのものを牽引すべきだと私は考えます。
4.2 安全基準と段階的展開:車やチェーンソーとの比較から考えるリスク管理
Jamie Heler: Tianlin、10,000台のプロダクトを世に送り出す中で、最大の懸念は何ですか。何がうまくいかなくなり得るのか、顧客にどう害を与え得るのか、そしてそれをどう防いでいるのですか。
Tianlin Shiao: 私は、インテリジェントロボットを、日常生活でもっと馴染みのある道具——車やチェーンソーと比較して考えるのが好きです。車やチェーンソーについては、どこで使うべきか、誰が使えるべきか、何か問題が起きたらどうするかについて、非常に明確なルールがあります。車もチェーンソーも電動ドリルも害を及ぼしうるものですが、だからといってそれらが非常に有用であることは変わりません。ロボットにも同じことが必要です。明確な境界線、きちんとした定義、そしてルールです。
例えば工場の現場や物流センターでは、私たちのシステムはすでに作業者を支援し、カートンや袋の移動、組立、溶接、ネジ締めなど多くの作業を行っています。安全基準は非常に明確で、誰がそれに触れてよいかもはっきりしています。そして重要なのは、こうしたアプリケーションは人間との直接的なインタラクションを伴わないということです。高齢者の介助や子どもの世話のようなことではありません。
Jamie Heler: つまり、現在はそういったことはやっていないと。
Tianlin Shiao: 現在はやっていません。実は、ヒューマノイドが私たちの中で働き、すべての人間と直接やり取りするようになるのを待つ必要はないのです。製造業、物流、一部のサービス産業において、数億台もの有用なロボットを展開できるタイミングはすでに来ています。今日人間が行っている物理的な作業の大多数は、実際には比較的コントロール可能な環境で行われています。タスクの定義は明確で、人間との直接的なインタラクションを伴いません。そういったタスクこそ、数百日以内にロボットが非常に役立てる領域だと思います。
Jamie Heler: ただ、ここで一つ指摘しておきたいのですが、AIが「単なるもう一つのツール」に過ぎないのか、それとも全く別次元のものであって車のように扱ってはいけないのか——つまり、もっと特別に注意を払い、ロボットにどれだけの力を与えるかを慎重に考えるべきなのか——という大きな議論があるということは、皆さんにも考えていただきたいと思います。
5. マニピュレーション(操作能力)のボトルネックと突破口
5.1 研究室から商用展開へのギャップ:洗濯物を畳むロボットが50万ドルの現実
Daniela Rus: もう一つ付け加えたいのは、研究環境でロボットにタスクを実行させることと、実際の商用展開との間には大きなギャップが存在するということです。洗濯物を畳み、食洗機に食器を入れるロボットを作ることは可能です。しかし、それには50万ドルかかるかもしれません。そこから、数十台のロボットがある特定の環境で稼働するデモンストレーション段階を経て、真にスケールアップされたソリューションに到達するまでには、非常に多くのハードワークが必要です。特に世界を物理的に操作すること——マニピュレーション——に関しては、その道のりは長いのです。
5.2 ナビゲーション・ロコモーション・マニピュレーションの三大能力と皮膚センサーの欠如
Jamie Heler: ダボスに来ると毎年、あの小さな犬型ロボットが街を歩いているのを見かけます。あれには頭脳がないわけですが、真のブレークスルーは、ロボットが自分自身で考え、推論できる能力を持つことではないでしょうか。
Daniela Rus: まさにその通りです。私たちには、世界を見て「ここに段差がある」「この路面は滑りやすいかもしれない」と理解し、その場で適応できるロボットが必要です。それには、世界を知覚し、動作を素早く調整する能力を持つ頭脳が不可欠です。実際、すでに例外的な成果が生まれています。トレイルをハイキングできるロボットが存在するのです。トレイルをハイキングすることがどれほど複雑か考えてみてください。足をどこに置くか見て、身体の残りの部分のバランスをどう取るかを判断しなければなりません。こうしたモビリティの進歩はすでに起きています。
しかしマニピュレーションが困難なのは、皮膚のようなセンサーがまだ存在しないからです。私がこのグラスを回すとき、見てすらいませんが、感じています。力やトルクを感知し、非常に高速かつ高精度にそれらを感知しています。そして非常に器用なタスクをこなせるのです。ロボットの手にこのレベルの器用さを与えるセンサーが、私たちにはまだ不足しています。もちろん別のことはできます。ロボットでグラスを掴んで、ここからあそこへ移動させることはできますし、これが倉庫や物流分野で見られるすべての進歩を支えています。
Tianlin Shiao: ロボットの能力には三つの主要な方向性があります。ナビゲーション、ロコモーション、そしてマニピュレーションです。ロコモーションは基本的にダンスのようなもの——パルクールのようなことです。ナビゲーションとは、自分がどこにいるかを把握し、別の場所にどう行くかを見つけ出すことです。そしてマニピュレーションは、Rus教授がおっしゃった通り、物を動かし、操作を行うことです。現在、ロボットが日常生活や製造業、物流で本当に役立つことを妨げているのは、主にこのマニピュレーションの部分です。しかし、最近非常に具体的かつ急速な進歩が見られています。
Daniela Rus: マニピュレーションがなぜ難しいか、皆さんにも体感していただけるアイデアがあります。自分のスマートフォンを、指の腹ではなく爪だけで操作してみてください。それがいかに難しいかがわかると思います。ロボットは主に硬いプラスチックや金属で作られており、これらの素材は私たちの指先の皮膚や肉というよりも、爪に近いのです。研究面では皮膚のようなインタラクションを可能にする新素材を開発していますが、それを研究室からデモンストレーション段階に持っていき、スケールアップするにはまだ時間がかかります。来ていますが、今日ではありません。
5.3 どこまでの器用さが必要か:Shiaoの3本指生活実験とリスザルの30g脳の示唆
Tianlin Shiao: ただ、良いニュースがあります。アインシュタインレベルの知能は必要ないのです。私はミュンヘンに住んでいた頃、おそらく2ヶ月に一度は動物園を訪れていました。動物園で観察すると、言語について何も知らない動物たちが完璧なマニピュレーションを行っているのがわかります。例えばリスザルは、このくらいの大きさで、おそらく30グラムの脳しかありませんが、完璧な操作をこなします。ですから、そこまで遠い話ではないと私は思います。
さらに言えば、私は個人的に3本の指だけで、このアクション——つまむ動作だけで数時間生活してみるという実験をしました。結果は、生活は問題なくこなせました。もちろん箸は使えませんでしたが、代わりにスプーンとナイフを使えばよいのです。皆さんも自宅で試してみてください、そこまで危険ではありません。これは何を意味しているかというと、私が描いている「段階的自律(Graduated Autonomy)」というビジョンを裏付けているのです。突然、人間ができるすべての動作を実行できるロボットが登場するわけではありません。3本指のロボット、1本腕のロボット、犬型ロボットに腕を付けたものなど、あらゆる種類のロボットが、特定のアプリケーションにおいて特定のタスクを非常に確実にこなす。それが近い将来——数百日以内に——実現する姿です。もちろん、さらに遠い未来のビジョンも共有していますが、ヒューマノイド全体やロボットハンドが非常に高度になるまで待つ必要はないのです。
6. イーロン・マスクへの質問に託された各パネリストのビジョン
Jamie Heler: 今日、イーロン・マスクがここダボスに来る予定です。ロボティクスは明らかにTeslaの大きな柱です。もし皆さんがそれぞれ彼に一つだけ質問できるとしたら、何を聞きますか。
Tianlin Shiao: 私は彼にこう聞きます。「あなたのロボットを全部いつ買えるようになりますか?」と。
Jamie Heler: もう少し詳しくお聞かせいただけますか。
Tianlin Shiao: 私が言いたいのはこういうことです。今私たちが話しているすべてのこと——学習の加速、インフラの整備——これらが進むにつれて、コンピューティングやエネルギーに対するインパクトを私たちは過小評価していると思います。エネルギーや、レアアース素材といった資源についても、適切にモデリングされていないのではないでしょうか。しかし非常に重要なのは、ロボティクスやテレオペレーションにまつわるすべてのエキサイティングな課題を克服するにあたり、ロボットからROIを得られるシステムの中で、採用と展開を本来予想されるより早く進めることが極めて重要だということです。完璧を待つ必要はありません。100万マイルの走行データも要りません。特定のタスクにおいては、ロボットの動作が完璧でなくても十分にやっていけるのです。ですから、労働力の観点からも、エネルギーや素材の需要という観点からも、ロボティクス、特にヒューマノイドはゲームチェンジャーとなり、企業の経済的なランドスケープを完全に塗り替え、国家としてどれだけ効果的・効率的に成長できるかにも影響を及ぼすでしょう。つまり、私の最初の質問は「どうやって申し込めますか? どの会社よりも多くのロボットを買いたい」ということです。
Daniela Rus: 私はTianlinの意見に少し異論があります。ヒューマノイドは実際にはまだその潜在能力をフルに発揮できる段階にはないからです。イーロン・マスクは今年中に数百万台のロボットを工場に導入すると発言していますが、私が聞きたいのは「その計画は何ですか? ロボットのマニピュレーション、ロボットの手に関する技術的な計画はどうなっていますか?」ということです。そしてもう一つ指摘しておきたいのですが、イーロン・マスクは2017年に「2019年にはハンドルを握ったまま眠れるようになる」と言いました。しかし、私たちはまだハンドルを握ったまま眠ることはできていません。ですから、私は彼のビジョンは本当に素晴らしいと思いますが、タイミングの見積もりを間違えることがあるのではないかと思います。
Tianlin Shiao: ロボットの手について少しコメントさせてください。先ほどお話しした通り、私は個人的に3本の指だけで、つまむ動作だけで数時間生活してみました。生活は問題なくできました。箸は使えませんでしたがスプーンとナイフで代用できます。このことが示しているのは、人間レベルの器用さがなくても、ロボットは多くの有用なことができるということです。突然すべてをこなせるヒューマノイドが現れるわけではなく、さまざまな形態のロボットが、特定のアプリケーションで特定のタスクを非常に確実にこなすようになる——そんな段階的自律の未来が数百日以内に訪れると私は考えています。
7. 会場Q&A:リモート環境、ロボットの意識、人間との自然な協調
7.1 ドローン自動化とリモートインフラ管理の展望(質問者:Vanessa Mendes)
Vanessa Mendes(質問者): テキサスから来ました、Global Shaper Communityの代表でもあります。私は現在、太陽光発電産業向けのドローン自動化とビジュアルAIに特化したスタートアップを経営しており、ソーラーアセットの統合管理を改善する取り組みをしています。皆さんがやっていることと非常に近い分野です。こうしたサイトの多くは遠隔地にあり、そのために労働力の確保が大きな問題となっています。プロジェクトの展開コストは、自動化があれば本来より高くなっています。現在のドローンやその他の自律技術の能力を踏まえて、インフラ管理の遠隔地における、より広範な自動化の実現にどれくらい近づいているのか、お聞きしたいです。
Jake Lucerarian: その質問を私なりに解釈すると、将来的に非常にリモートな資産をより自律的に運用し、安全上の問題を減らし、特に熟練した労働力が不足している環境でのオペレーションのマージンを改善したいということだと思います。もし自動化に向けて小さなステップで進むモデルが正しく機能すれば——例えば自律型ドローンを一つのステップとして——太陽光発電フィールドや風力タービンのような、比較的複雑度の低い環境であれば、今後3〜4年で実現し始める可能性があると思います。ただし、問題はやはり費用対効果です。造船所でのターンアラウンドや航空母艦の整備のような、非常にコンシクエンシャル(影響が大きい)な産業のタスクを自律化するには、3年以上かかるでしょう。ロボティクスやソフトウェア、AIの大部分は、最もROIの高いアプリケーションに集中していくことになります。ですから、それにはおそらくさらに5年、6年、7年が必要で、企業がそこに到達するためのテーゼを大きく転換することが条件です。
Daniela Rus: リモート環境ではまずGPSが利用できないかもしれず、非常に優れた知覚システムが必要になります。この問題は、オンデバイスのフィジカルAIモデルを採用すれば解決できます。そのモデルが適応を可能にし、ナビゲーションを可能にし、環境がどのようなものであれ対応を可能にしてくれるからです。良いニュースは、まさにこの種のモデルの開発が始まっているということです。これは「状態空間モデル(State Space Models)」と呼ばれています。Liquid AIのオープンソースモデルをぜひ確認してください。あなたの問題に非常に効果的かもしれません。
Vanessa Mendes: すみません、それは何というモデルですか。
Daniela Rus: Liquid AIです。状態空間モデルというものです。これはトランスフォーマーモデルとは異なるアプローチでモデルを構築しています。微分方程式を通じて物理世界を捉える数学的基盤の上に構築されているのです。
7.2 ロボットの意識はどこまで到達可能か:不確実性の理解と正常/異常の検知(質問者:Miguel)
Miguel(質問者): スペインから来ました、物理学の博士課程の学生です。ロボットの頭脳について、特にプログラムされていないイベントやアクシデントへの反応について非常に興味があります。その鍵は意識(コンシャスネス)にあると思うのですが、現時点でどのレベルの意識を実現でき、将来的にはどのレベルまで到達可能なのでしょうか。人間の意識に到達することは可能なのでしょうか。
Daniela Rus: まず、意識とは何かを定義する必要があります。人間を意識的にしているメカニズムを私たちは完全には理解していません。ですから、それを機械に適用することを考えるのは難しいのです。しかし、もし意識を「自分の環境を認識していること」「環境に応答できること」という簡潔な定義で捉えるなら、ある程度のレベルの「気づき」を持つ機械を構築することは可能です。ただし、技術的なソリューションを構築する際には慎重でなければなりません。それらを特性化できる必要があります。つまり、いつ機能するのか、いつ機能しないのか、予測や推薦から期待される不確実性はどの程度なのかを明示できなければなりません。より高い能力を持つロボットに到達するための本当にエキサイティングなテーマは、ロボットの頭脳の中に「不確実性の理解」をより深く組み込むことです。予測の不確実性を理解することで、機械はタスクの遂行において格段に優れたものになるからです。
Tianlin Shiao: それに付け加えたいのですが、人間の脳がどう機能するかを考えてみてください。多くの研究が示しているのは、人間の脳は実は非常に効率的だということです。物事が正常なとき、私たちは脳をそれほど使っていません。音楽を聴いたり電話で話したりしながら、洗濯や食事の準備を記憶にすら残らないほど無意識にこなしている経験があるでしょう。地下鉄やバスでどうやって帰宅したかすら思い出せないこともあります。なぜなら、それが自分にとって完全に「正常」だからです。しかし、何か異常なこと——予期しないことが起きたとき、私たちは初めて脳を本格的に使い始めます。この能力は、ロボットを信頼性高く安全に使いたいのであれば、極めて重要です。ロボットは「何が正常で、何が正常でないか」を知る必要があります。正常でない状況を検知したら、例えば人間のオペレーターに介入を求めるフォールバック戦略を発動できるようにすべきです。これがある種の意識——リスクを評価し、異常を検知する能力——と言えるのではないかと思います。
Jamie Heler: それこそがAIとロボティクスにおけるリスクの本質ですよね。ChatGPTが登場した頃にもっと議論されていたことですが、コントロールできると思っていたロボットが、コントロールできなくなるかもしれないということです。
Daniela Rus: これは確かに課題ですが、ここでもう一度、ロボットの「身体」と「頭脳」の定義に立ち返りたいと思います。AIなしでもロボットの頭脳を構築することは可能です。アルゴリズムをロボットの頭脳に搭載すれば、そのロボットが何をできるかには一定の制限があります。データとフィジカルAIモデルを頭脳に持ち込むことの魅力は、ロボットにより高い適応力を与えられることです。第一原理からモデル化できないタスクを実行する能力を与えられるのです。「ここからあそこへ物を持っていく」というタスクは第一原理からモデル化できます。AIソリューションは不要です。しかし、例えば皿洗いをしたいとなると、身体の動き全体を第一原理からモデル化するのは極めて困難です。だからこそ、人間からデータを収集し、人間のようなやり方でタスクを実行する方法をロボットに教えることが重要なのです。ただしそのためには、統計的な相関関係以上のもの——皿洗いに伴う時空間的な相関関係を真に理解できるシステムにデータを通す必要があります。
7.3 人間とロボットの自然なインタラクション:デモンストレーション学習と機械の適応(質問者:Julia)
Julia(質問者): イタリアから来ました、Global Shaperでもあり、人間とロボットのインタラクションの研究者です。質問はたくさんあるのですが、一番聞きたいのは、人間同士のインタラクションを自然にしているものは何なのか、そしてロボットが私たちと自然にインタラクションできるようになるための最大の課題は何だとお考えですか。
Tianlin Shiao: デモンストレーション(実演)だと思います。それがまさに人間がほとんどのことを学ぶ方法です。人間にはいくつかの異なる種類の知能があります。何かを掴む能力、投げる能力、ボールをドリブルする能力——これらは見て、練習することで学びます。しかし、25×52のような計算を学ぶのは、全く別の種類の知能です。ロボットを工場の現場や物流センターに展開したいのであれば、デモンストレーションこそが、ロボットに何をすべきかを伝える最も直感的な方法だと思います。それはまさに人間が他者に、例えばキッチンでの作業を教えるときのやり方と同じです。
Daniela Rus: 私たちがこれまで構築してきた機械の大多数は、機械に私たちが適応するという方向でした。その逆ではありません。ここでの重要な問いは、「人間に適応する機械を構築できるか」ということです。そのためには、機械が知覚と状況認識に非常に長けている必要があります。視覚的な面だけでなく、活動の認識ができなければなりません。例えば「この人は箱を動かそうとしていて、苦労している。重すぎるんだ」ということを理解できなければなりません。そしてチームメイトのように、自然に箱を持ち上げる手助けに来ることができるか。さらに、二人で大きな箱を運んでいるとき、私が箱にかけている力とトルクを理解し、同じように応答する必要があります。そして同時に、正しいことをしている、チームメイトとして機能しているというフィードバックを私に返してくれる必要があるのです。単なる無機質なツールとしてではなく、協働するパートナーとして機能するということです。
8. 10年前との比較と未来への展望:最も難しいことはもう過ぎた
Jamie Heler: Instagramで流行っているネタがありますよね。「2016年に戻れるとしたら」というやつです。10年前に戻ったとして、今日のロボティクスの到達点は、当時の予想より進んでいると思いますか、それとも進んでいないと思いますか。この10年間で、私たちの期待に対して結果はどうだったのでしょうか。
Jake Lucerarian: 10年前というと、ちょうど私がGeckoを3年間ブートストラップした後にシリコンバレーのY Combinatorに参加した時期です。当時、ロボティクス企業をやるというのは、基本的に緩やかな死か急速な死かを選ぶのと同じようなものでした。特に、10億ドルを投じた研究プロジェクトが結局消えていくようなものではないロボット——つまり実用的なロボットを作ろうとする会社にとっては、状況は相当暗かったのです。正直に言って、10年前のロボティクスはかなり見通しの暗い世界でした。私は子どもの頃、皆さんの中にもそういう方がいるかもしれませんが、ロボットが私たちの中にいて、助けてくれて、美しい共生関係を築いている世界を期待していました。お互いに助け合っている世界です。しかし、その現実はまったく訪れていませんでした。ですから、10年後の今の状況には、私は本当に心から興奮しています。
Jamie Heler: Daniela、10年前と比べてどう感じますか。
Daniela Rus: ある意味では予想より進んでいますし、別の意味では進んでいません。10年前、AIについてもフィジカルAIについても誰も話していませんでした。自動運転プロジェクトはサイエンスプロジェクトのようなものでしたが、今では多くの環境で自律的なモビリティを展開している企業があります。歩道でデリバリーするロボットがあり、ジオフェンスされた環境では自動運転車が走り、コンテナや荷物を運ぶロボットがあります。非常に多くの機械が存在しています。
しかし、マニピュレーション——操作能力の側面では、それほど進歩していません。家庭であなたのすべての家事をこなしてくれる「ロージー・ザ・ロボット」的な家庭用ロボットアシスタントのビジョンは、まだ相当先の話です。ただし、もしゴミ出しが嫌いなら、自動運転するゴミ箱なら実現可能です。しかし、より汎用的な家庭用ヒューマノイドロボットは、まだ長い道のりが必要でしょう。
とはいえ、私は今の状況に非常に興奮しています。なぜなら、素材面、ハードウェア面のモーターやセンサー、コンピューティング面、データ面、AI面で巨大な進歩を遂げたからです。そして今、若い世代がこの豊かな能力のすべてを受け取り、機械が私たちを支える魔法のような未来へと転換してくれるのを待っているのです。
Jamie Heler: 若い世代の皆さん、残り22秒です。
Tianlin Shiao: 一言だけ言わせてください。最も難しいことは、私たちの前にではなく、もう後ろにあります。最も困難な時期はすでに過ぎたのです。ですから、今日の状況に対して、私は非常に強い確信を持っています。