※本稿は、2024年に開催されたAI for Good Global Summit 2024でのEarth Species Projectの共同創設者 Aza Raskin氏の「Understanding biodiversity – AI to decode non-human communication」というプレゼンテーションをAI要約したものです。
1. はじめに
1.1 Earth Species Projectの紹介
私はAza Raskinと申します。Earth Species Projectの共同創設者として、本日は「生物多様性の理解 - AIによる非人間コミュニケーションの解読」というテーマでお話しさせていただきます。
Earth Species Projectは、AIを活用して動物のコミュニケーションを解読することを目的とした国際的な非営利団体です。私たちは40以上の大学や生物学者と協力し、非人間言語の発見と解読に取り組んでいます。
1.2 人類が直面する問題の根本原因
まず、人類が直面している主要な問題について考えてみましょう。気候変動、オピオイド危機、孤独の epidemic、格差の拡大など、これらの問題には共通の糸があります。それは、全体を犠牲にして狭い目標を最適化することです。つまり、一種の断絶の形態と言えるでしょう。
私たちの目標は、この断絶を解消し、より広い視野で世界を理解することです。そのために、動物とのコミュニケーションという新しい領域に挑戦しています。
2. 動物のコミュニケーションの現状
2.1 既知の動物コミュニケーション事例
動物のコミュニケーションについて考えるとき、私たちはしばしばごく一部の側面しか想像していません。しかし、実際には多くのことがすでに知られています。
例えば、オウムの親は、雛が生まれてから最初の1週間半ほど、雛の耳元でささやき続けます。これは、雛が一生使う固有の名前を繰り返し教えているのです。イルカも同様の行動をとることが分かっています。
さらに興味深いのは、イルカが第三者の名前を使ってコミュニケーションを取ることです。つまり、その場にいないイルカについて、名前を使って話すのです。これは言語の主要な特徴の一つであり、動物のコミュニケーションが私たちの想像以上に複雑である可能性を示唆しています。
2.2 植物のコミュニケーション能力
動物だけでなく、植物にも驚くべきコミュニケーション能力があります。2019年にテルアビブ大学で行われた興味深い研究があります。研究者たちはサクラソウの花に様々な音を聞かせました。高音のコウモリの音や、低音の交通騒音などです。
しかし、花が反応したのは、受粉者であるハチが近づいてくる音だけでした。その反応は驚くべきものでした。花は約3秒で、より多くの、そしてより甘い蜜を生産し始めたのです。つまり、文字通り花はハチが来るのを聞いて、興奮していたのです。
この例は、私たちの理解が知覚能力に制限されていることを示しています。AIの登場により、私たちの知覚の幅が大きく広がり、これまで気づかなかった自然界のコミュニケーションを理解できる可能性が開かれたのです。
3. AI技術による知覚の拡張
3.1 人間の知覚の限界
人間の知覚能力には限界があります。時間と空間の全体を考えたとき、人間が直接経験できる範囲は驚くほど狭いものです。私たちが認識できる時間のスケールは、せいぜい数十年から数百年程度です。空間的にも、私たちが直接知覚できるのは地球上のごく一部の領域に過ぎません。
宇宙の年齢が約138億年、観測可能な宇宙の直径が約930億光年であることを考えると、人間の知覚能力がいかに限られているかが分かります。私たちの感覚器官や脳の処理能力には物理的な制約があり、それが私たちの世界理解を制限しているのです。
3.2 AIによる知覚範囲の拡大
AIの登場により、私たちは知覚の範囲を大幅に拡大することができます。科学の歴史は、知覚の拡大が私たちの理解を深め、同時に自分たちがいかに小さな存在であるかを認識させることを教えています。
例えば、AIを用いることで、人間の耳では捉えられない超音波や亜音波の範囲にある動物のコミュニケーションを解析することが可能になります。コウモリやイルカが使用する高周波音、象が発する低周波音など、これまで私たちにとっては「沈黙」だった領域に、豊かな情報が存在することが明らかになるでしょう。
また、時間スケールの面でも、AIは私たちの認識を拡張します。数百年、数千年にわたる生態系の変化や、数秒、数ミリ秒で起こる微細な現象を、AIは効率的に分析し、そのパターンや意味を私たちに示すことができます。
さらに、宇宙規模の現象についても、AIは膨大なデータを処理し、人間の目では見えないパターンや関連性を見出すことができます。例えば、遠方の銀河の動きや、数十億年にわたる宇宙の進化のプロセスを、AIは効率的に分析し、私たちの宇宙理解を深めることができるのです。
言い換えれば、世界は私たちが考えている以上に魔法のような場所なのです。AIによって、これまで気づかなかった自然界の複雑さや美しさを理解できるようになるでしょう。AIは私たちの感覚の拡張器として機能し、より広大で豊かな世界の姿を私たちに示してくれるのです。
この知覚の拡大は、単に科学的知識を増やすだけでなく、私たちの世界観や自然との関係性を根本的に変える可能性を秘めています。AIを通じて、私たちは自分たちがいかに小さな存在であるかを知ると同時に、この広大な宇宙の中で他の生命体とどのようにつながっているのかを、より深く理解できるようになるのです。
4. 動物の言語能力
4.1 イルカの高度なコミュニケーション能力の事例
動物の言語能力について、具体的な例を挙げてみましょう。1994年にハワイ大学で行われた興味深い研究があります。研究者たちはイルカに2つのジェスチャーを教えました。
1つ目は「これまでにやったことのないことをしなさい」というものです。この指示自体が非常に複雑です。イルカはこれまでに行ったすべての行動を記憶し、否定の概念を理解し、そしてまったく新しいことを考え出さなければなりません。驚くべきことに、イルカはこれを理解し、実行することができました。
2つ目のジェスチャーは「一緒に何かをしなさい」というものでした。研究者たちは2頭のイルカに「これまでにやったことのないことを一緒にしなさい」と指示しました。イルカたちは水中で音声情報を交換し、その後、同時に全く同じ新しい行動をしたのです。
この実験は、イルカが高度な抽象的思考と協調行動を行える能力を持っていることを示しています。これは表象的な言語の存在を直接証明するものではありませんが、少なくともその可能性を強く示唆しています。
4.2 言語の抽象性と翻訳の課題
しかし、動物の言語能力を認めたとしても、次の問題が浮上します。ロゼッタストーンのような共通の基準がない場合、どのように翻訳すればよいのでしょうか?
人間のコミュニケーションの多くは抽象的な概念に関するものです。動物の行動と関連付けられる単純なコミュニケーションは理解できるかもしれませんが、より複雑で抽象的な概念をどのように解読すればよいのでしょうか?
この課題に対する解決策が、AIによる言語モデルの発展にあります。次のセクションでは、この技術的なブレークスルーについて詳しく説明します。
5. AI翻訳技術の進化
5.1 言語間翻訳の仕組み
2017年は、AI技術の歴史において重要な転換点となりました。この年、AIは人間の言語間で、例や辞書(ロゼッタストーン)を必要とせずに翻訳する能力を獲得したのです。これは非常に重要な進歩でした。
AIがどのように言語を「理解」し、翻訳するのか、その仕組みを簡単に説明しましょう。AIは関係性を距離と方向に変換します。つまり、意味的な関係を幾何学的な関係に置き換えるのです。
例えば、英語の上位10,000語を取り上げてみましょう。技術的には、これを「埋め込み」と呼びます。この言語の形を表す図形の中で、各単語は星のように表されます。似た意味を持つ単語は互いに近くに配置され、関係性を共有する単語は同じ距離と方向を持ちます。
具体例を挙げましょう。「王」は「男性」に対して、「女性」が「女王」に対するのと同じ関係にあります。つまり、「王」から「男性」への距離と方向は、「女性」から「女王」への距離と方向と同じなのです。同様に、「少年」から「王子」への関係や、「少女」から「王女」への関係も同じ距離と方向を持ちます。
5.2 意味空間の概念と言語の普遍性
この「言語空間」の概念を使って、2017年の研究者たちは英語とスペイン語の形を作り、それらを比較しました。驚くべきことに、これらの形はほぼ同じだったのです。一方の言語にはあるが他方にはない単語があっても、全体的な形は非常に似ていました。
この発見は日本語やウルドゥー語、フィンランド語など、他の言語でも同様に機能することが分かりました。つまり、すべての人間の言語が、ある種の普遍的な「人間の意味の形」に適合するということです。
この発見は深い意味を持っています。人類が深い分断に直面している時代に、私たちすべてを結びつける隠れた構造が存在するのです。
6. 異種間コミュニケーションの可能性
6.1 人間と動物の共通体験
では、動物の言語についても同様の「形」を作り、人間の言語の形と重ね合わせることで翻訳ができないでしょうか?これは魅力的なアイデアですが、批判的に考える必要があります。
人間の言語が同じ形に適合するのは、私たちが同じハードウェア(脳)を持ち、同じ環境世界(Umwelt)を共有し、同じ感覚を持っているからかもしれません。動物との間でも同じことが期待できるでしょうか?
しかし、人間と動物の間には共通の経験があることも事実です。例えば、鏡を見る経験を考えてみましょう。多くの動物種が「鏡テスト」に合格します。これは、動物の体に目印をつけ、鏡を見せたときに、その目印に気づいて触ろうとするかどうかを見るテストです。
このテストに合格することは、鏡に映る像が「自分」であることを認識している、つまり自己意識があることを示しています。イルカや象などの動物がこのテストに合格しています。
また、意識状態の変更を意図的に行う動物も多くいます。例えば、イルカはフグを膨らませてサークルで回し、その毒で酔っ払います。チンパンジーは回転して目眩を起こします。レムールは毒のあるムカデを噛んで、一種の陶酔状態に入ります。
これらの例は、動物たちが自己意識や超越的な意識状態について、私たちと共通の経験を持っている可能性を示唆しています。もし動物がコミュニケーションを取っているとすれば、これらの深遠な体験についても伝え合っているかもしれません。
6.2 種間の差異と翻訳の課題
一方で、人間と動物の間には大きな差異もあります。例えば、マッコウクジラは生涯の80%を水深1キロメートルの完全な暗闇で過ごし、音を使って「見る」のです。これは私たちの経験とはかけ離れています。
したがって、人間と動物の言語の「形」が部分的に重なり合う一方で、重ならない部分も大きいと予想されます。どちらが興味深いかはまだ分かりません。直接翻訳できる部分か、豊かさと複雑さは感じられるものの意味が分からない部分か。両方から多くを学べるはずです。
人類の問題の解決策は、私たちの想像の中にはないと私は考えています。もしそうなら、すでに実行されているはずです。我々が求めているのは、人間の想像力の範囲外にあるものなのです。
クジラやイルカは文化を持ち、3400万年前にさかのぼる言語を代々伝えています。方言に分かれ、さらに相互に理解不可能な言語にまで発展しているのです。3400万年の歴史を持つ知恵の伝統に込められた叡智を想像できますか?これこそが、私たちが学ぶべき新しい視点なのかもしれません。
7. 動物コミュニケーション研究の技術的課題
7.1 ベルーガクジラの音声分析の事例
動物のコミュニケーションを研究する上で、技術的な課題も多く存在します。ここでは、ベルーガクジラの音声分析を例に挙げて説明しましょう。
ベルーガクジラの発する音は、驚くほどデジタル的です。私たちが聞くと、まるでモデムのような音に聞こえます。Dr. Valerie Vergara博士の研究によると、ベルーガクジラは自分の名前と所属する群れのアイデンティティを、彼らの音声に含めているそうです。
しかし、この研究には大きな課題があります。科学者たちは、クジラにオーディオとビデオを記録するタグを取り付けていますが、誰が話しているのかを特定することが困難です。多くの場合、複数のクジラが同時に発声しているため、97%のデータを破棄せざるを得ないのです。
つまり、最も声の大きい水中種で、最大の語彙を持つと考えられる種について、西洋科学はその通信の3%しか触れていないことになります。これは、動物コミュニケーション研究における次のフロンティアを示しています。
7.2 マルチモーダルセンサーデータの活用
この課題に対処するため、私たちEarth Species Projectの最初の研究は、複数の動物が同時に発声している場合でも、それぞれの個体の音声を分離する技術の開発でした。人間の音声については、AIがこの分離を数年前から行えるようになっていましたが、自然環境下の動物の音声については、ようやく可能になりつつあるところです。
さらに、より包括的なアプローチとして、マルチモーダルセンサーデータの活用があります。私たちのパートナーであるDr. Ari Friedlaender博士は、南極でクジラに吸盤式のタグを取り付ける研究を行っています。このタグは、音声、視覚、そして動きのデータを記録します。
昨年、私たちはマルチモーダルセンサーデータを用いた科学研究における様々なモダリティ間の翻訳に関する共同研究をリードしました。この研究のアイデアは、例えば動物の動きのデータから、それに対応する音声を生成するというものです。
具体的な応用例を挙げましょう。クジラの衝突は、クジラの死亡原因の主要なものの一つです。ここで、「あるクジラが別のクジラに潜水を促すときにどんな音を出すか」というモデルを作ることができれば、非常に有用です。これは、下に餌があることを伝えている場合もあれば、上に危険があることを警告している場合もあるでしょう。
このようなモデルを構築することで、動物のコミュニケーションについての「チューリングテスト」のようなものを行うことができます。つまり、特定の行動を引き起こす音声を生成したり、逆に特定の音声から予想される行動を推測したりすることができるのです。
このアプローチは、動物の発声から行動への、また行動から発声への翻訳を可能にする新しい方法です。これにより、直接的な言語翻訑だけでなく、行動や文脈を通じた理解も可能になるのです。
8. 双方向コミュニケーションの実験
8.1 ザトウクジラとの対話実験
ここまで主に動物の音声を聞き取り、理解する側面について話してきましたが、Earth Species Projectの目標は基本的に「聞く」ことです。なぜなら、私たちは話すときではなく、聞くときに変化するからです。
しかし、私たちの仮説が正しいかどうかをテストするためには、実際にコミュニケーションを試みる必要もあります。ここで、私たちのパートナーであるDr. Michelle Fournet博士のドキュメンタリー「Fathom」から、興味深い実験を紹介したいと思います。
Fournet博士は、「クジラとの対話を始める」という非常に基本的な実験を行いました。海にスピーカーを設置し、クジラに話しかけ、返事を期待するというものです。この実験が成功すれば、ザトウクジラとの初めての「対話」実験となります。
驚くべきことに、この実験は成功しました。Fournet博士は、事前に録音したメッセージでザトウクジラに「こんにちは」と言い、クジラはそれに応答したのです。これは、いわば「Hello, Whale(ハロー、クジラ)」実験とも言えるでしょう。
余談ですが、ザトウクジラの「こんにちは」の発声方法をお教えしましょう。それは「ウーー」というような音です。クジラはこの「こんにちは」に自分の名前を含めることもできるそうですが、私にはまだその方法が分かりません。
8.2 自己認識実験としての音声再生
さらに興味深い実験が、数年前に行われました。私たちのチームは、Fournet博士の実験を再現しようとする科学者たちと共に現場に行きました。彼らは少し異なるアプローチを取り、1日目に録音した音声を翌日に再生するという方法を用いました。
実験当日の朝、霧が濃く立ち込めていましたが、太陽の光は鮮やかでした。鳥が霧の中を飛び、ザトウクジラの呼吸音が聞こえましたが、霧のせいで姿は見えませんでした。ザトウクジラの呼吸音は、ヨガをしているダース・ベイダーのようで、とても瞑想的な雰囲気でした。
実験が始まるとすぐに、約30メートル離れた場所からザトウクジラが船に向かって突進してきました。口を半開きにし、これまで見たことのない行動をとったのです。その後10分間、クジラは船の周りを移動し、調査し、突進を繰り返しました。実験が終わると、クジラは去っていきました。
科学者たちに何が起こったのか尋ねたところ、クジラを特定した後、驚くべき事実が判明しました。科学者たちは、そのクジラ自身の「こんにちは」を再生していたのです。これは一種の鏡テストと言えるでしょう。
録音では、クジラの名前がTwainであることが分かりました。スピーカーから「私はTwainです」という音声が流れ、それに対してザトウクジラが「私はTwainです」と応答する、というやりとりが繰り返されたのです。
このような実験は、種間コミュニケーションが可能であることを示していますが、同時に重要な倫理的問題も提起しています。
9. 異種間コミュニケーションの倫理的課題
9.1 技術の先行と理解の遅れ
先ほどの実験について、私は実はこのような実験を野生の環境で行うべきかどうか疑問に思っています。なぜなら、私たちはまだ何を言っているのか完全には理解していないからです。
大規模言語モデルやAIの性質上、私たちは完全に理解する前に流暢にコミュニケーションを取れるようになる可能性があります。これは予想外の展開でした。
ザトウクジラの歌は「流行」する可能性があります。オーストラリア沖のザトウクジラは、いわばK-POPシンガーのような存在で、彼らの歌は海洋の「SoFar Channel」(水中の音波伝達経路)を通じて伝わります。この経路は光ファイバーケーブルのように機能し、ザトウクジラやマッコウクジラは、最大5,000キロメートルもの距離を隔てて通信を行うことができるのです。
9.2 責任ある研究開発の必要性
このような状況下で、もし私たちが十分な配慮なしに合成的なクジラの歌を作り出してしまったら、「クジラのカルト」のようなものを生み出してしمっう可能性があります。私たちにはまだ分からないことが多すぎるのです。
そのため、技術が実際に利用可能になる前に、新しい責任に対応する準備をすることが非常に重要です。この技術はエコツーリズムに利用されるかもしれませんし、密猟者に悪用される可能性もあります。事前にセーフガードを設けておく必要があります。
Earth Species Projectの目的は、自然界の他の生物との関係を変革することです。この新しい責任に対応することは、その目的の重要な一部です。
私は以前、Firefoxのバージョン1から4までのデザインを担当していました。オープンソースの信奉者として、Earth Species Projectも当初はすべてをオープンソースにする予定でした。科学と保護活動を広範囲に加速させることが目的だったからです。
しかし、その考えにはコストがあることに気づきました。最大のモデルをそのままオープンソースで公開すると、無制限に拡散することで害を引き起こす可能性があります。そのため、どのように、いつ公開するかについて、より慎重なアプローチを取る必要があります。
10. 将来展望
10.1 近い将来の技術的可能性
異種間コミュニケーション技術は急速に進歩しています。私たちは2ヶ月前に、初めての完全な双方向リアルタイムコミュニケーション実験を開始しました。最初の対象は、音声と社会的学習を行うシマウマフィンチという小鳥です。
この実験では、実際の鳥の歌声と、AIが生成した歌声を組み合わせています。技術的には、今後6年以内に地球上の他の種との完全な双方向リアルタイムコミュニケーションが可能になると予測しています。
10.2 異種間コミュニケーションがもたらす影響
このような技術の発展は、私たちの世界観を大きく変える可能性があります。1995年12月18日、ハッブル宇宙望遠鏡が空の「空白」の一点を観測したとき、そこには「何もない」のではなく、「すべてがある」ことが発見されました。それまで見たことのない数の銀河が観測されたのです。
これは新しい科学的道具の一般的な原理を示しています。私たちが「何もない」と思っていた場所に向けられたとき、実は「すべてがある」ことを発見するのです。
同様に、地球上の他の生物にも意識があり、感情があるという事実に私たちが目覚めたとき、それは法律の基礎(誰が人格を持つのか)、宗教の基礎(誰が魂を持つのか)、さらには代替肉産業など、多くの分野に影響を与えるでしょう。
実際、私たちはまだこの変化がもたらすすべての影響を把握できていません。しかし、多くの先住民の神話では、人間は元々自然や動物と話すことができたとされています。その接続の喪失が、自然とのコミュニケーション不能として表現されているのです。
11. 結論
11.1 人類中心主義からの脱却
私たちが自然界の他の生物とコミュニケーションを取れるようになることで、この根本的な断絶を修復し、世界が私たちの想像以上に魔法のような場所であることを再認識できるようになるでしょう。これは非常に大きな力を持つ変化です。
11.2 AIがもたらす新たな世界観
AIの最も高度な形は、望遠鏡のように機能するかもしれません。望遠鏡を宇宙に向けたとき、私たちは地球が宇宙の中心ではないことを学びました。今度は新しい道具を世界に向け、人類が中心ではないことを発見するかもしれません。
この人間の自我の崩壊こそ、私たちが必要としているものです。AIは、私たちの視野を広げ、より謙虚で包括的な世界観をもたらす可能性があります。これにより、私たちは自然界との新しい関係を築き、より調和のとれた持続可能な未来を創造することができるでしょう。
この変革的な旅の始まりに立ち会えることを、私は非常に興奮しています。私たちは、人間以外の生物との対話を通じて、自分たち自身と世界についての新しい洞察を得る準備ができています。これは単なる科学的な進歩ではなく、私たちの存在の本質に関する深遠な探求なのです。