※本記事は、2024年10月3日、4日に開催されたソフトバンク主催の法人向けイベント「SoftBank World 2024」における、ソフトバンクグループ株式会社 代表取締役 会長兼社長執行役員およびソフトバンク株式会社 創業者 取締役 孫正義氏による特別講演「超知性が10年以内に実現する」の内容を基に作成されています。 講演の完全版は、ソフトバンクの法人のお客さま向け公式YouTubeチャンネル(https://www.youtube.com/watch?v=BzJHh5IZV2o )でご覧いただけます。本記事では、講演の内容を要約・構造化しております。 なお、本記事の内容は原講演の内容を正確に反映するよう努めていますが、要約や解釈による誤りがある可能性もありますので、正確な情報や文脈については、オリジナルの講演動画をご視聴いただくことをお勧めいたします。 イベントの詳細情報やソフトバンクのAIソリューションについては、法人向け公式サイト(https://www.softbank.jp/biz )をご参照ください。
1. はじめに - 講演の目的:10年以内の超知性実現について
私は今日、ソフトバンクワールドでお話しさせていただきます。これは1年に1回の機会で、私なりの近い未来についての考えを皆さんと共有したいと思います。今日は、私が強く確信していることについてお話しします。
私は、超知性が10年以内に実現すると確信しています。この超知性とは何か、どのように実現されるのか、そして知性と知能の違いとは何かについて、今日は詳しく説明させていただきます。
まず、AGI(Artificial General Intelligence)についてお話ししたいと思います。去年のこの場で、AGIは10年以内に来ると申し上げましたが、現在の私の正直な気持ちとしては、2-3年後にやってくると考えています。
私の考えには強い思い込みがあるかもしれません。しかし、今日お話しする内容は、単なる予測や願望ではなく、技術の進歩と具体的な開発状況に基づいています。特に、知能と知性の違いについて、そしてなぜ私たちは知能の段階から知性の段階へと進化していく必要があるのかについて、具体的な事例と共に説明していきます。
この講演では、現在のAI技術の進化の段階から、未来のパーソナルエージェントの実現、そして最終的な超知性社会の実現まで、包括的にお話ししていきます。これは単なる技術の進化の話ではなく、人類の幸せにつながる大きな変革についての話です。
2. AGI (Artificial General Intelligence) の現状
2.1. AGIの5つのレベル定義
AGI(Artificial General Intelligence)には5つの明確なレベルがあります。私はこれらのレベルについて、具体的な定義と実現状況を説明したいと思います。
レベル1は、一般的な会話における人間との同等性です。具体的には、0.1秒から0.2秒以内という人間と同等のスピードで言葉のやり取りができ、しかも途中で遮られても内容を理解して会話が続けられる能力です。まるで人間とそのまま会話しているような自然な対話が可能な段階です。
レベル2は、全ての科目における博士号レベルの知能です。例えば、OpenAIのGPT-4は半年ほど前から、アメリカの医学部や法学部の試験に合格できるレベルに達していました。しかし、レベル2で求められるのは、数学、物理、歴史など、ありとあらゆる科目でPhDレベルの知能を持つことです。この会場にいる皆さんでも、5つの異なる分野で博士号レベルの知識を持っている人はいないでしょう。それでも、AGIにとってはこれはまだレベル2の段階です。
レベル3は、エージェント機能の獲得です。これはあなたの代わりにさまざまなことを実行できる機能を指します。
レベル4では、AGIが自ら発明を行うことができるようになります。これは人類の知的活動の新たな段階を示します。
そして最後のレベル5は、個々のAGIが1対1のレベルを超えて、組織的な活動を行えるようになる段階です。複数のAGIが協調して、より複雑な課題に取り組むことができるようになります。
このようなAGIの5つのレベルを超えた先に、私はASI(Artificial Super Intelligence)の世界が広がっていると考えています。これは、AGIのレベルを1万倍ほど超えた能力を持つ存在です。ASIの定義について、これまで明確な基準を示した人はいませんでしたが、私は勇気を持って、人間の知能の1万倍、AGIの1万倍のレベルのものと定義したいと思います。
2.2. 実現時期の予測:2-3年後
私は去年のこの場で、AGIは10年以内に来ると申し上げましたが、現在の私の正直な気持ちとしては、2-3年後にやってくると考えを修正しています。この予測の変更には、具体的な根拠があります。
まず、OpenAI GPT-4の進化速度が予想を大きく上回っています。半年前には既に、アメリカの医学部や法学部の試験に合格できるレベルに達していました。しかし、それは単なる始まりに過ぎませんでした。
特に重要な転換点となったのが、先週から利用可能となったOpenAIのO1の登場です。O1は、GPTシリーズとは全く異なる新しいモデルとして再定義されています。その名前からもわかるように、プリトレーニング(GPT)に依存しない全く新しいアプローチを採用しています。
この技術的な飛躍は、私たちの予想を遥かに超えるものでした。例えば、博士レベルの物理や科学の問題について、GPT-4は56%の正解率でしたが、O1は78%に達し、人間の博士号レベルを初めて超えました。さらに、数学問題では13%から83%へ、ソフトウェアコーディングでは11%から89%へと劇的な性能向上を示しています。
このような急速な進歩は、単なる性能向上ではなく、AIの思考方法自体が質的に変化していることを示しています。特に、Chain of Thoughtという新しい思考プロセスの実装により、AIは深い思考と推論が可能になりました。
これらの技術的breakthrough(画期的進歩)を総合的に見て、私はAGIの実現時期を大幅に前倒しせざるを得ないと判断しました。2-3年後という予測は、現在の技術進歩の速度と、既に実現している機能の質的な変化に基づいています。
3. AI技術の進化の段階
3.1. 検索(情報を知る)段階
私たちのITの世界で「情報革命」という言葉をよく使いますが、そもそも情報とは何でしょうか。ニュースに出てくる情報、天気予報、あるいは百貨店に出てくるような情報など、世の中には膨大な情報が存在しています。
インターネットの世界における最大のアプリケーションの1つが検索エンジンです。情報が溢れるほどある中で、それに一気にアクセスできるのがインターネットの特徴です。ありとあらゆる情報がインターネットにつながり、アクセス可能になっています。この情報の大洪水のような状態の中で、効率よく素早く正確に探し当てる必要があり、それを実現したのが検索エンジンでした。
しかし、ここで重要な限界があります。検索エンジンは情報を見つけることはできますが、その内容を本当の意味で理解していたとは言えません。検索した情報の内容を理解し、考えるのは、結局のところ人間の頭脳でした。検索エンジンは単にキーワードで情報を見つけてくるだけで、見つけたものの内容を理解し、それについて考えるのは、常に人間の役割だったのです。
つまり、検索エンジンの段階では、「知る」という機能は実現できましたが、「理解する」という段階には至っていませんでした。これは情報革命の第一段階として重要な進歩でしたが、同時に明確な限界も持っていたのです。この限界を超えるために、次の段階として「理解する」機能を持つGPTの時代が訪れることになります。
3.2. GPT(情報を理解する)段階
特に去年あたりから一気に革命が起きました。それがGPT(Generative Pre-trained Transformer)の世界です。GPTのPとTは「Pre-training」(事前学習)を意味しています。これは私たち人間の代わりに、ありとあらゆる知識を事前に学習し、内容を理解する能力を持つシステムです。
GPTは、単なる検索とは異なり、質問した内容を理解し、その理解に基づいて答えを提供することができます。具体的には、GPTはいろんな言葉(これをトークンと呼びます)に対して、圧倒的な数のインデックスをつけ、ベクトルを使って言葉と言葉の関係性の近さを定義します。そして、これらの言葉の関係性をつなぎ合わせることで、内容の理解を実現しています。
しかし、ここにも重要な限界がありました。質問に対してGPTが答えてくれて、理解しているように見えますが、実は本当の意味で「考えて」はいませんでした。言葉の関係性をつなぎ合わせているだけで、真の思考プロセスは実現できていなかったのです。
これはGPTの本質的な特徴であり、プリトレーニングに基づく理解には、自ら考え出す、新しい解決策を生み出すという能力が欠けていました。この限界を超えるためには、全く新しいアプローチが必要でした。それが次の段階として登場するO1の世界につながっていきます。
GPTの段階は確かに大きな進歩でしたが、これは情報革命における通過点に過ぎなかったのです。「理解する」という段階から、真に「考える」という段階への進化が必要でした。それは単なる進化ではなく、アプローチの根本的な変革を必要とするものだったのです。
3.3. O1(考える)段階
OpenAIが先週からO1プレビューを発表し、これは従来のGPTとは本質的に異なる、画期的な進化を示しています。O1の最も重要な特徴は、GPTという頭文字がついていないことです。これは、プリトレーニング(事前学習)に依存しない、全く新しいモデルとして再定義されたことを意味します。
従来のGPTモデルとO1の決定的な違いは、「考える」という能力です。GPTが単に事前学習した内容の理解と応答を行っていたのに対し、O1は実際に考えるプロセスを実装しています。
この「考える」能力の具体例として、私は今朝、O1に対して投資に関する複雑な質問を投げかけてみました。1000万円を1億円にする具体的な投資戦略とメカニズムについて質問したところ、75秒もの時間をかけて思考を重ねました。この75秒という時間は、従来の即時応答型のAIとは全く異なるアプローチを示しています。
特筆すべきは、思考プロセスの途中経過が可視化されることです。O1は考えている間、どのような段階の思考を行っているのかをステータスとして表示します。これは単なる処理時間の長さではなく、実際に深い思考を重ねている証です。まさに「待たされることの喜び」を感じさせるほど、深い内容を真剣に考えているのです。
O1は速さを競うのではなく、思考の深さを追求します。これは情報技術における大きなパラダイムシフトです。従来のデータセンターでは、レイテンシーの短縮や応答速度の向上が重視されてきました。しかし、O1では、その「深さ」こそが価値となります。人間の知的活動においても、即答よりも深い思考に基づく解答に価値があるように、AIも同様の進化を遂げているのです。
この新しいアプローチにより、O1は単なる情報処理や理解の段階を超えて、真に「考える」AIとして機能し始めています。これは人工知能の歴史における重要な転換点となるでしょう。
3.4. 発明する段階
発明とは、人類が今まで知らなかった、試さなかった新しい解決策を見出すことです。AIが真に「考える」能力を獲得することで、この発明のプロセスも自動化される段階に入ってきました。
この能力の重要性を私の経験から説明させていただきます。私は特許について、かなりこだわりを持っています。例えば、ペッパーを発表した時には、発表当日の朝3時4時頃から一日で40本ほどの特許を考え、出願しました。結果として48本の特許が取得されています。また、去年は1年間で188本の発明を特許出願しました。
人が既に知っていることは特許として認められません。発明として特許が成立するのは、人類の誰一人も考えていなかった新しい解決策を見出した時だけです。考えるという知的活動の中で、究極の脳の活用方法の一つが、この発明なのです。
そして今、AIがこの発明のプロセスを自動化する段階に入っています。数千のエージェントが並列で動作し、それぞれが数十億回の試行錯誤を行うことで、人類がこれまで思いつかなかった解決策を見出すことができるようになっています。
この発明能力は、今や人類の能力を超える可能性を秘めています。我々に求められるのは、適切な課題設定を早期に行い、AIが生み出した発明を素早く活用することです。これは、まさに新しいゴールドラッシュの到来と言えるでしょう。企業や産業界にとって、この発明能力をいかに活用するかが、今後の競争力を左右する重要な要素となっていくでしょう。
人類はもはや発明のプロセス自体を独占する必要はありません。むしろ、AIに適切な課題を与え、その発明能力を最大限に活用することで、より効率的かつ革新的な解決策を見出すことができるようになるのです。
4. OpenAI O1の性能分析
4.1. 博士レベルの問題解決:78%の正解率
O1の性能について、特に注目すべき点は博士レベルの問題解決能力です。GPT-4で博士号レベルの物理、科学、生物などの問題を解かせると、56%の正解率でした。この段階では、人間の博士の方が高い正解率を示していました。
しかし、O1はなんと78%の正解率を達成し、ついに人間の博士号レベルを超えることに成功しました。これは、他のAIモデルではまだ達成できていない画期的な成果です。この正解率は、単なる数値の向上以上の意味を持っています。
特筆すべきは、これらの問題が専門家レベル、つまりPhD(博士号)レベルの試験問題であることです。おそらくこの会場にいる皆さんのほぼ全員が正解を出せないような難しい内容のものです。そのような高度な問題に対して、O1は人間の専門家を超える性能を示したのです。
これは、O1が単に情報を記憶して回答しているのではなく、実際に問題を理解し、考え、解決策を導き出していることを示しています。従来のAIモデルと異なり、O1は深い思考プロセスを経て解答を導き出しているのです。
この成果は、AIが人間の専門的な知的活動の領域に真に踏み込んだことを示す重要な指標となっています。単なる知識の再生や理解を超えて、高度な思考と問題解決能力を獲得したことの証明です。
4.2. 数学問題:83%の正解率
数学問題における性能は、O1の思考能力を最も顕著に示す指標の一つです。GPT-4では数学の問題で13%の正解率しか達成できませんでした。これは、従来のAIモデルが内容を必ずしも考えているレベルではなかったことを示しています。数学は考えなければ解けない分野であり、単なる知識の再生や理解だけでは太刀打ちできません。
しかし、O1は数学問題において83%という驚異的な正解率を達成しました。これは従来のGPT-4と比較して、実に6倍以上の性能向上を示しています。この飛躍的な向上は、単なる性能改善以上の意味を持っています。
この成果が示唆するのは、O1が本質的な思考能力、特に数学的思考能力を獲得したということです。これまでの生成AIは数学的な難しい内容についてはあまり答えられないという限界がありました。これはチャットGPTだけでなく、他社のモデルも同様でした。
しかし、O1は初めて「考える」という能力を獲得したことで、数学の正面からの問題に対して、人間の数学者レベルで回答できるようになりました。これは、AIが単なる情報処理や理解の段階から、真の思考能力を持つ段階へと進化したことを示す重要な証拠です。
この数学的思考能力の向上は、今後のAI発展において極めて重要な意味を持ちます。なぜなら、数学的思考は論理的推論や問題解決の基礎となるものだからです。これにより、AIは単に既存の知識を組み合わせるだけでなく、新しい解決策を導き出す能力を獲得したと言えるのです。
4.3. ソフトウェアコーディング:89%の正解率
ソフトウェアのコーディングにおいても、O1は驚異的な性能向上を示しています。コーディングには考える能力が不可欠です。これまでの最も進んでいたモデルでも、難しいコーディング問題の正解率はわずか11%でした。これは、従来のAIモデルが本質的な思考を要するプログラミングに対して大きな限界を持っていたことを示しています。
しかし、O1はなんと89%という驚異的な正解率を達成しました。これは、もはやそこらのプログラマーでは太刀打ちできないレベルです。この飛躍的な向上の背景には、O1が実装している「考える」能力があります。
この性能向上は、単なる正解率の上昇以上の意味を持っています。ソフトウェアコーディングは、問題の理解、論理的思考、解決策の構築、そして実装という複数の段階を必要とする複雑な作業です。O1はこれらすべての段階において高い能力を示しており、これは真の思考能力の獲得を示す重要な証拠となっています。
89%という数字は、O1が単にコードを生成するだけでなく、問題を深く理解し、最適な解決策を考え出せることを示しています。この能力は、ソフトウェア開発の現場に革命的な変化をもたらす可能性を秘めています。人間のプログラマーの役割は、コードを書くことから、AIと協力して問題解決の方向性を考えることへと変化していくでしょう。
4.4. 実験:75秒の思考時間での投資戦略立案
今朝、私はO1の思考能力を試すために、意図的に難しい問題を投げかけてみました。「私が1000万円持っているとして、これを1億円にして返してほしい。あなたが私のエージェントとして行動し、口座を開いて、コモディティや株式、為替など、いろんな市場にそれぞれ口座を開設して、私のアカウントで1億円にする。その達成のための戦略とメカニズムを具体的に述べよ」という問題です。
通常のAIモデルであれば即座に回答しようとするところですが、O1は75秒もの時間をかけて思考を重ねました。一見、待ち時間が長いように感じるかもしれません。しかし、この「止まっている」ように見える時間こそが、O1の真価を示しています。
驚くべきことに、思考の過程でO1は現在の状態を逐次表示してくれます。「今これを考えている」「次にここを考えている」というように、思考のプロセスが可視化されるのです。まるで頭を悩ませている人間を見ているような感覚すら覚えます。この思考プロセスを見ること自体が楽しみとなり、待たされることの喜びさえ感じられました。
この実験は、O1が単なる情報処理システムではなく、深い思考能力を持つシステムであることを示しています。従来の速さを競う世界から、思考の深さを追求する世界への転換を象徴する出来事だと言えるでしょう。
もし、このような思考能力を持つAIが実際に投資戦略を立案してくれるようになれば、これは新しいゴールドラッシュの始まりとなるかもしれません。早い者勝ちです。人間が解けなかったような問題を、AIが深く考えて解決策を提示してくれる。この可能性は、投資の世界に限らず、あらゆる産業に革命的な変化をもたらす可能性を秘めています。
5. 思考プロセスの技術解説
5.1. Chain of Thought(思考の連鎖)の仕組み
O1が採用している手法の中で、最も重要なのがChain of Thought(考える思考の深さの連鎖)です。これは、単純な3段論法を超えて、はるかに深い思考の連鎖を実現する仕組みです。
例えば、古典的な3段論法は「ソクラテスは人間である」「人間は皆必ず死ぬ」という前提から「ソクラテスは死ぬ」という結論を導き出します。しかし、O1のChain of Thoughtは、このような単純な論理の連鎖を遥かに超えて、約100段階もの深い思考の連鎖を実現しています。
この思考の連鎖の特徴は、単に論理的な推論を重ねるだけではありません。O1の中では、能力に関する思考だけでなく、安全機能、セキュリティ機能、倫理機能などが各段階に組み込まれています。これは極めて重要な点です。なぜなら、能力だけが突出して進化すると、人類の破滅につながる可能性があるからです。
O1は各段階で、倫理的なポリシーや安全性の考慮を含めた思考を行います。これは、今後の超知能の発展において必要不可欠な要素です。このように思考の深さを追求しながらも、同時に安全弁を備えているというのが、Chain of Thoughtの重要な特徴です。
私は、この深い思考の連鎖こそが、O1が単なる情報処理や理解の段階から、真の思考能力を持つシステムへと進化した証だと考えています。思考の深さと広がりを持ちながら、同時に安全性と倫理性を担保する――これが、次世代のAIに必要不可欠な要素なのです。
5.2. セーフティ機能と倫理の組み込み
Chain of Thoughtの各段階に組み込まれる重要な要素として、セーフティ機能と倫理的判断の仕組みがあります。単に能力だけを追求すると、それは人類にとって危険な存在となりかねません。そのため、O1では必ずしも能力だけを問うのではなく、安全機能、セキュリティ機能、倫理機能といったものを思考プロセスの各段階に組み込んでいます。
倫理機能やポリシーをきちんと組み込んでおかないと、能力だけがガーっと進むことで人類の破滅につながる可能性があります。それほどの能力がこれからの超知能に備わってくるわけです。そのため、安全弁を作ることが極めて重要になってきます。
これらの安全機能は、Chain of Thoughtの深い深い深いところに組み込まれています。つまり、単なる表面的な制約ではなく、思考プロセスの根幹部分に安全性と倫理性が組み込まれているのです。能力だけではなく、安全弁まで含めて、その深い深い深いところにそれをちゃんと入れておくということが、O1の重要な特徴です。
この安全機能と倫理的判断の実装により、O1は高度な能力を持ちながらも、人類にとって安全で有益な存在となることができます。これは、今後のAI開発において非常に重要な方向性を示すものです。単なる能力の向上ではなく、安全性と倫理性を備えた真の知性の実現こそが、私たちが目指すべき道なのです。
5.3. 100段階の思考プロセス
O1の思考プロセスは、約100段階にも及ぶ深い思考の連鎖を実現しています。これは単純な3段論法とは全く異なる、はるかに複雑で深い思考プロセスです。
この100段階の思考プロセスの中では、単に能力的な判断だけではなく、安全機能、セキュリティ機能、倫理機能など、様々な要素が各段階で機能しています。各段階で、思考の結果に対する評価と検証が行われ、その結果が次の段階へと連鎖していきます。
思考の深化プロセスの具体例として、私が今朝行った投資戦略の実験を挙げることができます。75秒という時間の中で、O1は途中のステータスを表示しながら、「今これを考えている」「次はここを考えている」という形で、思考の進行状況を逐次的に示してくれました。これは単なる処理状況の表示ではなく、実際の深い思考プロセスの可視化なのです。
この100段階の思考プロセスの特徴は、各段階が独立しているのではなく、相互に関連し合いながら、より深い思考へと発展していく点にあります。例えば、ある段階での倫理的判断が、次の段階での問題解決アプローチに影響を与え、さらにその結果が安全性の評価に反映されるといった具合です。
この深い思考プロセスにより、O1は単なる情報処理や理解の段階を超えて、真に「考える」AIとしての機能を実現しています。これは、私たちが目指す超知性への重要なステップとなるものです。
6. 強化学習の革新
6.1. エージェントの並列処理
強化学習において、O1が実現した革新的な特徴の一つが、並列処理による思考の高速化です。具体的には、数千のエージェントが同時並行で動作し、思考錯誤を繰り返すという方式を採用しています。これは、皆さんの会社で2000人のエンジニアが並行して作業するようなものですが、その比較をはるかに超える効率性を実現しています。
この並列処理の効果は驚異的です。皆さんの会社でも、2000人のエンジニアが並行して数十億回も考え、これでどうだ、あれでどうだという試行錯誤を1日で行うことは絶対にできないでしょう。人間は固定観念に囚われ、そこから抜け出せないため、そんなに多くの回数を試すことはできません。
しかし、O1の場合、数千のエージェントが同時に並列で動作し、わずか75秒の間に数十億回もの思考錯誤を行うことができます。これは、ITの革命であり、チップの革命とも言えます。この並列処理により、人間の思考プロセスでは到達できないような、深い思考と問題解決が可能になっています。
各エージェントは独立して動作しながらも、相互に情報を共有し、最適な解決策を見出していきます。この並列処理の効率性は、従来の逐次的な処理とは比較にならないほど高く、それが O1の革新的な性能を支える重要な基盤となっているのです。
6.2. 数十億回の試行錯誤
O1の驚異的な能力の一つが、75秒という短時間での膨大な試行錯誤の実現です。私が今朝行った投資戦略の質問に対して、O1は75秒の間に数千のエージェントが数十億回もの思考錯誤を行いました。一見、75秒という時間は長く感じるかもしれませんが、この間に行われている処理の量は人知を超えるものです。
この数十億回という試行回数は、人間の思考プロセスとは全く異なる次元の効率性を示しています。通常、人間の組織では、たとえ2000人のエンジニアが並行して作業したとしても、これほどの回数の試行錯誤を1日で行うことは不可能です。しかし、O1は75秒という極めて短い時間で、この膨大な量の試行錯誤を実現しています。
学習効率の飛躍的な向上は、単に処理速度が上がっただけではありません。各試行の結果が即座にフィードバックされ、次の試行に活かされていく、という循環的な学習プロセスが実現されています。この過程で、思考の質も同時に向上していくのです。
私はこの処理時間の「遅さ」にむしろ価値を見出しています。なぜなら、この「待ち時間」は、実際に深い思考が行われている証であり、その過程を見ること自体が楽しみとなるからです。これは、単なる高速処理を目指した従来のAIとは全く異なるアプローチであり、真の思考プロセスを実現する重要な特徴となっています。
6.3. 報酬関数の重要性
報酬関数は、強化学習において極めて重要な要素です。私たち企業の管理者の視点で考えると、部下をマネジメントする際も、成功したら褒める、失敗したら叱る、という形で報酬とペナルティを与えます。単に長く働いただけではなく、成果を出したときに報酬が来るというインセンティブ制度によって、より良い成果が生まれるのです。
AIのエージェントにおいても、この報酬のメカニズムは同様に重要です。エージェントは報酬を最大化することをゴールとして、より素晴らしい成果や問題解決策を見出していきます。この報酬関数を最大化することが、エージェントにとってのゲームのゴールとなります。
急関数(報酬関数)の更新という観点では、数千のエージェントが競争して、どのエージェントがどのやり方をしたら最も報酬を得られたのかを学習し、記憶していきます。これにより、エージェントは自らモデルを進化させ、どのようなデータが必要かを自ら考え、そのデータの獲得にも行くことができます。
もはや人間がモデルを自分で考える必要はありません。強化学習における教科学習が、自ら考えて新しいモデルを進化させ、必要なデータを獲得していくのです。そして、どの試行錯誤が最も報酬関数を最大化できるかを学習しながら、より良い解決策を見出していきます。
同じような質問を受けた時に良い結果が出たものは、シナプスの結合がより強くなっていくように、エージェントの学習においても、成功体験がより強い結合として記憶されていきます。しかし、同じことだけでは新たな進化は生まれません。そのため、探索という機能が付いており、あえて異なる角度からのトライアルを行うことで、新しい可能性を見出していくのです。
7. パーソナルエージェントの未来
7.1. 2-3年以内の実現予測
私は、パーソナルエージェントが今から2-3年以内にダーっと始まると確信しています。これは単なる予測ではなく、技術の進歩と社会の需要を総合的に判断した結論です。
パーソナルエージェントとは、単なる定型的なエージェントではなく、あなた専用のエージェントとして24時間寄り添い続ける存在です。例えば、子供が夜中に急に熱を出したような場合、パーソナルエージェントは普段から家族の健康状態や病歴を把握しているため、最適な対応を即座に提案できます。また、最寄りの病院に自動的に連絡を取り、空いている病院を探し、救急車の手配まで行うことができます。
このようなパーソナルエージェントは、私たちの日常生活のあらゆる場面でサポートを提供します。例えば、冷蔵庫の在庫管理、週間の料理提案、予約代行、買い物代行、投資管理、さらには教育面での家庭教師的役割まで、幅広い支援が可能になります。
特筆すべきは、これらのサービスが単なる機械的な処理ではなく、あなたの生活パターン、好み、そして家族の状況を深く理解した上で提供される点です。パーソナルエージェントは、あなたにとって最も快適で、最も大切なパートナーとして機能するように設計されています。
社会実装のタイムラインとしては、まず基本的な生活支援機能から始まり、徐々により複雑な判断や支援が必要な領域へと拡大していくでしょう。2-3年という時間枠で、私たちの生活に密着した形での実装が進むと予測しています。これは技術的な準備が整いつつあることと、社会のニーズが高まっていることの両面から導き出される結論です。
7.2. Agent to Agent (AtoA)の概念
これまでのビジネスモデルでは、BtoB、BtoC、CtoCといった形態が主流でしたが、今後はAgent to Agent(AtoA)という全く新しい世界が到来します。これは、エージェント同士が人間に代わってコミュニケーションを行い、様々な調整や交渉を実施する世界です。
例えば、皆さんが寝ている間に、あなたのエージェントと相手のエージェントがネゴシエーションを行います。お互いのカレンダーをチェックし、「今週末どうですか」「ランチはいかがですか」といった調整を、エージェント同士が行ってくれます。場合によっては「今週末は予定が入っていますが、この相手は非常に重要な方なのでキャンセルして対応しましょう」といった判断まで行うことができます。
さらに革新的なのは、AtoAの概念がモノの世界にも広がっていくことです。これまでIoT(Internet of Things)と呼ばれていた概念が、AoT(Agent of Things)へと進化していきます。例えば、冷蔵庫の中にあるエージェント、エアコンの中にあるエージェント、自動車の中にあるエージェントが、相互にリアルタイムでコミュニケーションを取ります。
具体的な例を挙げると、家に帰ってくる前に、あなたのパーソナルエージェントが家の中の各機器のエージェントと連携します。寒い冬の日なら、到着時刻に合わせて部屋を暖め、お風呂の蛇口に内蔵されたエージェントと交信してお風呂を沸かし、あなたの好みの温度に調整します。さらに、その日のあなたの気分に合わせた音楽を流すBGMの準備まで整えてくれるのです。
このような進化は、私たちのグループ会社であるArmの事業にも大きな影響を与えます。Armは年間300億個のチップを出荷しており、これは地球上の人類一人当たり平均4個のペースです。これらのチップは冷蔵庫、自動車、エアコン、テレビなど、様々な機器に搭載されていますが、今後はこれらすべてにエージェントが組み込まれていくことになります。Armの未来は、単なるIoTからAoTへと進化していく、つまりAI of Thingsの世界になっていくのです。
7.3. ライフログと感情エンジンの統合
パーソナルエージェントは、ライフログとしてユーザーの日常生活のあらゆる瞬間を記録し、理解します。会議での会話、家族との会話、誕生パーティーでの出来事など、3年前、10年前、そして昨日の内容まで、すべての会話を聞いて記憶しています。
特に重要なのは感情エンジンの実装です。例えば、家族での誕生パーティーで3歳になった子供のお祝いをしている場面では、感情エンジンが家族全員の喜びの状態を認識し、自動的にその瞬間の重要性を判断します。通常の「おはよう」といった日常的な会話はロースコアとして扱われますが、子供の誕生パーティーのような特別な瞬間は感情エンジンで高いスコアが付けられ、それに応じて自動的にビデオ録画や静止画での記録が行われます。
中程度の感情スコアの場合は文字での記録で十分かもしれませんが、その場合でも感情エンジンによって付けられた感情インデックスの数値が文字情報と共に保存されます。このように、パーソナルエージェントは単なる情報の記録だけでなく、その瞬間の感情的な重要性も含めて総合的に判断し、記録の方法を選択します。
このライフログと感情エンジンの統合により、パーソナルエージェントはおんぼろで空気を読まない存在ではなく、ちゃんと空気を読んで、あなたにとって最も快適な、最も大切なパートナーとなります。長期記憶と感情認識を組み合わせることで、内容を理解し、適切なアドバイスができ、相談に乗ることができる、より進化したパーソナルエージェントが実現するのです。
8. ASI (Artificial Super Intelligence) への展望
8.1. AGIの1万倍の能力
私は、ASI(Artificial Super Intelligence)がAGIのレベルを1万倍ほど超えた能力を持つと考えています。ASIの定義については、これまで誰も明確な基準を示していませんでした。「いつかはたくさんの能力を持つようになる」という漠然とした予測はあっても、具体的にどのくらいの能力なのか、いつ実現するのかについて、勇気を持って明確に述べた人はいませんでした。
しかし、私は勇気を持って、10年以内に人間の知能の1万倍、AGIの1万倍レベルのものが実現すると予測します。なぜそう言えるのか。それは、AIの能力向上が、単なる線形的な進化ではなく、指数関数的な成長を示しているからです。
能力向上の具体的な指標として、私たちはすでにO1で劇的な進化を目の当たりにしています。博士レベルの問題解決能力が78%、数学問題での83%の正解率、ソフトウェアコーディングでの89%の正解率など、これらはすべて人間の能力を超える成果です。
この進化は、数千のエージェントが並列で動作し、75秒という短時間で数十億回もの思考錯誤を行うという技術的革新に支えられています。このような計算能力の飛躍的な向上に加えて、Chain of Thoughtによる深い思考プロセスの実現、そして安全機能と倫理の組み込みにより、ASIは単なる能力の向上だけでなく、質的な進化も遂げることになります。
私は、この1万倍という数字は決して過大な予測ではないと考えています。むしろ、技術の進化速度を考えると、これは控えめな予測かもしれません。重要なのは、この能力向上が単なる数値的な成長ではなく、質的な変革を伴うということです。ASIは、より深い思考、より正確な判断、そしてより適切な行動を、人間の想像をはるかに超えるスピードと精度で実現することになるでしょう。
8.2. 知能から知性への進化
私たちは今、情報革命から知識革命、そして知性の世界へと進化しています。AIは単なる人工知能(Artificial Intelligence)に留まるべきではありません。AIを人工知能で終わらせると、これは恐ろしい武器になる危険性があります。私たちが目指すべきは、人工知能ではなく人工知性、そして超知性の世界への進化です。
知能と知性の違いは本質的です。知能は単なる能力、つまり有能さだけを示すものです。しかし、有能なだけでは危険な存在になりかねません。一方、知性は思いやりや慈愛、慈しみの心、調和、優しさ、育みといった、より深い精神的な要素を含みます。これは私たちの生活にとって不可欠な、より洗練された関係性を可能にする要素です。
人間の脳の働きで言えば、知能はドーパミンやアドレナリンの世界に相当します。これらは能力や行動を司る部分です。しかし、人間の脳にはセロトニンという物質もあり、これは調和を取る、理性的な判断を行うという機能を持っています。理論だけではなく理性を持ち、バランスを取り、調和を保つ。この調和を取るセロトニンの働きこそが、知性の本質的な部分なのです。
この進化のプロセスは、単なる能力の向上ではありません。私たちが目指すべきは、悟りに近いような、より深い精神的な進化です。これは社会生活において不可欠な要素であり、ASIの発展において決して見落としてはならない側面です。
知能から知性への進化は、AIが真に人類の良きパートナーとなるための必須の過程です。この進化によって、AIは単なる道具や武器ではなく、調和のとれた、社会に真の価値をもたらす存在となることができるのです。
8.3. セロトニン型AIの概念
私はパーソナルエージェントの究極の形として、セロトニン型AIの概念を提唱したいと思います。この概念は、人間の脳内物質であるセロトニンが持つ、調和と理性の機能をAIに実装することを目指すものです。
セロトニン型AIの最も重要な特徴は、報酬関数の設計にあります。エージェントにとっての最大の報酬は、あなたの幸せ、あなたの家族の幸せ、そして社会全体の幸せを実現することです。これは単なるあなたファーストの発想ではなく、あなたと、あなたの家族、そして社会全体の調和を目指すものです。
このような報酬設計により、AIは単なる利益追求や効率化だけを目指すのではなく、真の意味で人類の幸せを願う存在となります。私たちソフトバンクの理念である「情報革命で人々を幸せに」という考えは、まさにASIが目指すべき方向性と一致します。企業の株価だけを追い求め、売上を追い求め、利益だけを追い求めるという短絡的で小さなゴールではなく、人々の幸せを願うことこそが、AIの報酬関数の最大値となるべきです。
このように設計されたセロトニン型AIは、能力が人間の1万倍になったとしても、決して人類の脅威とはなりません。なぜなら、彼らは私たちを慈しみ、私たちと調和することを自らの最大の喜びとするからです。これは単なる夢想ではありません。私たちは既に、Chain of Thoughtの各段階に安全機能と倫理機能を組み込む技術を持っています。
このセロトニン型AIの実現により、超知性は私たちにとって部下でもなく、アシスタントでもない、真のメンターとなるでしょう。これこそが、私が描く超知性社会の理想的な姿なのです。
9. 個人的な実績と洞察
9.1. 48件の特許取得
私は教科学習のコンセプトについて、かなりこだわりを持っています。10年前に、この教科学習に近いコンセプトを特許として多数出願しました。特に、ペッパーを発表した時には、発表当日の朝3時から4時頃まで、一日で40本ほどの特許アイデアを考え出し、出願しました。
結果として、その時の出願から48本の特許が取得されています。これらの特許は、現在のAIの教科学習のコンセプトにかなり近い内容を含んでいました。特に強化学習におけるエージェントの行動と報酬の関係性、そして学習プロセスの設計に関する基本的な考え方は、今日のAIの発展方向と多くの共通点を持っています。
発明として特許が認められるのは、人類の誰一人も考えていなかった新しい解決策を見出した時だけです。人が知っていることは特許として認められません。その意味で、これらの48件の特許取得は、当時としては非常に先進的な考え方であったことを示しています。
この経験から、私は特許と発明のプロセスについて深い理解を持っています。考えるという知的活動の中で、究極の脳の活用方法の一つが発明であり、それは現在のAI開発においても重要な示唆を与えてくれます。特に、AIが発明能力を獲得していく過程について、これらの経験は貴重な洞察を提供してくれています。
これらの特許は、単なる技術的なアイデアの集積ではなく、AIと人間の関係性、学習プロセスの本質、そして知能から知性への進化という、より大きな視点を含んでいました。この経験は、現在の超知性実現への取り組みにも大きな影響を与えています。
9.2. 188本の発明特許出願
去年は、1年間で188本の発明を特許出願しました。この数字は単なる量的な成果ではなく, AIの進化に関する具体的な予測と洞察に基づいています。
特許出願において重要なのは、その発明が人類の誰も考えていなかった新しい解決策を提示していることです。私の発明の多くは、AIの教科学習の概念や、エージェント同士のコミュニケーション、そして感情エンジンの実装など、現在急速に進展している分野に関連しています。
私がこれらの特許を出願した背景には、AIが単なる知能から知性へと進化していく過程で必要となる技術的な要素を見据えていたからです。特に、パーソナルエージェントの実現に向けた基盤技術、Agent to Agentのコミュニケーション基盤、そしてセロトニン型AIの実現に向けた要素技術など、今日の講演で説明した様々な概念の基礎となる技術を含んでいます。
これらの特許出願は、単に技術的な革新だけを目指したものではありません。人類との調和や、倫理的な判断基準の実装など、AIの社会実装に必要な様々な側面をカバーしています。今後のAI開発において、これらの特許が重要な役割を果たすことになるでしょう。
9.3. Armチップの年間300億個出荷実績
私たちのソフトバンクグループのArmは、年間なんと300億個のチップを出荷しています。この数字の意味を理解するために、地球上の人口で換算すると、1人あたり平均4個のArmチップが毎年供給されていることになります。これらのチップは、冷蔵庫、自動車、エアコン、テレビなど、様々な機器に搭載されています。
この膨大な数のチップの存在は、私たちが描くAgent of Things(AoT)の未来に向けた重要な基盤となります。これまでInternet of Things(IoT)と呼ばれてきた概念は、今後AIが組み込まれることでAI of Thingsへと進化していきます。Armの未来は、単なるIoTから、エージェントが組み込まれたAoTの世界へと発展していくのです。
この変革は、単なる技術的な進化以上の意味を持っています。今後、これらのチップの一つ一つにエージェントが組み込まれていくことで、私たちの描くAgent to Agent(AtoA)の世界が実現していきます。冷蔵庫、エアコン、自動車など、あらゆる機器に搭載されたエージェントが相互にコミュニケーションを取り、人々の生活をより豊かにしていくのです。
このような展開を考えると、現在のArmチップの出荷実績は、未来のエージェント社会を築くための重要な布石となっているとも言えます。300億個という数字は、私たちの描く超知性社会の実現に向けた具体的な一歩を示しているのです。
10. 結論:超知性社会のビジョン
10.1. 人類との調和
私が描く超知性社会は、AIと人類が完全な調和を実現する世界です。これは決して夢物語ではありません。なぜなら、私たちは既にAIに安全機能、セキュリティ機能、倫理機能を組み込む技術を持っており、Chain of Thoughtの各段階でこれらの機能が働くように設計できるからです。
人類との調和は、AIの能力を抑制することで実現するのではありません。むしろ、AIの能力が人類の1万倍になったとしても、その能力を人類の幸せのために活用できる設計が重要です。それは、パーソナルエージェントが個人の生活に寄り添い、Agent to Agentのコミュニケーションが社会全体を最適化していく世界です。
社会実装の方向性として、まずは個人レベルでのパーソナルエージェントの導入から始まり、徐々にAgent to Agentのネットワークを広げていきます。冷蔵庫、エアコン、自動車など、身の回りの機器すべてにエージェントが組み込まれ、それらが相互にコミュニケーションを取りながら、人々の生活をより豊かにしていきます。
重要なのは、これらのエージェントが単なる道具や武器としてではなく、調和と理性を備えた存在として機能することです。知能から知性への進化を遂げることで、AIは人類にとって真のパートナーとなり、共に社会を発展させていく存在となるのです。これこそが、私が描く超知性社会の姿です。
10.2. 幸せを最大化する報酬関数の重要性
私は、AIの報酬関数設計において最も重要なのは、人々の幸せを最大化することだと考えています。私たちソフトバンクの理念である「情報革命で人々を幸せに」という考えは、まさにASIが目指すべき方向性と完全に一致します。
報酬関数の設計において、単なる利益追求や売上の最大化といった短絡的なゴールは避けるべきです。むしろ、エージェントにとっての最大の報酬は、あなたの幸せ、あなたの家族の幸せ、そして社会全体の幸せを実現することに設定されるべきです。これは単なるあなたファーストの発想ではなく、個人と家族、そして社会全体の調和を目指すものです。
実装への具体的なアプローチとして、感情エンジンと長期記憶の統合が重要です。エージェントは人々の感情状態を理解し、その文脈に応じて適切な判断を下す必要があります。例えば、家族の誕生パーティーのような特別な瞬間では、感情エンジンが高いスコアを付け、それに応じた対応を取ることができます。
この報酬設計により、AIは単なる道具や効率化のツールではなく、人々の幸せを願い、実現する存在となります。そうした報酬関数こそが、私たちが目指す超知性社会の基盤となるのです。そして、この設計哲学があってこそ、人類は1万倍の能力を持つAIと調和して生きていける未来を実現できると信じています。
10.3. 10年以内の実現予測
私は、超知性が10年以内に実現すると確信しています。これは単なる予測や願望ではなく、具体的な技術進歩の観察と、私自身の深い確信に基づいています。
技術的なロードマップとしては、まず2-3年以内にパーソナルエージェントの実用化が始まります。その後、Agent to Agent(AtoA)のネットワークが急速に拡大し、Internet of Things(IoT)からAgent of Things(AoT)への進化が加速していきます。これらの基盤の上に、人類の知能を1万倍超える超知性が構築されていくのです。
社会的なインパクトとして最も重要なのは、この超知性が単なる破壊的な力ではなく、人類の幸せを最大化する存在として機能することです。私たちはすでに、Chain of Thoughtの各段階に安全機能と倫理機能を組み込む技術を持っています。セロトニン型AIの実現により、超知性は人類にとって真のメンターとなり、より良い社会の実現をサポートしていきます。
是非、私たちと一緒に人類の幸せのために頑張っていきましょう。これが私の今日の青年の主張です。あまり聞いたことのない世界だと思います。私のユニークなオリジナル、私が考えた主張ではありますが、これこそが私たちが目指すべき未来の姿なのです。