※本記事は、2024年10月29日にサウジアラビアのリヤドにあるキング・アブドゥルアズィーズ国際会議センターで開催された第8回Future Investment Initiative (FII8)における「THIRD BOARD OF CHANGEMAKERS: AI」パネルディスカッションの内容を基に作成されています。
登壇者は以下の7名の産業界リーダーです:
- Shou Chew氏:TikTokのCEO。世界最大のショートフォーム動画プラットフォームを率い、AIを活用したコンテンツ推薦と創造支援を推進。
- Jack Hidary氏:SandboxAQのCEO。Googleのx(旧Google X)からスピンアウトした量子技術とAIの融合を専門とする企業を率いる。
- Benjamin Horowitz氏:Andreessen HorowitzのCo-Founder & General Partner。シリコンバレーを代表するベンチャーキャピタルのパイオニアとして、多数のテクノロジー企業の成長を支援。
- Travis Kalanick氏:CSS/Cloud KitchensのCEO、Uberの共同創業者兼元CEO。テクノロジーを活用した新しいビジネスモデルの創造に実績を持つ起業家。
- Ruth Porat氏:Alphabet & GoogleのPresident & CIO。世界最大のテクノロジー企業の経営を担い、AIの責任ある開発と活用を推進。
- Jay Puri氏:NvidiaのEVP, Worldwide Field Operations。AI革命の基盤となるGPUと計算プラットフォームを提供する企業の幹部。
- Eric Schmidt氏:Schmidt Sciencesの共同創業者、元GoogleのCEO & Chairman。テクノロジー産業の長年のリーダーとしてAIの未来像を提示。
モデレーターは、XPRIZE FoundationのFounder & Executive ChairmanであるPeter H. Diamandis氏が務めました。
本記事では、パネルディスカッションの内容を要約・整理しております。内容は登壇者の見解を正確に反映するよう努めていますが、要約や解釈による誤りがある可能性もございます。 なお、本パネルは、AI・ロボット工学、教育、医療、持続可能性の4つの重要分野において、世界中の優れた知見をリアルワールドのソリューションやアクションに変換することを目指すグローバルな非営利組織Future Investment Initiative Institute (FII Institute)によって開催されました。
1. ビジネス変革とAIの実践 (Travis Kalanick)
現在、私たちは大規模企業がより強くなる時代に入っています。強固なビジネスモデルを持つ大企業は、新しい技術によって中小企業に対する競争優位性を獲得しつつあります。これは、価値創造が大手プレイヤーにシフトしていることを示唆しています。
具体的には、単純なワークフロー、カスタマーサポート、オンボーディング、セールスなどの業務プロセスの自動化により、すでに強力なビジネスモデルがさらに強化されています。最大手企業にとって、これらの自動化は数兆ドル規模の価値を生み出す可能性があります。
私の会社Cloud Kitchensでは、食品業界における実践的なAI活用を進めています。例えば、Chipotleのフロントラインで働く人々が行うような調理工程を完全に自動化するマシンを開発しました。これにより、レストランは無人または1人のスタッフだけで運営可能になっています。さらに興味深いのは、その1人のスタッフがマシンと自然な対話を行えることです。「食材は温かいですか?」「在庫は十分ですか?」といった質問だけでなく、「ドジャースはヤンキースに勝ちましたか?」といった日常的な会話まで可能になっています。これは、人間とロボットが自然に対話する「インターステラー」的な世界への一歩を示しています。
イノベーションを加速するための私の原則は、「真実」「信頼」「情熱」の3つです。これらは私の会社の文化的価値観として定着しています。子供のような遊び心と好奇心、10代のような反抗心、そして年配者の知恵を組み合わせることで、スピーディーで大規模なイノベーションが可能になると考えています。
過去にUberのCEOを務めた経験からも、AIの重要性は明らかでした。当時、私たちは最先端のAI研究所を持っており、Googleから発表された注目の論文(Attention論文)も把握していました。また、輸送をハイフリークエンシートレーディングのビジネスとして捉え、ドライバーから乗車権を購入し、ライダーに販売するマーケットメーカーとしての役割を果たしていました。各都市にクオンツチームを設置し、最も低コストで信頼性の高い乗車サービスを提供することで、市場シェアと利益の拡大を目指していました。
2. 量的AIの新展開 (Jack Hidary)
「AI dies」という言葉は単なるフレーズではありません。現実に起きていることであり、AIに関与しない企業や国々は衰退していくでしょう。しかし、重要な問題は「どのAIを、どのように活用するのか」です。市場は今、単一のAIソリューションではなく、多様なAIの組み合わせを提供し始めています。
大規模言語モデル(LLM)は大きな進展を見せていますが、もう一つの重要なAIの形態として、方程式とデータに基づく定量的AI(量的AI)があります。これは大規模定量モデル(LQM)と呼ばれ、LLMを補完する存在です。例えば、バイオファーマ産業を持たない国で新たにその産業を確立しようとする場合、5-10年前であれば実質的に不可能でしたが、今ではLQMを活用することで実現可能になっています。
LQMの特徴的な点は、インターネットやWikipedia、Reddit、ソーシャルメディアからデータを取得するのではなく、世界を支配する方程式から直接データを生成することです。これは人類にとって新しい力となっています。例えば、わずか36ヶ月前まで、アルツハイマーやパーキンソン病、脳がん、膵臓がんに効果的な分子が受容体にどのようにフィットするかを正確に計算することは不可能でした。
今日、この技術の実践的な応用例として、大手製薬会社Sanofiとの協力を発表しました。私たちは定量的AIを活用してバイオマーカー開発、つまり診断と創薬の加速に取り組んでいます。また、化学産業では、製油所の製品スタックの価値向上に取り組んでいます。高オクタン燃料、ジェット燃料、ケロシン、ナフサは収益性が高いものの、スタックの底部は製鉄所などで燃やされ、収益性が低い状況です。化学を理解するAIを活用することで、この底部をカーボン複合材に変換し、マクラーレン、アストンマーティン、フェラーリなどの高級車に使用される軽量で強力な材料を、より民主的な形で提供することが可能になります。
さらに、エネルギー分野では、45年前から変わっていないバッテリー技術の飛躍的な進歩が必要です。これらの課題に対して、LLMを補完するLQMが重要な役割を果たすと考えています。
3. AGIの未来展望 (Eric Schmidt)
今後5年間で、私たちは専門化されたAIサヴァンの出現を目撃することになるでしょう。これらは、アーティストのためのサヴァン、音楽家のためのサヴァン、物理学者のためのサヴァンなど、特定の分野に特化した助手として機能します。なぜ5年という期間を指定できるのかというと、現在私たちは必要な全てのコンポーネントを既に持っているからです。
具体的には、プランニング能力、前方推論と後方推論の能力、段階的推論の能力を既に獲得しています。また、これまでよりもはるかに複雑な目的関数に対応できるようになり、任意のコードを生成することも可能になっています。業界では、5年程度で、システムが自身のコードを書き、それを改善できるようになると考えられています。これは再帰的なプロセスであり、技術発展の傾きを劇的に変える転換点となるでしょう。
その後、2030年から2032年頃には、現在の成長率に基づけば、単一のシステムが各分野のエキスパートの能力の80%から90%を達成することが可能になると予測しています。つまり、最高の物理学者の90%、最高の化学者の90%、最高のアーティストの90%の能力を持つシステムの出現です。レオナルド・ダ・ヴィンチのような万能の天才でさえ、現代ではそのような広範な分野での卓越性は達成できないでしょう。
このような超人的な知能の出現に、私たち人類は準備ができていません。例えば、このAGIはサイバー脅威を分析し、新たな脅威を開発することもできれば、それらから保護することもできます。また、生物学的ソリューションを見出すこともできますが、それは良いものにも悪いものにもなり得ます。これは国家安全保障の観点からも重要な意味を持ちます。
興味深い例えとして、F1レースを考えてみましょう。自動運転車は人間のドライバーよりも確実に速く走れますが、私たちはそれを興味深いスポーツとは考えないでしょう。同様に、ゴルフでも、ロボットが全てのプロゴルファーを打ち負かすことができるかもしれませんが、私たちはロボットではなく人間のプレーを見たいと思うでしょう。このように、私たち人間は自分たちに同情的な見方をするバイアスを持っているのです。
最も危険な結果として、中小規模のモデルやオープンソースモデルの拡散の問題があります。現在、1億ドル未満で訓練できるモデルは比較的安全で、それ以上のコストのモデルはより危険だと考えられていますが、この基準に確固たる根拠はありません。特に生物学の分野で、安価なツールが重大な被害を引き起こす可能性があることを懸念しています。
4. 責任あるAI開発の実践 (Ruth Porat)
AIの可能性を最大限に活かすためには、リスク管理と発展の両立が不可欠です。これは二者択一の問題ではありません。リスクから保護するための投資を行わなければ、AIのアップサイドを活用する機会そのものを失うことになります。このアップサイドとダウンサイドは同じコインの表裏なのです。
科学の加速、社会問題の解決、教育、ヘルスケアなどでの大きな可能性を実現するためには、責任ある基盤が必要です。これは規制当局との建設的な関わりを意味し、また内部システムへの投資も必要です。ダウンサイドからの保護がなければ、規制当局や他のステークホルダーからの抵抗に直面することになります。
私たちの成果の一つとして、社会的に重要な言語翻訳の進展があります。過去6ヶ月間で110の言語を追加し、これにより5億人の人々に新たなアクセスを提供しました。この垂直的な成長は、AIの可能性が根本的に変化していることを示しています。
教育分野での実践例として、西アフリカのある国のデジタル変革大臣との最近の対話が印象的でした。その国では人口の50%以上が19歳未満であり、教育が最重要課題でしたが、十分な教師を確保できないという課題がありました。AIによって、質の高い教育を全人口に提供することが可能になりつつあります。特に重要なのは、多言語国家において、これまでは数学の教科書を読むためにフランス語や英語を学ぶ必要がありましたが、AIによる翻訳で母語での学習が可能になったことです。
私の父はいつも「教育は自由へのパスポートであり、人生へのパスポートだ」と言っていました。この観点から、AIは人類に対して大きな変革をもたらす可能性を秘めています。顧客との関わり方、プロセス、リスク管理、ヘルスケア、教育、気候変動など、あらゆる要素を根本的に再考する必要があります。そして、その時期は今なのです。
アルファフォールドの例は、AIの革新的な成果を示す重要な事例です。私たちの同僚がこの功績でノーベル賞を受賞したことを誇りに思っています。アルファフォールドの創設者であるデミス・ハサビスは、多くの人が「どうしてそれが可能なのか」と疑問を投げかける中で、「なぜそれが不可能なのか」と問い返し、挑戦を続けました。これは、私たちがAIの可能性を考える上での重要な姿勢を示しています。
5. AI市場の投資展望 (Ben Horowitz)
AIの市場規模は、私たちが今まで見てきた中で最大のものになるでしょう。そのため、市場の各層でビジネスチャンスが生まれています。しかし、それぞれの層で課題や展望は大きく異なります。
まず、ハードウェアインフラの領域(チップ、データセンター、電力)について考えてみましょう。10年後にはこれらの需要が増加することは確実です。しかし、1999年のインターネット時代を振り返ると重要な教訓があります。当時、世界最大の帯域幅不足に直面し、Akamaiは法外な料金を請求していました。それが2001年には帯域幅過剰という状況に一変しました。これは、ボトルネックが帯域幅から、サーバーの処理速度やロードバランサーの性能などに移行したためです。
同様の現象は現在のAI市場でも起きています。今年だけでもNVIDIAのチップ価格は半分に下落しました。これは、データのボトルネックが深刻化しているためです。さらに、電力のボトルネック、冷却のボトルネックなども予想されます。NVIDIAの利益で資金を調達できる企業は問題ないでしょうが、データセンターを多額の借入金で運営している場合、急速に経営が傾く可能性があります。
基盤モデル(最先端モデル)の市場について、これはAnthropicやOpenAI、Gemini、Llamaなどが展開する領域です。ソフトウェア市場の80%がこれらのモデルをインフラとして使用することになるため、巨大で急成長する市場です。しかし、興味深いことに、トークンの価格は過去2年で100分の1に下落しています。世界で最も強力な技術がほぼ無料になりつつあるのです。それでも収益は増加し続けており、市場規模は巨大です。
しかし、価格競争は通常のこの段階の複雑な技術と比べても非常に激しく、成長の限界も見え始めています。GPT-2からGPT-3.5への進歩は大きかったものの、3.5から4への進歩は、より多くの投資を行ったにもかかわらず小さくなっています。これは一時的な漸近線に達したことを示唆しており、アーキテクチャの変更が必要になる可能性があります。かつてGoogleが台頭する前に37の検索エンジンが存在したように、現在の巨大な収益にもかかわらず、新たなプレイヤーが台頭する可能性があります。
アプリケーション層では、Travisが指摘したように、大企業はAIで急速に最適化できます。新規企業は、大企業が良い製品を作る前に市場を獲得できるかという競争に直面します。一例として、通常は成長が遅いエンジニア向け開発ツール市場で、ある企業は3ヶ月で4,000万ドルの収益を達成しました。これは通常であれば3年かかっても記録的な成長となる数字です。このように、市場を完全に獲得できる可能性もあります。
6. クリエイティブAIの実装 (Shou Chew)
私たちTikTokのレコメンデーションアルゴリズムは、常に機械学習を基盤としてきました。しかし、主にOpenAIによって過去数年で実現された技術革新により、私たちはAIの可能性がより大きく、より急速に実現可能であることを認識するようになりました。
この驚異的な技術を理解し活用するために、私自身が率先してAIツールを実践的に使用しています。単に報告書を読んで「X個のことができる」「Y個のことができる」という情報を得るのではなく、実際に製品をダウンロードしたり、サービスにサインアップしたりして自分で使用することで、現時点で何が可能なのかをより深く理解するようにしています。
TikTokの体験の大きな部分は、ユーザーの頭の中にあるアイデアと、最終的に作成されるコンテンツとの間の橋渡しです。私を含め、多くの人々は良いアイデアを持っていても、それを素晴らしい動画に変換する才能が不足しています。そのため、私たちは数千のツールをクリエイターに提供しており、その多くはAIを活用した自己表現支援ツールです。今後はさらに、数語の入力だけで、以前は高度な芸術的才能がなければ不可能だったようなカスタマイズが可能になっていくでしょう。これにより、より多くの人々が頭の中の優れたアイデアを、世界中の人々の心に響くコンテンツとして表現できるようになります。
AI安全性の観点では、特に米国の選挙サイクルが進行中の現在、重要な課題に取り組んでいます。第一に、プラットフォームでの許可事項に関するガイドラインを明確にしています。AIを使用した欺瞞的な行為や危険な行為は、ガイドライン違反として削除対象となります。第二に、AI生成コンテンツの自動ラベリングツールを提供しており、AIで制作されたコンテンツにはラベルの付与を求めています。ラベルが付与されない場合、そのコンテンツのリーチは制限されます。第三に、AIを活用してコンテンツモデレーションを改善しています。当初は大規模言語モデルによるコンテンツモデレーションの改善は曖昧な概念でしたが、理解が深まるにつれて、新技術がコンテンツモデレーションを大幅に改善できる道筋が見えてきました。
Ericが指摘したように、TikTokがAIだけで生成された動画で満たされていたら、それほど面白いプラットフォームにはならないでしょう。人間がAIのサポートを受けながらコンテンツを作成することこそが魅力的です。ただし、OpenAIが投稿しているSoraの動画の中には非常に興味深いものもあり、将来的にはそのような完全なAI生成コンテンツの中から、人々を魅了しバイラルになるものが出てくる可能性もあります。
7. AI基盤技術の展望 (Jay Puri)
AIは本質的に知能を創造することに関するものであり、知能の創造に関わる技術が経済の根幹にならないはずがありません。AIの進歩の速度は、私たちがこれまで見てきたどの技術革新とも異なります。わずか2年前、私たちはChatGPTと生成AIの登場に感銘を受け、次のトークン予測と応答能力に注目していました。今日では、AIは洗練され、推論や省察が可能になり、単発の推論だけでなく、複雑な問題を解決するための連続的な推論も可能になっています。
さらに、AIとのインターフェースはチャットボットだけでなく、人間のアバターを通じて行うことも可能になってきました。私たちは、デジタルな人間をチームメイトとして受け入れる時代に入ろうとしています。また、物理的AIの領域では、Elonが言及したヒューマノイドロボットだけでなく、工場や倉庫のあらゆるロボットがデジタル世界に組み込まれ、物理法則に従って動作するようになります。デジタルと物理的な世界の区別がつかなくなり、デジタル世界でAIを使って最適化したものを物理世界に実装し、その物理世界からのデータがさらにデジタル世界の改善に活用されるという、AIのフライホイールが形成されます。
このような状況下で、企業や国がAIを成功裏に活用するための条件は何でしょうか。AIはデータに埋め込まれた情報を、高度なモデルを使って発見することです。これを実現するために必要なのが「AIファクトリー」です。AIファクトリーは、生データを処理して生成モデルを作り、スケーラブルな収益化可能なトークンを生成するためにカスタム構築されています。
しかし、Elonが指摘したように、これらのAIファクトリーの構築は極めて困難です。NVIDIAは、これまでに構築されたすべてのファクトリーに関与してきた経験から、できる限り簡単かつ直接的な方法で構築できるよう、すべての学びをリファレンスアーキテクチャとしてコード化し、これらのファクトリーを迅速に複製できるよう努めています。
重要なのは、NVIDIAはGPUだけの会社ではなく、加速コンピューティングプラットフォームを提供する企業だということです。一般的なコンピューティングは、ムーアの法則に従って毎年2倍程度の速度で進歩してきましたが、それは今や限界を迎えています。仮にそれが続いたとしても、10年で100倍程度の進歩にしかなりません。しかし、GPUを使用した特定領域向けの加速コンピューティングでは、100万倍もの進歩を実現しました。これこそが深層学習や現在のモデルを可能にした理由です。
これを実現するには、GPUだけでなく、ソフトウェアの再構築、並列化、サーバーではなくデータセンターを計算単位として捉えるなど、スタック全体でのイノベーションが必要でした。私たちが提供しているのは特定のチップではなく、CUDAをベースとした加速コンピューティングプラットフォームであり、人々はモデルの構築や推論など、さまざまなAIイノベーションを継続的に行うことができます。これは後方互換性と前方互換性を保証する形で提供されています。