※本記事は、2024年にMicrosoftが公開したSatya NadellaとJared SpateroによるAI Tour Londonのキーノート講演(https://www.youtube.com/watch?v=kOkDTvsUuWA )の内容を基に作成されています。 本記事では、キーノート講演の内容を、特にCopilotとエージェントに関する新機能の発表、AIプラットフォームの戦略、および英国での具体的な活用事例を中心に要約しております。なお、本記事の内容は講演の内容を正確に反映するよう努めていますが、要約や解釈による誤りがある可能性もありますので、より詳細な情報や正確な文脈については、オリジナルの講演映像をご覧いただくことをお勧めいたします。また、最新の情報についてはMicrosoftの公式ブログ(https://blogs.microsoft.com/)もご参照ください。
1. はじめに
1.1 AIという新しい技術プラットフォームの誕生
ロンドンと英国に戻ってこられることを大変嬉しく思います。特に、新しい技術プラットフォームが誕生するこの時期に、その影響について英国で議論し、この活気を肌で感じられることは非常に興味深い経験です。Microsoftは英国で40年の歴史を持ち、私自身も30年にわたって英国に通い続けてきました。最初に英国で講演したのは1990年代初頭のことで、当時はExcelについてのブレイクアウトセッションでした。
私はこれまで、PCクライアントサーバーの誕生期に立ち会い、その後ウェブとインターネットの時代を経験し、さらにクラウドとモバイルの時代を経てきました。そして今、私たちはAIという新しい技術シフトの黎明期に立っています。
1.2 技術進化の根底にあるスケーリング則
技術の進化を理解する上で、その根本的な原動力を把握することは非常に重要です。1992年にMicrosoftに入社した当時、技術進化の暗黙の理解の軸となっていたのはムーアの法則でした。1991年のPDC(Professional Developers Conference)で私が確信したのは、x86とPCアーキテクチャがPCだけでなく、サーバーの世界も制覇することでした。実際、90年代末までにその予測は現実のものとなりました。
現在、私たちは新しい法則を追跡しています。それがAIにおけるスケーリング則です。ムーアの法則と同様、これも物理法則ではなく経験則ですが、驚くべき一貫性を示しています。このスケーリング則によれば、およそ6ヶ月ごとに能力が倍増していきます。特に注目すべき指標は「トークン/ドル/ワット」というパフォーマンス指標です。これが新しい通貨単位となっており、6ヶ月ごとの倍増を実現しています。この進化の一部はコンピューティングパワーの向上によるものですが、より重要なのは、データの活用手法とアルゴリズムの改善です。
この進化は2010年代初頭のディープニューラルネットワーク(DNN)時代から始まり、2018-2019年のLLM(大規模言語モデル)とトランスフォーマーの登場により大きく加速しました。この技術革新は主に3つの形で具現化されています。第一に、マルチモーダルな自然言語を通じたコンピューティングインターフェースの根本的な変化です。画像、音声、テキスト、ビデオなどの入出力が可能になりました。第二に、推論能力の向上です。最近登場したO1に見られるように、計画立案や推論能力が大幅に強化されています。コンピューティングの70年の歴史は人、場所、モノのデジタル化とその理解に費やされてきましたが、今や私たちには新しい推論エンジンが誕生しました。第三に、より多くのコンテキストとメモリを活用できるようになりました。
これら3つの要素が組み合わさることで、豊かなAIエージェントの世界が構築されつつあります。個人用エージェント、チーム用エージェント、組織やビジネスプロセス用エージェント、さらには組織間で機能するエージェントなど、多様なAIエージェントが私たちの既存のデジタルインフラストラクチャとツールを補強する形で発展していくことになります。
2. Microsoftの3つのAIプラットフォーム戦略
この素晴らしい技術を、最も重要なミッションへと変換していく必要があります。それは企業として、個人として、組織として、以前のどの技術時代でもできなかったことを可能にすることです。英国はかつて産業革命期に最も重要な技術を生み出しました。今、私たちは科学的発見や生産性において、そのような人間生活への深い影響力を再び実現できるでしょうか。これが私たちの目標です。英国のすべての個人と組織がより多くを達成できるようにすること、小規模企業の生産性向上、グローバルに競争力のある大企業の支援、公共セクターの効率化、医療成果や教育成果の向上を実現することが私たちのミッションです。
このミッションを達成するために、私たちは3つのプラットフォームを構築しています:
2.1 Copilot - AIのUI
第一のプラットフォームはCopilotです。最もシンプルな表現をすれば、CopilotはAIのユーザーインターフェース(UI)です。豊かなエージェントの世界において、PCやスマートフォン、そしてそのアプリがデジタル技術へのインターフェースであったように、CopilotはAIへのUIとなります。
多くのエージェントが自律的に動作する世界においても、例外的な状況での判断や許可が必要な場合があります。その際、どのように人間とコミュニケーションを取るのか。それはこの新しい組織化層を通じて行われます。特に仕事の進め方において、仕事、作業成果物、ワークフローは大きく変化していくでしょう。
2.2 CopilotとAIスタック
第二のプラットフォームは、CopilotとAIスタックです。これにより、独自のAIやAIエージェント、Copilotを構築することが可能になります。このプラットフォームを使用することで、開発者は必要とするすべての技術スタックにアクセスできます。
2.3 Copilotデバイス
第三のプラットフォームは、新しいCopilotデバイス群です。これらのデバイスは、エッジにおいてCPU、GPU、NPUを統合することで、まったく新しい時代を切り開きます。これまでスケーリング則はクラウドで非常にうまく機能してきましたが、今後のAI時代はクラウドだけでなく、エッジでも重要な進展が見られるでしょう。実際、一部のモデルアーキテクチャにおいて、このハイブリッドな利用を可能にする根本的なブレークスルーが起きると考えています。
これは単なる古いクライアント・サーバーモデルの再来ではありません。むしろ、1つの連続的な分散ファブリックとして考える必要があります。これが私たちのアーキテクチャ的なアプローチです。Copilotデバイスは単独で利用することもできますが、より重要なのは、プライバシーを確保しながらクラウドと連携して動作できることです。
これら3つのプラットフォームは、それぞれが独立して機能すると同時に、相互に連携することで、より大きな価値を生み出すことが可能となります。
3. Copilotの詳細と具体的活用事例
3.1 Pagesの導入とAIファーストの文書作成
約1ヶ月前、私たちはPagesをリリースしました。90年代にExcelやWordといった編集ツールでコンテンツを作成したように、PagesはAIファーストのアーティファクトを作成する初めてのユーザーエクスペリエンスです。ウェブや業務データから情報を検索し、それをPagesに取り込み、組織全体で共有できる文書として活用できます。その中でAIと人間の両方と協働することができます。
私の好む例えは「AIと考え、同僚と働く」というものです。これが新しいワークフローです。これまでのワークフローでは、個人で考え、成果物を作成し、組織全体で共有・協働していました。しかし今では、AIという認知増幅器と共に作業を行い、成果物を作成し、同僚と協力して目標を達成することができます。
3.2 Copilot Studioと自律型エージェント開発
Copilotは単なるチャットインターフェースではありません。情報検索のための一つの手段としてチャットを使用しますが、より洗練されたワークフローと協働を可能にします。さらに、Copilot Studioを使用することで、構築したあらゆるエージェントでCopilotを拡張できます。
Copilot Studioは、ローコード・ノーコードでエージェントを構築できるツールです。これらのエージェントの基盤となるのが、組織内の最も重要なデータベースであるオフィス情報です。誰が誰の上司か、プロジェクトメンバーは誰か、特定のチームやプロジェクトに関連する文書は何か、それらの文書と人々とプロジェクトの関係性、そしてすべてのメールやTeamsでの会話。これらすべてがGraphというデータベース、またはM365で公開されているサブストレートに存在しています。これにDataverse(ビジネスプロセスデータ)やFabricに収集されたデータを組み合わせることで、エージェントが活用できます。
例えば、フィールドサービスエージェントをCopilotに統合したい場合、システムプロンプトでフィールドサービスエージェントとして機能させることを指定し、フィールドサービス関連文書が格納されたSharePointサイトを指定し、さらにDynamicsなどのフィールドサービス記録システムを追加するだけです。これにより、通常のCopilotと同じように会話できるフィールドサービスエージェントが完成します。Excelシートを作成するのと同じくらい簡単です。
3.3 McKinseyでの活用事例と定量的効果
McKinseyでは、クライアントエクスペリエンスが最重要です。Copilot Studioを使用して、クライアントエクスペリエンスを合理化する自律型エージェントを開発しました。このシステムにより、リードタイムを90%削減し、管理業務のオーバーヘッドを30%削減することに成功しました。
3.4 Microsoft社内での活用実績
Microsoft社内では、営業・マーケティング部門で二桁の生産性向上を達成しています。これは売上への直接的なインパクトとなっています。カスタマーサービス、IT、HRのヘルプデスクでは、従業員エンゲージメント、従業員満足度、カスタマーサービスエージェントの満足度が向上し、無駄なコストが削減されています。法務部門や財務部門でも同様の効果が出ています。
3.5 Unileverのマーケティングブリーフ最適化
世界中で30億人以上のユーザーを持つUnileverでは、マーケティング支出が重要な位置を占めています。彼らの主要な業務の一つがクリエイティブブリーフの作成です。このクリエイティブブリーフの精度は、マーケティング効果に直結する重要な要素です。Unileverは、ブリーフ作成の単調な作業を効率化し、品質を向上させるためのツールを開発し、マーケティングブリーフの準備と質を大きく改善しました。
3.6 Clifford ChanceのM&A取引プロセス効率化
法律事務所のClifford ChanceはM&A取引のワークフローを説明してくれました。彼らはCopilotとCopilot Studioを使用してエージェントを作成し、M&A取引の全プロセスを合理化することに成功しています。
これらの事例は、AIエージェントとCopilotが組織内の実際の業務において、高い生産性向上を実現できることを実証しています。
4. AIプラットフォーム基盤の強化
4.1 Azure インフラストラクチャの拡充
私たちはあらゆるソフトウェア開発者が独自のAIシステムを構築できるよう、最も広範な生のインフラストラクチャから始める必要があります。私たちはAzureを世界のコンピュータとして位置づけ、60以上のリージョンで展開しています。英国ではUK WestとUK Southを展開しており、昨年には25億ドル以上の投資を発表し、拡大を進めています。これは継続的な取り組みとなり、従来型のコンピューティングとAIコンピューティングの両方において、最高のインフラストラクチャを英国にもたらすことを目指しています。
AIワークロード向けの最適化は、シリコンレベルから取り組んでいます。NVIDIAとの協業では、液冷技術を備えたGP-200sのパイロット展開を進めています。実際、この液冷技術の一部は、私たちが自社のシリコンMaiaで開発したものを応用しています。さらに、AMDとも素晴らしいパートナーシップを築いており、シリコン層での革新を進めています。
4.2 データ基盤の整備
AIアプリケーションを開発する上で、最も重要な考慮事項の一つはデータです。トレーニングやインファレンス、検索拡張生成(RAG)を行うためには、データ基盤を整備する必要があります。すべてのデータをクラウドに集約し、AIと結びつけることが重要です。実際、AIコンピューティングが存在する場所に、データは引き寄せられていきます。
OracleのデータもSnowflakeのデータも、どのようなデータでもクラウドに持ち込めるようにしています。さらに、クラウドネイティブなデータインフラストラクチャとして、OLTP向けのCosmos DB、SQL、PostgreSQL、そしてAI時代のために構築された最先端の分析データベースFabricを提供しています。
重要なのは、すべてのAIアプリケーションがステートフルであるということです。AIのAPIはステートレスですが、実際のアプリケーションやワークロードと組み合わさると、必然的にステートフルになります。例えば、ChatGPTはCosmos DBやAzure Searchの最大のユーザーの一つとなっています。これは、CopilotやChatGPTのようなアプリケーションを構築する際には、堅牢なデータ基盤が不可欠であることを示しています。
4.3 アプリケーションサーバーの進化
インフラストラクチャとデータの上に、アプリケーションサーバーを構築しています。かつてdot netの時代があったように、今や私たちは新しいアプリケーションサーバーの時代を迎えています。クラウドネイティブアプリケーション用のアプリケーションサーバー(コンテナ、アプリケーションサービス、AKS、Functions)は引き続き必要とされています。実際、ChatGPTのアーキテクチャを見ると、GPUごとに一定の比率でAKSによる通常のコンピューティングプロビジョニングが必要とされています。
新しいAIアプリケーションサーバーは、最も幅広いモデル選択から始まります。私たちはOpenAIパートナーの革新(O1からGPT4oまでの最新のフロンティアモデル)に加え、LlamaやMistralなどのオープンソース、Cohereなどのクローズドソースプロバイダーのモデルもサポートしています。
最も幅広いモデル選択を提供した上で、次のステップはSFT(監督付き微調整)のサービス化です。また、RAG(検索拡張生成)のためのツールとしてAzure Searchを提供し、LLMのアプリケーションをデータに基づいて検証することができます。さらに、アプリケーションにガードレールを設定するためのサービスも用意しています。
5. 英国での先進的活用事例
今朝、私は様々なパートナー企業と面会する機会がありました。彼らの事例を通じて、AIプラットフォームの実践的な活用を確認することができました。
5.1 British Heart Foundation
British Heart Foundationは、機械学習とAIを長期にわたって活用してきた組織です。特に印象的だったのは、Azure Speech Servicesを活用した緊急通報のシミュレーションです。私は、人々が緊急通報を行うことに慣れることがこれほど重要だとは認識していませんでした。これは、危機的な瞬間において人々をエンパワーメントする素晴らしい例と言えます。
5.2 HSBCの与信承認プロセス改革
HSBCには多くのカスタマージャーニーがありますが、彼らが示してくれた一例は、リレーションシップマネージャーによる与信承認プロセスです。このプロセス全体が、彼らが構築したAIエージェントによって変革されており、モバイルアプリケーションやリレーションシップマネージャーが使用するアプリケーションと効果的に連携しています。
5.3 Mondraのフードサプライチェーン デジタルツイン
Mondraの開発者たちは、非常に画期的な取り組みを行っています。彼らは英国内外のすべての小売業者向けに、食品安全とフードサプライチェーンのデジタルツインを構築しています。このプロジェクトは、サプライチェーンの持続可能性を向上させることを目的としており、現実世界に大きなインパクトをもたらすことが期待されます。
5.4 Wayveの自動運転AI開発
私が長年興味を持ってきたスタートアップの一つがWayveです。彼らはADAS(先進運転支援システム)に対して、AIファーストのアプローチを採用しています。自動化に対する考え方を、第一原理から完全に新しいAI主導の方法で再構築しています。
これらの事例は、テクノロジーの普及が単なる将来の可能性ではなく、既に非常に高度なアプリケーションとプラットフォームの活用として実現されていることを示しています。英国におけるこれらの革新的な取り組みは、私たちのプラットフォームの実践的な価値を証明するものです。
6. Copilotデバイスの展望
約半年前、私たちはCopilotデバイスを発表しました。これは、CPU、GPU、そしてNPUがすべてエッジで利用可能になる、まったく新しい時代の幕開けです。これまでスケーリング則はクラウドで非常にうまく機能してきましたが、私は今後のAI時代が、クラウドだけでなく、エッジでも根本的なブレークスルーを生み出すと考えています。
特に、モデルアーキテクチャにおいて、このハイブリッドな利用を可能にする根本的なブレークスルーが起きるでしょう。重要なのは、これを古い世界のクライアント・サーバーの考え方で捉えないことです。そのようなアプローチでは機能しません。代わりに、一つの連続的な分散ファブリックとして考える必要があります。これが私たちのアーキテクチャ的なアプローチです。
Copilotデバイスは、プライバシーのために単独で使用することもできますが、より重要なのは、クラウドと連携して使用できることです。これは特にゲーマーにとって興味深い展開となるでしょう。GPUをフル稼働させながら、NPUをすべてのベクトル演算に使用できるようになるからです。
これは完全に新しいタイプのアプリケーション開発につながります。かつてPCのために人々が革新的な新しいアプリケーションを構築したように、今度はNPUとGPUとCPUが統合された世界で、開発者たちが新しいアプリケーションを構築し始めることになります。これは非常に興味深い世界になると確信しています。
7. 信頼できるAIに向けて
私は、これら3つのプラットフォームの根底にある非常に重要な要素について説明したいと思います。それは、信頼できるAIと信頼できるプライバシー、そして信頼できるセキュリティです。技術への信頼は、私が説明してきた技術の普及にとって核となる要素です。もし信頼がなければ、人々はその技術を使用しません。そしてそれは誰にとっても良いことではありません。
私たちのアプローチは明確です。まず第一に、セキュリティ、プライバシー、AI安全性に関する具体的な原則を持つことです。しかし、単にコミットメントを行うだけでは不十分です。より重要なのは、そのコミットメントを実現するために、どのような具体的な機能を構築し、どのように進展を遂げているかということです。
例えば、新しいAIモデルを展開する際のセキュリティにおいて、最初に行うべきことは敵対的攻撃のテストです。これは単なるバグ発見ではありません。プロンプトインジェクションのような攻撃が、このモデルに対してどのような影響を与えるのかをシミュレートすることが重要な考慮事項となります。また、プライバシーについては、最新のモデルと組み合わせて、機密計算に関する取り組みを進めています。
私たちは、LLMがハルシネーション(幻覚)を起こすことを認識しています。そのため、AI安全性の観点から、AIを使用して任意の出力の信頼性(groundedness)を測定することに取り組んでいます。これらは、私たちがプラットフォームに組み込んでいる具体的な機能です。ソフトウェア開発者がAIプラットフォームを使って構築する製品を信頼でき、そしてそれらの製品を使用する人々が信頼できるよう、着実に進展を遂げています。
この全ての取り組みは、最終的に私が冒頭で述べた目標に帰結します。それは、一人一人、一つ一つの組織、ここ英国において、真の経済的な余剰と成長を生み出し、成果を向上させることです。私は、皆様とそのパートナーの方々が、これらすべてのイノベーションで何を成し遂げるのか、非常に期待しています。そして、数年後に再びここに戻り、そのイノベーションの成果を見ることを楽しみにしています。