※本記事は、Karim Lakhani教授(Harvard Business School, Dorothy & Michael Hintze Business Administration教授)が、Harvard Business School Association of Northern CaliforniaとGoogle Ventures (GV)との共催でサンフランシスコにて行った講演内容を基に作成されています。 本記事は講演の内容を要約し、記述したものです。原講演の詳細な文脈や正確な情報については、原典をご確認ください。なお、講演内容は研究所における実証研究に基づいていますが、要約や解釈による誤りがある可能性もありますことをご了承ください。 ※この講演は下記URLでご覧いただけます: https://www.youtube.com/watch?v=MLgP5gthnM4
1. はじめに
1.1. Digital Data Design Institute (D^3)の紹介
私は今日、Digital Data Design Institute(D³)の取り組みについてお話しさせていただきます。私たちの研究所について、3つの重要な特徴を説明したいと思います。
第一に、私たちはAIとデジタルを研究していますが、それだけではありません。AIはストーリーの一部に過ぎないと考えています。私たちが注目しているのは、AIを本当に活用するために必要な運営モデルとビジネスモデルの変革です。たとえば、価格設定ラボや人材育成ラボなど、AIによってビジネスの基本的な部分がどのように変化しているかを研究しています。
第二の特徴は、私たちが応用研究を行っていることです。理論的な研究ではなく、実際に企業と協力して、AIの最前線で何が起きているかを理解し、ハーバードの教授陣と共に実験を行い、ビジネスの未来を探求しています。AIに取り組んでいる企業の方々には、ぜひ私たちと協力して研究を進めていただきたいと考えています。
第三の特徴は、私たちが従来とは異なる研究アプローチを取っていることです。HBSでは少し異質な存在かもしれませんが、私たちは研究のやり方を変革しています。社会科学では研究者が個別に研究を行うのが一般的ですが、自然科学ではラボで協力して研究を進めます。私たちは、この自然科学的な研究モデルを社会科学に適用し、約40名のハーバードの教授陣が協力して、より大きな、より野心的な問いに取り組めるようにしています。
この研究所は設立からまだ18ヶ月しか経っていない若い組織です。私たちは今、これらのツアーを通じて人々と交流し、私たちの活動への理解を深め、コミュニティの一員になっていただくことを目指しています。HBSの基準からすれば光速で進んでいると言われていますが、私自身はまだまだ遅いと感じています。
1.2. AIと事業モデル変革の関係性
私の同僚であり、メンターでもあるMarco Iansitiと共に、私たちは「Digital Innovation and Transformation」というコースを2013年に開発し、6年間にわたって教えてきました。このコースを基に執筆した本では、AIによってビジネスのアーキテクチャがいかに変化しているかを論じています。
具体的には、価値創造と価値獲得の方法、つまりビジネスモデルが変化しているだけでなく、運営モデルも大きく変わってきています。特に以下の3つの側面での変化が重要です:
- スケール(規模):サービス提供可能な顧客数
- スコープ(範囲):顧客に提供できる異なるサービスの多様性
- ラーニング(学習):継続的な学習と改善の方法
私の最初の「本当の」仕事は1990年代のGEでした。当時、GEは今日のGoogleのような存在で、誰もが働きたいと思う会社でした。GEのビジネス構造は1920年代にAlfred Sloanによって確立された複数事業部制に基づいており、この青写真は約100年間、現代経済を支えてきました。
しかし、2000年代に入ると、カリフォルニアの企業がビジネスの本質を再考し始めました。彼らは運営モデルとビジネスモデルの両方を見直し、それが今日の変革につながっています。これは単なる技術の導入ではなく、ビジネスの根本的な再構築なのです。
私たちの研究所では、このような変革を科学的に理解し、企業がAIを本当の意味で活用できるようにするために必要な組織的・ビジネス的な変革を研究しています。単にAIを導入するだけでなく、それを効果的に活用するための組織構造やプロセスの変革が不可欠だと考えています。
2. 指数関数的成長の時代
2.1. 「Exponential Age」の概念
私は最初に、Azeem Azhar(元BBCジャーナリストで「Exponential Views」というすばらしいポッドキャストのホスト)の著書について話したいと思います。この本は、指数関数的に成長する技術とそれに伴って指数関数的に成長する企業についての洞察に満ちています。
具体的には、AI、合成生物学、3Dプリンティング、そして太陽光発電など、指数関数的に成長する技術群があります。これらの技術とともに成長する企業がある一方で、私たち大多数は線形的にしか成長できていません。例えば、ハーバードビジネススクールは指数関数的には成長せず、線形的にしか成長しません。
これにより、技術と組織の間にギャップが生まれています。このギャップは、リスクと脅威の両方を含んでいますが、同時に大きな機会も生み出しています。特にAIによって、私たちはこの指数関数的な時代に突入したと言えます。しかし、私たちの制度、企業、規範、期待のほとんどは、この状況に対処する準備ができていません。
この状況は、COVID-19のパンデミックで経験したことと類似しています。指数関数的に拡大する感染症のプロセスに対して、病院の収容能力は線形的にしか増加できませんでした。その結果、ロックダウンや封鎖が必要になりました。これは人間のシステムが指数関数的なツールに対処する準備ができていなかったことを示す典型的な例です。
このような指数関数的成長と線形成長のギャップは、今日のビジネス環境における根本的な課題となっています。私たちの研究所は、このギャップを理解し、組織がこの新しい現実にどのように適応できるかを研究しています。
2.2. 従来型ビジネスとの衝突
現代のビジネスでは、従来型のモデルと新しいデジタルモデルの衝突が起きています。私の経験を通じてこの変化を説明させていただきます。
私の最初の職業経験は、高校時代のBaskin-Robbinsでアイスクリームをすくう仕事でしたが、大学卒業後の最初の「本当の」仕事はGEでした。1990年代、GEは現在のGoogleのような存在で、誰もが働きたいと憧れる会社でした。GEのビジネス構造は1920年代にAlfred Sloonによって確立された複数事業部制に基づいていました。この青写真は約100年間、現代経済を支え続けてきました。
しかし、2000年代に入ると、ここカリフォルニアの企業がビジネスの本質を再考し始めました。彼らは運営モデルとビジネスモデルの両方を見直し、それが今日の変革につながっています。この変化は、従来型のビジネスとの「破壊(disruption)」ではなく、「衝突(collision)」として捉えるべきです。
このような衝突の例を挙げると:
- Marriott vs Airbnb
- WeWork vs 従来型オフィス
- Tesla vs Ford
- HSBC vs Ant Group
- Merck vs Pfizer
今日のビジネスを見ると、従来型企業は依然としてサイロ化された構造を持っています。例えば、ハーバードビジネススクールでさえ、MBAプログラム、エグゼクティブプログラム、出版、オンライン、同窓会といった異なるサイロを持ち、7つの異なるITグループが存在し、データを共有せず、すべてをスプレッドシートで管理しています。
一方、指数関数的に成長できる企業は、データが企業全体を横断し、ソフトウェアとAPIが社内の大部分の業務を駆動する構造を持っています。この未来に向けて、私たちは従来のビジネスモデルと新しいデジタルモデルの衝突を研究し、組織がどのように適応していくべきかを探求しています。
3. AI技術の進化
3.1. AIの4つの波の歴史
私たちは、約70年前から始まったAIの発展を4つの波として理解することができます。
第1の波は、サイバネティクス時代です。この時代はダートマス大学からAI分野が定義され始めた時期です。基礎的な概念や理論が形成された時期として位置づけられます。
第2の波は、エキスパートシステムの時代です。人間の専門知識をルールベースでシステム化しようとする試みが行われました。この時代は、特定の専門分野における意思決定支援に焦点が当てられていました。
第3の波は、2000年代から始まった機械学習システムの時代です。この時代、特にテクノロジー企業が大量のデータを持て余す中で、規模を拡大しながらも人員を抑制するという課題に直面しました。彼らは、コンピュータサイエンス学部や統計学部で開発されていたアルゴリズムを活用し、コンピューティングパワーを駆使して機械学習を実用化していきました。実際、テクノロジー企業は機械学習イノベーションの中心地となりました。
そして現在、私たちは第4の波である生成AIの時代に入っています。この時代の特徴を説明するために、次のセクションで具体的な事例を交えながら説明していきます。
この進化を可能にしたのは、大量のデータの利用可能性、NVIDIA社に代表されるような技術の進歩、そしてそれらを活用するための技術革新です。私がFlagship Pioneeringで過ごした時間を通じて、この変化の速さを実感しています。Flagship Pioneeringは、Modernaを生み出した企業であり、ライフサイエンスのインキュベーションスタジオとして知られています。
この4つの波は、それぞれ異なる特徴と可能性を持っていますが、特に現在の生成AI時代は、前の時代とは質的に異なる変革をもたらしています。これについては、次のセクションでより詳しく説明していきます。
3.2. 生成AIの登場と影響
私がFlagship Pioneeringで過ごした時間を通じて、生成AIがもたらす革新の速さを実感しました。ArmenがAI initiatives部門のヘッドとして作成したスライドから、この変革の本質をお伝えしたいと思います。
生成AIの技術的ブレークスルーは、画像生成から始まりました。単純な画像生成から、より複雑で実用的な応用へと急速に発展しています。例えば、Generate Biomedicinesという企業は、自然界に存在しない全く新しいタンパク質を生成することに成功しています。彼らは同じ基盤技術を使って、自然の限界を超えた新しいタンパク質を設計し、実際に合成して機能を検証しています。この企業はシリーズBラウンドで約6億ドルの資金調達に成功しました。
重要なのは、基礎研究から実用化までの時間が劇的に短縮されていることです。かわいらしいアプリケーションから本格的な応用まで、その移行が驚くべき速さで進んでいます。同様に、強化学習の分野でも、AlphaGoの成功から、現在ではシリコンバレーやボストンの多くの企業が創薬に応用しています。
Flagship社では、大規模言語モデルを活用して分子栄養学のための化学最適化を行っています。例えば、monte healthがその取り組みを進めています。研究室での発見から、簡単なアプリケーション、そして本格的な実用化までの時間が劇的に短縮されており、多くの革新が同時に進行しています。
AIの本質を理解するために、以下の段階を考える必要があります:
- AIは人間の知能を機械に組み込むことです
- 機械学習は、特定のタスクを実行するように機械を訓練することです
- ニューラルネットワークと深層学習は、主に分類に焦点を当てています
- 生成AIは、これまでとは異なり、新しいものを作り出す能力を持っています
つまり、私たちは予測や分類、パターン認識の時代から、全く新しいものを創造する時代に移行しているのです。この変化は、ビジネスや社会に根本的な変革をもたらす可能性を秘めています。
3.3. 画像生成の事例
生成AIの進化を具体的に示すために、私たちの本の第1章で取り上げた「The Next Rembrandt」プロジェクトと、最近の技術進歩を比較してみましょう。
「The Next Rembrandt」は、Microsoft、ING銀行、TUデルフト(オランダ工科大学)が共同で実施したプロジェクトでした。彼らはレンブラントの全ての肖像画をスキャンし、機械学習アルゴリズムを作成して、完璧なレンブラントの目、鼻、表情などを生成しました。この取り組みには数ヶ月の期間と数百万ドルの予算、大規模なチームが必要でした。
これに対して、2022年には状況が一変しています。トロントに住む私の母は、「あなたの本は読んだけれど、退屈だったわ。AIが私にとってどういう意味があるのか教えてちょうだい」と言いました。そこで私は母に「お気に入りの俳優は誰?」と尋ねました。南アジア系の方々ならご存知の通り、母はShah Rukh Khanが大好きです。
そこで私は月額20ドルのMidjourney(画像生成AI)を使って、「レンブラントが想像したShah Rukh Khan」というプロンプトを入力しました。すると、とても美しい肖像画が生成されました。さらに、私は妻がニューヨークで写真を撮影していることにちなんで、「ブルックリンのダイバーバーにいるヒップスターとしてのShah Rukh Khan」というプロンプトも試してみました。どちらも20ドルの月額料金で、わずか20秒で素晴らしい画像が生成されました。
これは単なる面白いアプリケーションのように見えるかもしれません。しかし、このような技術の進歩がマーケティングをどのように変革するか想像してみてください。もはやストックフォトを使う必要はなく、必要な画像を即座に生成できます。これにより、マーケティング部門の機能は根本的に変わる可能性があります。
この例は、高度な専門知識と多大なリソースを必要とした作業が、わずかな費用で誰でも利用できるようになった劇的な変化を示しています。この変革は、ビジネスのあらゆる側面に影響を与える可能性を秘めています。
4. 生成AIの特徴と影響
4.1. 医療分野での実験結果
医療分野における生成AIの影響を示す興味深い研究結果をご紹介したいと思います。私は医学部の同僚と多くの共同研究を行っていますが、その中でスタンフォード大学の教授陣による研究が特に注目に値します。この研究は権威ある医学雑誌『JAMA Internal Medicine』に掲載されており、剽窃などの問題は一切ありません。
研究の最も驚くべき発見は、ChatGPT-3.5が人間の医師と比較して、より高い品質のケアを提供し、さらに重要なことに、より高い共感性を示したことです。私がこの話をすると、「でも、私の医師はとても共感的ですよ」という反応をよく受けます。しかし私は「どの医師の話をしているんですか?私の医師は共感的どころか、敵対的ですよ」と答えざるを得ません。
さらに、スタンフォード大学の別の研究では、研修医やインターンがChatGPTを活用して、困難な家族状況における悪い知らせの伝え方を学んでいることが報告されています。彼らは具体的な状況をChatGPTに入力し、悪い知らせを伝えるための3つの異なるアプローチを生成させています。この方法は、従来の共感性トレーニングよりも効果的であることが示されています。
これは特に興味深い発見です。なぜなら、共感性は純粋に人間的な特性だと考えられてきたからです。しかし今、これらの機械が私たちのために共感的なコミュニケーションを代行できるようになっています。
これらの研究結果は、医療分野におけるAIの可能性が、単なる診断や治療計画の支援を超えて、医療の人間的側面にまで及ぶ可能性を示唆しています。これは医療教育や医療実践の在り方に根本的な変革をもたらす可能性があります。
4.2. コスト低下による革新の加速
現在、AIに関する大きなハイプ(誇大宣伝)が存在していますが、その背景には基本的な経済原理があります。AIを使った革新のコストが劇的に低下したことで、あらゆる問題がAIの問題として再定義されるようになっています。
例えば:
- 自動運転はAIの問題
- 歯科治療はAIの問題
- 与信配分はAIの問題
- セキュリティはAIの問題
このように、ほぼすべての課題がAIによって解決可能な問題として捉えられるようになっています。この現象は、AIを活用するためのコストが大幅に低下したことで、企業がすべてのユースケースをAIの文脈で再考し始めたことを示しています。
その結果として、私たちは大規模な投資とハイプを目にしています。しかし、これは単なるバブルではありません。背景には、実装コストの劇的な低下があります。私が先ほど示したShah Rukh Khanの例のように、以前は数ヶ月と数百万ドルを要した作業が、今では月額20ドルで数秒のうちに実行可能になっています。
この革新の加速は、特に実装までの時間短縮という面で顕著です。基礎研究から実用化までのタイムラインが驚くほど短縮されており、かつては数年かかっていたプロセスが数ヶ月で完了するようになっています。これにより、新しいユースケースが次々と生まれ、それがさらなる投資と革新を促進する好循環を生み出しています。
このコスト低下と時間短縮の組み合わせにより、企業は従来では考えられなかったような実験や試みを行えるようになっています。失敗のコストが低下したことで、より多くのイノベーションが可能になっているのです。
4.3. 情報伝達コストゼロの意義
この状況を理解するために、皆さんにある象徴的な画像についてお尋ねしたいと思います。この記号は何か分かりますか? これはMosaicブラウザのシンボルです。Mark Andreessenが作成したMosaicブラウザです。インターネットは、ブラウザが登場する前から20-30年間存在していましたが、Mosaicブラウザ、Tim Berners-LeeのHTML、そしてウェブサーバーの組み合わせによって、初めて一般消費者のツールになりました。
1992年、私がGE電機で働いていた時のことを思い出します。放射線科の学会で、バンクーバーの医師が「インターネットをお見せしましょう」と言ってきました。私はすでにメールやGopherなどのインターネットを使っていましたが、彼が見せてくれたのは一つのウェブページでした。画面上にはコーヒーポットが映っていました。
これは有名な「オックスフォードのコーヒーポット」でした。オックスフォード大学の研究者たちが、廊下を横切ってコーヒーの残量を確認する手間を省くために、コーヒーポットの上にカメラを設置し、ウェブ上で公開したのです。私たちの研究所でも同じような状況があります。研究者は何かと面倒くさがりますからね。
一見すると些細な応用例に見えますが、これが示唆することは重要です。突然、この地味な研究室の地味なコーヒーポットが、グローバルな配信を獲得したのです。ウェブブラウザを持つ誰もが、世界中どこからでもコーヒーポットの様子を確認できるようになりました。
これは何を意味するのでしょうか?情報伝達の限界コストがゼロになったのです。この状況は過去30年間続いており、今では大量のコンテンツ制作が可能になっています。例えば、今日皆さんがスマートフォンでFaceTimeやGoogle Meetを使って行っていることは、かつては放送用トラックと衛星アップリンクが必要でした。今では、近所を歩きながら日本の誰かと会話できることが当たり前になっています。
こういった限界コストゼロの状況は、新しいビジネスモデルを生み出します。例えば、誰もがコンテンツプロデューサーになれる時代には、検索がボトルネックとなり、そこからGoogleが生まれました。Napsterは音楽のシングルをアルバムから切り離し、音楽配信のコストを下げました。iPhoneは、ソフトウェア開発と配信のコストをゼロに近づけました。
今、生成AIは創造性と認知のコストを下げつつあります。これは、これまでの技術革新と同様に、新しいビジネスモデルと企業を生み出す可能性を秘めています。
5. BCGでの大規模実験研究
5.1. 実験設計
BCGとの協働研究について、その経緯から説明させていただきます。私はBCGで修士号と博士号の間にインターンとして働いた経験があり、その後も研究所として継続的に接点を持ち、ケーススタディの共同開発なども行ってきました。
BCGが組織へのGPTの導入を検討していた際、私は「皆さんはこれを間違った方法で実施しようとしている」と指摘しました。教授という立場だからこそ、遠慮なく言えたのだと思います。私は、彼らが常々主張しているABテストや実験的アプローチを、この導入にも適用すべきだと提案しました。
そこで、大規模な研究チームを編成しました。チームには以下のメンバーが参加しています:
- Theodora Lau(HBSのポスドク)
- Edward McFall(教授、ペン大学)
- Ethan(HBS)
- HBSの博士課程の学生
- HBSのMBA課程の学生 その他、多くの研究者が参加しています。
2月から5月にかけて、1年目から3年目のコンサルタントが通常行うタスクを詳細に調査し、それに基づいてテストを設計しました。具体的には、同じ難易度のタスクに対して、AIがどのようなパフォーマンスを示すかを検証しました。
実験設計の核心は以下の通りです:
- 758名のコンサルタントが参加
- 各参加者が5時間かけてタスクを実施
- 参加者をランダムにコントロールグループ(AI無し)と処置群(AI有り)に分割
- すべての作業をモニタリングできる環境を構築
特筆すべきは、これらの参加者がHBS、ウォートン、スタンフォードなどのトップスクール出身者で、すでに能力の高い層であることです。実験環境については、私は脳スキャンや微生物叢の分析まで要求しましたが、それは認められませんでした。しかし、5時間の作業中の全てのプロンプト、全ての行動を記録することには成功しました。
この詳細な実験設計により、AIの影響を科学的に検証することが可能になりました。実験結果の信頼性を確保するため、論文では118の回帰分析を実施し、それらを付録に含めることで査読者からの批判に対応できるようにしました。
5.2. 生産性向上の実証
私たちの実験から得られた結果には、良いニュースと悪いニュースがありました。まず、良いニュースについてお話しします。リンクした論文の詳細な分析結果から、AIの活用による劇的な生産性向上が確認されました。
実験結果は、以下の2つの主要な指標で顕著な改善を示しました:
- タスク実行速度が25%向上
- 実行可能なタスク数が12%増加
これらの数値は、AIを使用しないコントロールグループと比較した場合の改善率です。経済学の観点からすると、これらは驚くべき数値です。通常、このような大規模な生産性向上は見られません。
実は、私たちはこの実験を事前登録していました。なぜなら、もしそうしていなければ、多くの学術誌がこれらの数値を信じがたいものとして論文を却下したであろうと考えたからです。これほどの大規模な効果が得られるとは、私たち自身も予想していませんでした。
特筆すべきは、この生産性向上が、すでに高いスキルを持つBCGのコンサルタントに対して観察されたということです。BCGは「当社のコンサルタントに平均以下の人材はいない」と主張していますが(笑)、私たちの事前調査では、実際には正規分布に従うスキル分布が確認されています。
このように、完全なランダム化比較試験として設計された本実験において、統計的に有意な生産性向上が実証されました。118の回帰分析を含む厳密な統計処理により、これらの結果の信頼性は十分に担保されています。
5.3. 品質改善の検証
私たちの実験では、最初に創造的な問題解決タスクを設定しました。具体的には、「フットウェア企業の新製品開発ユニットで働いており、次のマネージャー会議で新製品のアイデアを提示するように上司から依頼された」というシナリオを提示し、18個の質問に回答してもらいました。新しい靴のアイデア生成など、具体的な課題に取り組んでもらいました。
実験の結果、AIフロンティア内のタスクにおいて、品質が40%向上するという劇的な改善が確認されました。私は計量経済学の専門知識を活かし、118の回帰分析を実施し、それらをすべて付録に含めることで査読者からの批判に備えました。
分析の結果、以下の重要な発見がありました:
- コントロールグループと比較して、品質の分布が右にシフトし、かつ分布の幅が狭まりました
- 中央値の品質スコアを持つコンサルタントが、GPTを使用することで96パーセンタイルまで向上しました。これは、すでに優秀なBCGのコンサルタントでさえ、大幅な改善を達成できることを示しています
さらに興味深い発見は、なぜこのような品質向上が達成されたかという点です。BCGとの協力により、私たちは実験環境を完全に計測可能なものにすることができました。脳スキャンと腸内細菌叢の分析は却下されましたが、5時間のタスク中の全てのプロンプトと行動を記録することができました。
この詳細な分析から、品質向上の主な要因が明らかになりました。参加者は、GPTが提供する回答の80-90%をそのまま採用していました。つまり、GPTの出力に対する修正はほとんど行われていませんでした。回答の品質が非常に高かったため、そのまま使用できたのです。
この発見は、私たちのMBA教育に対して重要な示唆を投げかけています。市販のGPT-4を特別なトレーニングなしで使用しただけで、APIを通じて構築したシンプルな環境でこれほどの成果が得られたのです。
5.4. スキルレベルによる効果差
私たちは、スキルレベルの異なる参加者がAIをどのように活用し、どの程度のパフォーマンス向上を達成できるのかを分析しました。BCGは「当社には平均以下のコンサルタントは存在しない」と主張していますが、私たちの事前調査では、実際にはコンサルタントの能力は正規分布に従っていることが確認されています。
分析の結果、以下のような劇的な効果の違いが明らかになりました:
- 平均以下のパフォーマンスを示すコンサルタントは43%の改善
- 平均以上のパフォーマンスを示すコンサルタントでも17%の改善
経済学的な観点からすると、これらの数値は驚異的です。特に注目すべきは、下位層でより大きな改善が見られたことです。これは、AIが能力の格差を縮小する効果があることを示唆しています。
実験で観察された分布の変化を説明すると、AIの使用により、全体的な能力分布が右にシフトしただけでなく、分布の幅も狭まりました。言い換えれば、AIは単にパフォーマンスを向上させるだけでなく、組織内の能力の標準化にも貢献する可能性があります。
私たちがコンサルタントのプロンプトと行動を詳細に分析したところ、参加者はGPTの出力を80-90%そのまま採用していることが分かりました。これは、AIが提供する解決策の品質が一貫して高く、人間の判断による大幅な修正を必要としないレベルに達していることを示しています。
この発見は、人材育成や組織開発に重要な示唆を提供しています。AIは、組織内の能力格差を縮小し、より均質で高いパフォーマンスを実現する可能性を持っています。ただし、これはコンサルタントの役割や必要なスキルセットの根本的な変化を意味するかもしれません。
5.5. AIの限界外タスクでの影響
私たちの実験では、AIの能力の限界を超えたタスクを意図的に設計し、その影響を分析しました。具体的には、スプレッドシートの分析とブランドパフォーマンスに関するインサイダーインタビューの内容を組み合わせて判断を行うタスクを設定しました。このタスクは、GPTがスプレッドシートを適切に処理できず、微妙な情報を理解できないように設計されていました。
実験の結果は衝撃的でした。コントロール条件(AI無し)では85%の参加者が正しい判断を下せたのに対し、AIを使用したグループは約20%のパフォーマンス低下を示しました。つまり、AIの限界を超えたタスクにおいて、私たちの優秀な卒業生たちは、AIを使用することでむしろ悪い結果を生み出してしまったのです。
さらに懸念すべき発見がありました。AIを使用したグループは、自分たちの推奨事項を擁護する際に、むしろより説得力のある文章を書いていたのです。つまり、間違った結論をより効果的に正当化できるようになっていました。これは、AIが「より優れた煙幕を張る」能力を提供している可能性を示唆しています。
これは大きな懸念事項です。なぜなら、現在のモデルには、自分の能力の限界を超えた要求を受けた際に「これは私の能力を超えています」と警告する機能がないからです。例えば、Teslaの完全自動運転システムは、運転者がサングラスをかけていない限り、目を離すとすぐに警告を発します。しかし、私たちのAIモデルは、自身の能力を超えた要求に対してそのような警告を発しません。
この発見は、AIツールの適切な使用方法と限界の理解の重要性を強調しています。特に、次世代の教育において、AIの能力と限界を正確に理解し、適切に活用する能力を育成することが極めて重要になってくるでしょう。
6. マーケティングでの実践事例
6.1. ChatGPTによる市場調査実験
私たちの研究所で、Israeli Sheが顧客インテリジェンス研究室を運営しており、MicrosoftのJames BrandとDonald Ngwayと共同で驚くべき研究を行いました。この研究の核心は、ChatGPTを使用して市場調査が可能かどうかを検証することでした。この内容は、実はSatya Nadella(Microsoft CEO)の前でプレゼンテーションを行った時のものです。そのため、例としてMacBook ProとSurface Proの比較を用いました(ここシアトルでは、Google Chromebookの例を使うべきでしたね、申し訳ありません)。
研究の主要な問いは、「顧客の選好をどのように理解するか」でした。具体的には、MacBook ProとSurface Proのどちらを選ぶか、その理由は何かを理解することを目指しました。Israeli Sheの研究チームは、GPTにカスタマーをシミュレートさせ、支払意思額(Willingness to Pay)の分析が可能かどうかを検証しました。
結果は驚くべきものでした。GPTから完全に妥当な右下がりの需要曲線が導き出されました。さらに興味深いことに、Surface Proの価格が1000ドルを超えると、消費者がMacBook Proへ切り替える傾向があるという、実際の市場で観察される現象も正確に再現されました。この研究では何千ものシミュレーションを実施し、支払意思額の推定だけでなく、選択理由についても、他の市場調査と整合的で説得力のある結果が得られました。
私は、この結果を見て市場調査者に「慎重に」と言うつもりはありません。むしろ、この技術を全面的に活用すべきだと考えています。市場調査を行う際は、まずここから始めるべきです。好きなだけペルソナを作成し、スケールでプレテストを行い、その後で実際の顧客に向かうことができます。
GPTは価格感応度を示し、参照価格を持ち、ブランド選好も示します。これらは、GPTの訓練データに含まれていた情報を反映していると考えられます。この研究結果は、市場調査の方法論に根本的な変革をもたらす可能性を示唆しています。
6.2. Grabでのメッセージング最適化
東南アジアのGrabにおいて、私たちの卒業生の一人である共同創業者のAnthony Tanと共に、アプリ内メッセージングとプロモーションに関する興味深い事例を観察しました。
従来のプロセスでは、メッセージを作成してから実際に配信されるまでに約100時間を要していました。この100時間の内訳を分析すると:
- 実際の作業時間はわずか5時間
- 残りの95時間は待機時間
- 特に、マーケティングチームとクリエイティブチームの間のやり取りに多くの時間が費やされていました
彼らはGPTを活用することで、このプロセス全体を1.5時間まで短縮することに成功しました。さらに驚くべきことに、AIを使用して作成されたメッセージのクリックスルー率は、人間が作成したものよりも優れていました。
当初、マーケティングチームは非常に懐疑的でした。特に「シングリッシュ」(シンガポール英語)の問題を懸念していました。通常のキャンペーンを英語で作成することはできても、シンガポール特有の表現やイディオムを適切に使用できるのかという疑問がありました。しかし、実際にGPTを使用してシングリッシュのキャンペーンを実施したところ、完璧に機能することが証明されました。
この事例は、AIが単に作業時間を短縮するだけでなく、ローカライズされたコンテンツの品質も向上させられることを示しています。特に、待機時間の大幅な削減は、組織の俊敏性を劇的に向上させる可能性を示唆しています。
6.3. 多言語対応の成功
Grabでの事例で特に注目すべき点は、AIの多言語対応能力です。マーケティングチームは当初、英語のキャンペーンはAIで作成できるかもしれないが、「シングリッシュ」(シンガポール英語)への対応は難しいのではないかと懐疑的でした。シングリッシュには独特のイディオムや表現が多く含まれており、これらを適切に扱えるかが大きな懸念事項でした。
しかし、実際にGPTを使用してシングリッシュでのキャンペーンを実施してみると、驚くべき結果が得られました。AIは単にシングリッシュを理解するだけでなく、その独特の表現や言い回しを完璧に再現することができました。キャンペーンメッセージは自然で文化的にも適切なものとなり、現地のマーケティングチームでさえ、AIが作成したとは思えないほどの品質でした。
この成功は、AIの言語処理能力が単なる文法的な正確さを超えて、文化的なニュアンスや地域特有の表現まで理解し、再現できるレベルに達していることを示しています。これにより、ローカライズされたコンテンツの作成プロセスが大幅に効率化され、品質も向上することが実証されました。
この事例は、AIが言語の壁を越えて、グローバルなマーケティングコミュニケーションを変革できる可能性を示唆しています。特に、各地域の文化的特性を反映した効果的なコミュニケーションを、迅速かつ効率的に実現できる点で、実務的な価値が極めて高いと言えます。