※本記事は、AWSが公開した「AWS re:Invent 2024 - Generative AI for decision-makers (TNC102)」の動画内容を基に作成されています。このセッションは、AIを組み込んだプロジェクトに関する明確な決断を下すために役立つジェネレーティブAIの要素を紹介する、リーダー向けの60分間のセッションです。ジェネレーティブAIの用語の基礎、潜在的なメリットとリスク、ジェネレーティブAIプロジェクトの計画手順、およびジェネレーティブAIに対応した組織を構築するための重要な考慮事項が解説されています。本記事では、このセッションの内容を要約・構造化して紹介しておりますが、内容の正確性を保証するものではありません。より詳細な情報については、オリジナルの動画(https://www.youtube.com/watch?v=E9O6Z9yi72w )をご覧ください。AWS re:Inventの詳細は https://go.aws/reinvent でご確認いただけます。
1. イントロダクション
1.1. セッションの目的と概要
このセッションは「ジェネレーティブAI for decision-makers (TNC102)」と題され、ビジネス判断を行う意思決定者向けに設計された入門レベルの内容となっています。冒頭でScott Friend氏は、参加者がこのセッションを選んだこと自体が一つの意思決定であると述べ、今後のビジネス価値創出のためのジェネレーティブAI活用について学ぶ場であることを説明しています。
このセッションは技術的に深入りせず、100シリーズの非常に入門的な内容として位置づけられています。ただし、re:Inventの場であるため、必要な技術的基礎知識についても適切に触れる構成となっています。
セッションの主な内容として、以下のトピックが紹介されています:
- ジェネレーティブAIの紹介と基本的な仕組み
- ビジネス価値を生み出すためのジェネレーティブAIの活用方法
- 基本的な技術用語(ファウンデーションモデル、トークンなど)の解説
- ジェネレーティブAIプロジェクトの実装方法
- AIモデルの責任ある利用方法
- CANAL+社の実際のジェネレーティブAI導入事例
特に注目すべき点として、セッションの最後でStephane Baumier氏(CANAL+のCTO)による実際のビジネスでのジェネレーティブAI活用事例が紹介されることが予告されています。これは理論的な内容を実際のビジネスコンテキストで理解するための重要な部分として強調されています。
セッション全体を通して、単なる技術紹介ではなく、ビジネスリーダーがジェネレーティブAIを自社に導入する際の具体的な判断材料を提供することを目的としていることが明確に述べられています。
1.2. 発表者の紹介(Scott Friend)
メインスピーカーのScott Friendは、オーストラリアで7年間勤務しているアメリカ人のAWS技術トレーナーです。発表時には特徴的な金色のジャケットを着用しており、彼自身がユーモアを交えて説明するところによると、それは「砂漠での寒さをしのぐため」ではなく、AWSの全認定資格を取得した証であると述べています。
Scott氏は自身について「技術に夢中になっている」と説明し、深い技術的な話に入り込みすぎないよう制限しながらも、技術への情熱が垣間見える発表スタイルを持っています。また、認定資格について質問があれば、セッション後に金色のジャケット(「bling」と表現)を目印に見つけて質問してほしいと伝えています。
彼は長年の技術的バックグラウンドを持っており、特にコード開発の経験があることを後の発表中で言及しています。このバックグラウンドが、ジェネレーティブAIの技術的側面と実用的なビジネス応用との橋渡しをする上で重要な視点を提供しています。
1.3. ゲストスピーカーの紹介(Stephane Baumier - CANAL+)
セッションの後半では、フランスからStephane Baumier氏が登場します。彼はフランスの大手メディア企業CANAL+のCTO(最高技術責任者)として参加しています。Scott Friend氏はStephane氏について、「フランスから皆さんのためにやってきた」と紹介し、CANAL+がジェネレーティブAIを活用した経験とAWSのトレーニング&認定チームとの協働について共有してくれることに期待を示しています。
Stephane氏はセッション後半で、40年の歴史を持つ大規模なメディア企業としての視点から、ジェネレーティブAI導入の実践的な事例を発表します。Scott氏は特にメディア・エンターテインメント業界でのジェネレーティブAI活用について、Stephane氏の話を楽しみにしていると述べており、理論から実践へのつながりを提供する重要な役割を担っています。
Friend氏は自身がオーストラリアからフランスへ直接指導したわけではないことに触れつつ、国際的な視点からの事例共有の価値を強調しています。
2. ジェネレーティブAIの基礎
2.1. ジェネレーティブAIの定義と基本概念
Scott Friend:ジェネレーティブAI、これは昨年から広く使われるようになったバズワードですね。まずは全員が同じ認識を持てるように、前提を作りましょう。人工知能(AI)とは何か、これは哲学的な議論もできるでしょう。「知性とは何か」「思考とは何か」といったデカルト的な議論に入ることもできますが、そうではなく、人工知能を「より良い決断を下すために、あるいはより生産的になるために機械を活用する方法」として考えてみましょう。
まず機械学習について話しましょう。機械学習は現在の人工知能の世界における基礎的な側面といえます。機械学習はデータセットを取り込み、それを処理し、パターンや因果関係を探し出し、その因果関係に基づいて予測を行います。これは水晶玉を見て予測するような神秘的なものではなく、因果関係に基づいた分析的な予測なのです。
アメリカの「パンクサトーニー・フィル」という例を挙げてみましょう。これは2月2日に地面から出てきたグラウンドホッグが影を見ると、春の訪れが遅れるという予測をするものです。しかし、この予測の精度はわずか40%程度です。晴れた日かどうかという単一のデータポイントから気象パターンの変化を予測するのに十分なデータとはいえません。にもかかわらず、100年以上この伝統が続いているのです。
あなたはビジネスをこのような予測で運営したくないでしょう。パンクサトーニー・フィルのグッズを売るビジネスならともかく、春の訪れを予測するためにこれを使うべきではありません。それは役に立ちません。
機械学習では、大量の既知データを取り込み、現在のコンピュータ処理能力が非常に強力になったため、これらを処理して因果関係を作り出すことができます。予測モデルを作成できるのです。そしてこれはあくまで予測であり、私たちが求めるのはその予測の精度の高さです。これが機械学習の基本的な考え方です。
ジェネレーティブAIは、この機械学習をさらに発展させたものですが、少し神秘的な部分もあります。人間の行動により近いもので、ニューラルネットワークを活用していますが、ラベル付けされていないデータから始めるところが特徴的です。従来の機械学習では因果関係を作るために既知のデータセットを使用していましたが、ジェネレーティブAIでは「大量のデータがあるので、それを理解してください」と言うだけです。そしてこの処理には膨大な計算能力が必要です。
ジェネレーティブAIは大量のデータを解釈し、そのデータをモデリングプロセスに適用するための分類方法を見つけ出します。私たちがデータにラベルを付ける必要はありません。これにより、学習プロセスにおいてより優れた柔軟性と堅牢性が得られるのです。
より実用的な観点から見ると、ジェネレーティブAIは単なる予測モデルではなく、コンテキストを作成するために使用されます。「この家の3年後の価値は?」や「これはホットドッグかハンバーガーか?」といった分類ではなく、「ストーリーを教えて」と言うと、知っていることを使ってコンテキストを作り出します。このコンテキストには創造性が含まれます。機械がどのように創造的になるのかというと、それは学習したパターンを使って会話、物語、画像、動画、音声、そして私が特に好きなコードなどを生成するのです。大量のデータから見つけたパターンを使って、「これがあなたが望むものだと思います」と言って、単なる予測だけでなく、有用なものを提供してくれるのです。
2.2. 人工知能と機械学習の関係性
Scott Friend:人工知能と機械学習がどのように関連しているのか、視覚的に理解するためにこの図を見てみましょう。これは土星の輪のような包含図になっていますね。一番外側の輪が人工知能(AI)の領域全体を表しています。私たちが今日話しているジェネレーティブAI(生成AI)は、この図の最も内側の層に位置しています。
機械学習について先ほど説明したように、これは大量の既知データとそこから検出できるパターンに基づいた予測モデルです。完全に決定論的なプログラミングではありませんが、決定木や分類などを用いた予測モデルになります。
その内側に深層学習があります。ちなみに、今年のre:Inventではディープレーサーが最後の年になります。ディープレーサーは小さなカメラを搭載したデバイスで、ラジコンカーのようなものですが、深層学習モデルをプログラムします。深層学習とは何かというと、ニューラルネットワーク、つまり脳の働きに似た仕組みです。
これを説明するために、私の娘の例を挙げてみましょう。娘が話し始めた頃、彼女は星を「アッパ」と呼んでいました。なぜ「アッパ」と呼んだかというと、「きらきら星」の歌から連想したからです。彼女はその音、歌、そしてイメージを関連付けたのです。それで星を見るたびに「アッパ」と呼んでいました。
しかし、彼女が成長し、より多くのコンテキストやデータを得るにつれて、その関係性をより明確にし、実際には星と呼ばれることを学びました。今では「アッパ」とは呼びません。誰も彼女を理解できなかったでしょうからね。彼女は感覚に入ってくるデータに基づいて適応できたのです。
本質的にはこれが深層学習のニューラルネットワークが行うことです。取り込まれるデータパターンを進化させ、それをより堅牢にするのを助けます。これは改善なのです。
では、ジェネレーティブAIはどうでしょうか?これは少し神秘的です。それはニューラルネットワークを使用していますが、ラベル付けされていないデータから始まります。私たちが因果関係を作るために入力する既知のデータセットの代わりに、「ここに大量のデータがあります。ここに大量の刺激があります。さあ、理解してください」と言うのです。
そして、このようなことを理解するには膨大な計算能力が必要であり、技術的な部分では、それがどのように機能するかについて説明します。しかし、ジェネレーティブAIは大量のデータを解釈し、そのデータをモデリングプロセスに適用するために分類する方法を見つけ出します。私たちがそのデータにラベルを付ける必要はないのです。
これにより、学習プロセスにおいてより優れた柔軟性と堅牢性が得られます。これが、AIの進化における人工知能、機械学習、深層学習、そしてジェネレーティブAIの関係性です。
2.3. Amazonにおける機械学習の歴史的発展(2001年~現在)
Scott Friend:私たちはAmazon Web Servicesですが、その名前の最初の単語はAmazonです。Amazonといえば、多くの人が電子商取引の小売業者として知っていますね。「世界最大の書店」とも言えるでしょう。私自身も90年代の早期採用者でした。
Amazonはいつから機械学習を使い始めたと思いますか?どなたか推測はありますか?
会場参加者:2009年?
Scott Friend:2009年という声が聞こえましたね。実際には2001年から始まっています。Amazonは1996年から存在していたので、Amazonの歴史の中ではわずか5年目のことです。なぜそこから始めたかというと、それはパーソナライゼーション、つまりパーソナライズされたレコメンデーションのためです。
これは、私がオンラインでショッピングをしていて、「この商品を購入した人はこれらの商品も購入しています。あなたも興味があるかもしれません」というようなものです。ビジネスの意思決定者である皆さんは、「製品配置」や「付加的な販売」がどういうものか知っていますね。これはまさにそれです。Amazonは「パターンを見て、これを買った人はこれにも興味があるかもしれないから、教えてあげよう」と考えたのです。それは、お店でティッシュと鼻づまり薬を隣同士に置くようなものです。
これが2001年のことでした。現在は2024年ですから、それは23年前、つまり20年以上前のことです。この分野はすでにカジノに入れる年齢に達していますね!機械学習はもはや初期段階ではなく、すでに成人期に向かっています。
このタイムラインを見てみましょう。すべてが重要というわけではありませんが、特に注目すべきものがあります。家でAlexaを使ったことがある人も多いでしょう。あの個人音声アシスタントのAlexaが登場してから、すでに10年以上が経過しています。娘が「Alexaが私の言うことを聞いてくれないのはなぜ?」と聞いてきたとき、「彼女はあなたと同じ年齢だからだよ、少し生意気になっているんだ」と冗談を言いました。
冗談はさておき、Alexaは登場してからわずか10年ですが、私たちは日常的に音声チャットボットと対話しています。これは神経言語学的アプローチを使用しています。「神経言語学的」とちょっと技術的になってしまいましたが、深入りしないと約束しました。これは機械学習の形態であり、私たちは日常的にこれを使用しています。
私たちの周りでは常にさまざまな形の人工知能や機械学習が使われていますが、その名前をあえて付けていなかっただけです。今、私たちはそれにラベルを付け、ビジネスに応用できるようにしているのです。
このスライドの最後の部分に注目してみましょう。2023年頃にCodeWhispererがコーディングアシスタントツールとして登場しました。ただし、CodeWhispererは現在Amazon Q Developerに置き換えられていることに注意してください。
私は技術的なバックグラウンドを持っていますが、コーディングは多くのコピー&ペーストや、プロセスの検索が含まれます。「誰かがすでにこの問題を解決しているからそれを取り入れよう」というものです。コーディングアシスタントを使用することは、開発を加速するための強力なツールとなります。
Amazon Qは最初はCodeWhispererとして始まり、その後ビジネス向けのQなど、より消費しやすい製品になりました。今週のre:Inventでは、Amazon Qに関する多くの新しい発表を聞いています。これは新興分野ですが、決して最先端というわけではありません。
では、これがビジネスに適しているかどうかをどのように判断すればよいのでしょうか?ビジネスモデルにどのように組み込めば良いのでしょうか?それがこれからお話することです。
3. AIと機械学習の進化
3.1. 機械学習から深層学習、ジェネレーティブAIへの発展
Scott Friend:先ほどAIについて説明しましたが、AIには機械学習が含まれていますね。この図を見てください。これは土星の環のようになっていますが、実際には包含関係を示す図です。人工知能は全体を包む最も大きな領域です。
そして、ジェネレーティブAI(Gen AI)は、この図の最も内側の層にあります。機械学習は既に説明したように、大量の既知データのパターンに基づいて因果関係を見つけ出し、予測モデルを作成します。これは完全に決定論的なプログラミングではありませんが、決定木や分類などを用いた予測モデルになります。
次に深層学習についてですが、ちなみに今年のre:Inventでは、DeepRacerが最後の年になります。DeepRacerは小さなカメラを搭載したデバイスで、リモコンカーのようなものですが、深層学習モデルをプログラムします。深層学習とは何でしょうか?それはニューラルネットワークです。ニューラルネットワークとは何か?それは簡単に言えば、脳の働き方に似たものです。
これを説明するために、また娘の話に戻りましょう。娘が話し始めた頃、彼女は星を「アッパ」と呼んでいました。なぜ「アッパ」と呼んだかというと、「きらきら星」の歌からの連想です。彼女はその音、歌とイメージを関連付けていたのです。それで星を見るたびに「アッパ」と呼んでいました。
しかし、彼女が成長し、より多くのコンテキストや、つまりより多くのデータを得るにつれて、その関係性をより明確にし、実際には「星」と呼ばれることを学びました。今では「アッパ」とは呼びません。それはよいことです。誰も彼女を理解できなかったでしょうから。彼女は感覚に入ってくるデータに基づいて適応できたのです。
本質的にはこれが深層学習のニューラルネットワークが行うことです。取り込まれるデータパターンを進化させ、それをより堅牢にするのを助けます。これは改善なのです。
では、ジェネレーティブAIはどうでしょうか?これは確かに少し神秘的です。それはニューラルネットワークを用いた方法ですが、ラベル付けされていないデータから始まります。因果関係を作るために入力する既知のデータセットの代わりに、「大量のデータがあります。大量の刺激があります。さあ、理解してください」と言うのです。
そして、このようなことを理解するには膨大な計算能力が必要であり、技術的な部分では、それがどのように機能するかについて説明します。ジェネレーティブAIは大量のデータを解釈し、そのデータをモデリングプロセスに適用するために分類する方法を見つけ出します。私たちがそのデータにラベルを付ける必要はないのです。これにより、学習プロセスにおいてより優れた柔軟性と堅牢性が得られます。
これが先ほど説明した深層学習からジェネレーティブAIへの進化の過程です。各層がどのように関連し、どのように発展してきたのかが分かると思います。
3.2. ジェネレーティブAIの特徴:創造性とコンテキスト生成
Scott Friend:ジェネレーティブAIについて、技術的な観点からすでに少し説明しましたが、実用的な観点からはどうでしょうか?従来の機械学習では予測モデルとして利用していましたが、ジェネレーティブAIではコンテキストを作成するために使用します。
つまり、「この家の3年後の価値を予測して数字を教えて」とか「これはホットドッグですか、ハンバーガーですか?」といった分類ではなく、「ストーリーを教えて」と言うと、知っていることを使ってコンテキストを作り出すのです。そのコンテキストには創造性が含まれます。
機械がどのように創造的になるのでしょうか?これも神秘的に聞こえますね。機械は、学習したパターンを使って、会話、物語、画像、動画、音声、そして私が個人的に気に入っているコードなどを生成します。機械が私たちのために考えるのではなく、この大量のデータから見つけたパターンを使って「これがあなたが望むものだと思います。単なる答えではなく、あなたのために完全なストーリーを提供します」と言ってくれるのです。
これは単なる予測以上のものを提供してくれます。それは私たちにとって有用なものです。ジェネレーティブAIは、私たちが求めるものに対して、単一の答えだけでなく、豊かなコンテキストと創造性を備えた応答を生成できるのです。
例えば、あるトピックについて質問すると、単に事実を列挙するだけでなく、それに関連する情報、文脈、さらには創造的な表現を含めた総合的な回答を提供します。この能力こそが、ジェネレーティブAIを従来の予測モデルから区別する最も重要な特徴なのです。
3.3. AWSのジェネレーティブAIサービス(Amazon Q)の紹介
Scott Friend:Amazon Qについて少しお話ししましょう。これはAmazon Qのセッションではありませんが、Amazon Qは私たちがジェネレーティブAIを始めるのに役立つ製品です。
私たちには「Q Business」、「Q Developer」、「QuickSight内のQ」、「Connect内のQ」、「Supply Chain内のQ」、「至る所にQ」があります。ジェームズ・ボンド映画でQが何をしていたか考えてみてください。Qはジェームズ・ボンドが必要なものを提供していました。基本的にそれがQが私たちにしてくれることです。私たちが必要とするものを提供してくれるのです。
今週、Qに追加される機能についていくつか耳にしていますが、それは素晴らしいことです。先ほど言ったように、Q Developerはコーディングの背景を持つ私にとって、コードアシスタントとして役立つものの一つです。
コード生成がどのように見えるか簡単な例を見てみましょう。私はギーク気質から抜け出せなくてすみません。これは単なる簡単なサンプルで、コードの詳細を気にする必要はありませんが、基本的にどこかからコピー&ペーストしたコードの参照です。
Qは「どこかでそのコードを見たことがあります。そのコードが何か分かると思います。ああ、そうです、MITライセンスがついています。コードにそのMITライセンスへの参照を入れた方がいいかもしれません」と言います。これが画面に表示されている内容ですが、より重要なのは、Q Developerがジュニア開発者が新しいコードを作成しようとして、シニア開発者の日常業務を中断して「コードレビューをしてもらえますか?こちらに来て、コーチングしてもらえますか?私はどうやっていますか?」と言わなくても済むツールだということです。
私はかつてジュニアとシニアの両方の開発者でした。その交流は楽しいものでしたよ。お互いから学ぶことができ、異なる視点を学ぶことができました。しかし、生産性の観点から見ると、生産性は自動化されたプロセスによってもたらされます。
ジュニア開発者がシニア開発者を中断して「これをどうやるの?」と聞く代わりに、Amazon Q Developerのようなジェネレーティブ AIを利用して、ヒントを得ることができます。「ここに典型的なパターンがあります。こうするといいでしょう」というようなアドバイスや、インターネットで解決策を20分探して、結局あなたのユースケースには適用できないものをコピー&ペーストするような無駄な時間を省くことができるのです。
初期の研究では、Amazon Q Developerのプレビュー段階の参加者は、タスクを完了する可能性が27%高く、Qを使用しない場合と比較して57%速かったことがわかっています。これはまさに生産性向上のための機能です。ジェネレーティブAIを使って、私たちの生産性をどのように向上させることができるかという例です。
4. ジェネレーティブAIのユースケース
4.1. 創造性(コンテンツ生成)
Scott Friend:これから見ていくユースケースに特に優先順位はありません。これらは混在させることができる4つのカテゴリーです。
私の個人的なお気に入りから始めましょう。どれから始めるか気になっていますか?創造性です!なぜかというと、私はテクニカルな人間で創造性がないからです。これらのツールを使って創造性を向上させたり、ブレインストーミングをしたりすることは、私にとって驚くべきことなのです。それは精神的なブロックを乗り越えるのに役立ちます。
創造性は個人的に自然に身についていない能力の一つなので、創造的な作業をするためにジェネレーティブAIのようなツールを持つことは素晴らしいことです。
では、実際の商品発売の例を考えてみましょう。市場調査レポートがあり、このレポートは非常に詳細で広範囲にわたるものです。組織内にはこれらのレポートを確認し、解釈し、おそらく要約して推薦事項を作成するビジネスアナリストがいるかもしれません。
このような大規模なレポートをプロンプトとともに投入することができます。プロンプトというのは、ジェネレーティブAIにアウトプットやレスポンスを生成させるための入力方法です。「この詳細な市場調査を使って、ハイレベルな要約を作成してください」と言って、レポートを添付します。
これは200ページのレポートを消費可能な形式に凝縮します。しかし、ビジネスの意思決定者としては、それでもまだ多くの時間を読むのに費やさなければならないと考えるかもしれません。「誰かが私に答えを教えてくれるだけでいい」と思うでしょう。
そこで、プロンプトをさらに調整して、「これらの質問に答えて、この形式で提示してください」と指示することができます。これにより、改善し、強化することができます。これは私たちの出発点です。
次に製品説明の作成について考えてみましょう。私は創造的ではないので、どのように言葉にすればいいのでしょうか?私はあまり言葉の達人ではなく、ターゲット市場に魅力的な方法で書く方法がわかりません。
そこでプロンプトを与えることができます。例えば、「これはロンドンを歩き回るためのものです」というプロンプトを与えます。正直に言うと、私はまだロンドンに行ったことがないので、よくわかりませんが、私の考えでは、おそらく快適なものが必要だと思います。ロンドンを歩き回る人には何か特別なものが必要かもしれません。
そこで少しコンテキストを提供し、何をすべきかを少し指示します。それによってアウトプットが生成され、顧客にこの製品をどのように位置づけるかのアイデアが得られます。
ウェブサイトのコンテンツについては、注意事項があります。そのアウトプットを直接使用しないでください。それを出発点として使用し、スタッフの専門知識による個人的な触れ込みで調整し、洗練させてください。しかし、それは大きなジャンプスタートを与えてくれます。
コード生成については時間をかけませんが、コンテンツ生成のもう一つの側面は画像です。ウェブサイトに掲載する画像を作成する必要がある場合、すでに持っている靴の写真を撮ることもできますが、その靴をスカイラインの上や、アパートのテラスの上に置いて、この靴がロンドンに属しているように見せたいかもしれません。
ジェネレーティブAIを使えば、まさにそのような画像を作成できます。それは完璧なスタート地点です。必ずしも正確に望むものではないかもしれませんが、創造性の側面を助けてくれます。それは良い出発点を与えてくれます。
そして、より重要なことは、実際に写真家を雇ったり、場所を確保したり、レンタルしたり、すべてを準備したり、天気が撮影に適しているかを確認したりする必要がないということです。これらすべてを電子的に、迅速に作成することができるのです。
4.2. 生産性向上(コード生成)
Scott Friend:コード生成については既にお話ししましたが、少し掘り下げてみましょう。先ほど紹介したQ Developerは、コーディングアシスタントツールとして非常に強力です。
私自身、技術的なバックグラウンドを持っていますが、コーディングの多くは実際にはコピー&ペーストや検索の繰り返しなのです。「誰かがすでにこの問題を解決しているから、それを取り入れよう」という方法です。コーディングアシスタントを使用することで、開発プロセスを大幅に加速することができます。
初期の研究では、Amazon Q Developerのプレビュー段階の参加者は、Qを使用しなかった場合と比較して、タスクを完了する可能性が27%高くなりました。これは単に生産性だけの問題ではなく、開発者がタスクに取り組む際の挫折感や「これが解決できない」という諦めを減らすことにもつながるのです。
また、Qを使用したグループはタスクを57%速く完了できたという結果も出ています。これは純粋な生産性向上のための機能と言えるでしょう。ジェニア開発者が上級開発者を中断して「これをどうやるの?」と聞く必要がなくなり、また20分もインターネットで解決策を検索して、結局自分のユースケースには適用できないコードをコピー&ペーストするような無駄な時間を省くことができます。
コードアシスタントがあることで、開発者は面倒な定型作業から解放され、より創造的で価値の高い作業に集中できるようになります。これはまさにジェネレーティブAIを使った生産性向上のハックなのです。どのように私たちの業務をより生産的にできるか、その一例です。
4.3. ユーザー体験(Q&Aシステム)
Scott Friend:ユーザー体験について考えてみましょう。ユーザーが肯定的な体験をしていなければ、それは良くありませんよね?私たちはユーザーがより肯定的な体験をするよう促したいと思います。では、どうすればユーザーとのより堅牢なエンゲージメントを作れるでしょうか?チャットエージェントを使用して、ユーザーとの対話を行うことができます。
音声アシスタントの初期の時代を覚えていますか?「1を押すとこちら、2を押すとあちら、どのボタンを押すか分からない場合は電話を切らずにお待ちください」というものでした。それが進化して「リクエストを話してください」というように変わり、そのリクエストが適切な部署へのルーティングにつながりました。
顧客をコールセンターに通して—そう、Connectを通じてこれらのことができますが—その体験がほぼシームレスで会話的なものであれば、それは顧客にとって素晴らしい体験となります。顧客体験、これは非常に重要なユースケースの一つだと思います。
例えば、顧客が「最後の注文についての詳細を教えてください。追跡番号が見つかりません」といった質問をしたとしましょう。このプロンプトだけでは多くのことは伝わりません。コンテキストを理解する必要があります。「こんにちは、サポートが必要です」の「私」は誰でしょうか?
電話番号やCRMシステムを通じて、ユーザーのコンテキストを把握できることを願っていますが、「追跡番号」のような情報は、電話センターのオペレーターが対応できる内容ですが、それは繰り返し作業です。
もしこれを自動化し、非常に人間らしい会話で応答を提供できれば、「あなたの追跡番号は...です」というロボット的な音声よりも、顧客の体験がより肯定的になります。より温かみを感じることができるのです。そうですね、感情的な言葉を使っていますが、それが私たちが望むことです。顧客の体験が非常に肯定的なものであってほしいのです。
このようなQ&Aシステムを構築することで、24時間365日、常に誰かが起きている必要なく、顧客の質問に答えることができます。これは顧客サービスと顧客体験の両方を向上させる強力な方法です。
4.4. ビジネスプロセス(コンテンツ要約)
Scott Friend:ビジネスプロセスについて考えてみましょう。私たちのもう一つのブックエンドです。どのようにしてビジネスプロセスを改善できるでしょうか?多くの方は、マネジメントプログラムなどを通じて、リーンエンジニアリングやリーンデザインを学んだことがあるでしょう。製造規模でこれを考えるならば、それほど簡単なことではありません。制約理論などもありますね。
しかし、ジェネレーティブAIアプローチをワークフローや生産能力、あるいは単に時間のかかる繰り返し作業に適用できれば、それらはすべてビジネス運営の助けになります。
コンテンツ要約とは何を意味するのでしょうか?もう少し詳しく見てみましょう。アナリストレポート、つまり業界の動向を常にモニタリングしているアナリストからの業界レポートがあるかもしれません。
これらのレポートは非常に言葉が多く、網羅的な傾向があります。組織内にはこれらを確認し、解釈し、要約して推奨事項を作成するビジネスアナリストがいるかもしれません。
このような大規模なレポートをプロンプトと一緒に投入することができます。プロンプトとは、ジェネレーティブAIアプローチにアウトプットやレスポンスを生成させるための入力方法です。「この詳細な市場調査を使って、ハイレベルな要約を作成してください」と言ってレポートを添付します。
これは200ページほどのレポートを消費可能な形式に凝縮します。しかし、ここで考えてみてください。「それでもまだ読むのに多くの時間を費やさなければならない。ビジネスの意思決定者として、誰かに答えを教えてもらいたい。答えだけ教えてくれ」と思うかもしれません。
そこでプロンプトをさらに調整し、「これらの質問に答えて、この形式で提示してください」と指示することができます。このように強化、改善することができます。これが私たちの出発点です。
このようにコンテンツ要約は、大量の情報を処理し、意思決定に必要な核心部分を抽出するのに役立ちます。これはビジネスプロセスの効率化における非常に価値あるアプリケーションです。時間を節約するだけでなく、より一貫した情報分析を提供することができるのです。
5. 産業別のジェネレーティブAI活用事例
5.1. ヘルスケア(医療画像解析など)
Scott Friend:これらのユースケースは、さまざまな業界の垂直市場に適用できます。もちろんそうです。いくつかの異なる業界について見ていきましょう。
ヘルスケアにおいて、私が特に興味深いと思うものは医療画像です。放射線科医がX線やCTスキャンなどを確認し、指標を探すような場合、彼らは多くの経験と訓練を必要とします。そして、彼らは間違いを犯すこともあります。彼らは人間ですから。何かを誤解釈することもあるでしょう。
自己改善するように作られた機械学習モデルも間違いを犯す可能性があります。あえて言いますが、それも間違えることがあります。しかし、効率性を向上させることができ、何かが確実なレベル内にない場合は、人間による二次プロセスに進むことができます。
このように機械学習とジェネレーティブAIを使用することで、患者により早く、より多くの情報を提供できると思います。この医療画像の例は、プロフェッショナルの能力を補完し、精度を高めることができる点で、私は特に魅力的だと考えています。
また、ライフサイエンス分野における薬物発見や新薬開発にもジェネレーティブAIが活用されています。ただ、これについては約4年前に対処しなければならなかったことについては触れたくないので、この話題はここで終わりにしましょう。
ヘルスケア業界でのAI活用は、診断支援だけでなく、治療計画の最適化、医療記録の管理、さらには患者とのコミュニケーション改善など、多岐にわたる可能性を秘めています。重要なのは、これらの技術が医療専門家の判断を置き換えるのではなく、彼らの専門知識を拡張し、より良い医療提供をサポートする点です。
5.2. 金融サービス(債権回収など)
Scott Friend:金融サービスについてはここでは債権回収について話しましょう。債権回収のプロセスは非常に不快なものになる可能性があり、最終的には顧客からできるだけ多くを回収しようとしています。より共感的であることが必要かもしれません。
機械は本当に共感的になれるでしょうか?実際にはなれませんが、より良く受け入れられる債務通知がどのようなものかのコンテキストを学習し、債務者により良く響く方法でそれらの通知を書く手助けをすることができます。
例えば、債務回収通知を作成する際、通常の冷たい通知文よりも、顧客の状況を理解し、解決策を提案するような表現が効果的です。ジェネレーティブAIは大量のデータから、どのようなコミュニケーションが債務者から最も良い反応を得られるか学習し、最適な表現方法を提案できます。
金融サービス業界ではほかにも、詐欺検出、リスク評価、顧客サービスの自動化、投資アドバイス、市場予測など、ジェネレーティブAIの活用が進んでいます。これらはすべて、大量のデータパターンから学習し、人間だけでは見つけられない洞察を提供する能力に基づいています。
最終的には、金融機関がより効率的に運営され、顧客により良いサービスを提供できるようになることが目標です。債権回収の例のように、適切なトーンと共感を持ったコミュニケーションは、顧客関係の改善と同時により良い回収率につながる可能性があります。
5.3. 製造業(プロセス最適化)
Scott Friend:製造業については、これはまさにリーン製造アプローチという考え方に直結します。ワークフローやプロセス最適化を見ていきましょう。
製造業におけるジェネレーティブAIの活用は、リーン製造の原則を実現するための強力なツールになります。たとえば、製造ラインのワークフローを分析し、ボトルネックを特定するためにジェネレーティブAIを使用することができます。伝統的なリーン手法や制約理論を適用する際も、AIがデータを分析し、最適化の機会を見つけ出すことができるのです。
また、製造プロセスから収集された大量のデータを処理して、パターンや異常を検出し、生産効率を向上させる方法を提案することもできます。例えば、特定の製品の製造時に常に発生する問題があれば、AIはそのパターンを識別し、解決策を提案することができます。
さらに、予測メンテナンスにもジェネレーティブAIが活用できます。機械の故障を事前に予測し、計画的なダウンタイムを設けることで、予期せぬ生産停止を防ぐことができます。これは製造業において非常に価値のある応用例です。
リーン製造アプローチを実現するためには、データに基づいた意思決定が必要ですが、ジェネレーティブAIはまさにその点で大きく貢献できるのです。生産ラインの最適化、品質管理、サプライチェーン管理など、製造業の様々な側面でジェネレーティブAIを活用することで、より効率的で無駄のない生産プロセスを実現することが可能になります。
5.4. 小売業(バーチャル試着など)
Scott Friend:小売業に関しては、Amazonも少し関わっていますね。バーチャル試着について見てみましょう。現在、いくつかのウェブサイトで既に見られる機能として、ある商品、特に衣類を見ると、自分の写真を載せて、その衣類を着た状態がどのように見えるかを表示してくれるものがあります。
これは非常に興味深い機能です。単なるPhotoshopではなく、実際に試着しなくても、その服装がどのように見えるかのイメージを提供してくれます。実際に注文して、合わなければ返品する必要がなくなるのです。もちろん、サイズの問題はまだありますが、少なくともそのアイデアを得ることができます。
このようなバーチャル試着技術は、顧客が実際に店舗に行かなくても、オンラインで買い物をする際の不確実性を減らします。ジェネレーティブAIを使用することで、異なる体型、肌の色、髪型などに対して、様々な衣類がどのように見えるかをリアルタイムで生成することができます。
また、小売業ではパーソナライズされた商品推奨も重要なジェネレーティブAIの応用例です。顧客の過去の購入履歴、閲覧行動、さらには季節や最新のトレンドを考慮して、その顧客が興味を持ちそうな商品を提案することができます。
このように、小売業におけるジェネレーティブAIの活用は、顧客体験の向上と同時に、返品率の低減や購入決定の促進など、ビジネス側にも明確なメリットをもたらします。将来的には、よりリアルなバーチャル試着体験や、さらにパーソナライズされたショッピング体験が可能になるでしょう。
5.5. メディア・エンターテイメント
Scott Friend:メディアとエンターテイメント業界については、詳しく話す必要はないでしょう。CANALのStephaneがこの後で詳しく話してくれますので、彼の話を心から楽しみにしています。正直に言うと、皆さんにもStephaneの話を聞いてほしいと思っています。
メディアとエンターテイメント業界は、ジェネレーティブAIの活用において特に創造的な可能性を秘めています。コンテンツ制作、パーソナライズされた視聴体験の提供、視聴者分析など、多くの革新的な用途が考えられます。
この業界では、スクリプト作成の支援からビジュアルエフェクトの生成、さらには完全にAIが生成したコンテンツまで、ジェネレーティブAIの応用範囲は非常に広いです。また、視聴者の好みを分析し、より魅力的なコンテンツを提供することも可能になっています。
CANAL+のようなメディア企業がどのようにジェネレーティブAIを実際のビジネスに統合しているのか、その具体的な事例をこの後Stephaneから聞くことができるでしょう。理論から実践への架け橋となる貴重な話になるはずです。
6. ジェネレーティブAIの技術的基礎
6.1. 機械学習モデルとトークン化
Scott Friend:さて、少し技術的な話に入りましょう。先ほど機械学習モデルとは何かについて説明しました。それはさまざまなデータセットを取り込み、それらのデータセット間のパターンを調べ、予測を行うものです。ジェネレーティブAIもそれができますが、ラベル付けされていないデータを使って大規模に行い、コンテキストを自ら構築します。
もう少し詳しく見ていきましょう。ラベル付けされていないデータは大規模な機械学習プロセスに投入されます。そうですね、ニューラルネットワークを使用してコンテキストを自ら理解しようとしています。このプロセス全体を見ると、一方に機械のような部分があり、もう一方にニューラルネットワークや脳のような部分があるように見えます。
基本的には、このコンテンツ自体からこれを理解しようとしています。これは大規模なプロセスですが、私たちはこれを「事前学習」と呼びます。事前学習についてはもう少し詳しく説明します。その結果は何でしょうか?それは、そのコンテキストのすべてを適応させて、価値ある情報を提供することです。
私たちが求めるコンテンツ要約、コンテンツ生成、コード、質問と回答など、ビジネスに必要なさまざまな要素は、このプロセスから得られるアウトプットです。
ファウンデーションモデルは、大量の一般的なドメインデータで訓練された部分です。これが私たちの事前学習です。あなたが事前学習を行うのでしょうか?いいえ、違います。なぜなら、これには膨大な計算能力を使って何ヶ月もかかる可能性があるからです。そこで、研究機関や様々な企業がアクセスできる大量のデータを使って、この事前学習を行い、私たちはそれらの既成のモデルを使用します。
彼らにはラベル付けされていないすべてのデータを取り込ませ、アルゴリズムを通して実行させ、この膨大な計算処理を行わせ、そしてファウンデーションモデルと呼ばれるものを生成します。ファウンデーションモデルは、機械が晒されたすべてのデータから学習したことの表現です。
では、これを入力とします。入力プロンプト、同義語です。「子犬は犬に対して、子猫は__に対するものです」。答えを言ってみてください。
会場参加者:猫!
Scott Friend:どうやってそれが「猫」だと分かりましたか?
会場参加者:あなたのニューラルネットワーク!
Scott Friend:あなたの内部思考ですね。あなたはただ知っているのです。コンピュータはどうやって知るのでしょうか?誰かがすべてのこのような類推を決定木にプログラムしたわけではありません。では、どのようにジェネレーティブAIを使ってこれを行うのでしょうか?
これは複雑な問題ではありません。実際、非常に明白ですが、決定論的、プログラム的、論理的なアプローチから考えると、そうではありません。人間としては、私たちはただ知っているのです。
「子犬は犬に対して、子猫は猫に対するものです」。では、機械はどのようにしてこれを理解するのでしょうか?それはトークン化によって行われます。
技術的になると言いましたね。ファウンデーションモデルについて話し、プロンプトについて話しました。このプロンプトはトークンに分割されます。これはカジノのスロットマシンに入れるトークンではありません。これらのトークンは機械学習モデル、つまりファウンデーションモデルがそのデータのチャンクを解釈する方法です。
この例を簡略化し、各単語をトークンのように見せましたが、実際の世界では、おおよそ6文字がトークン1つに相当し、必ずしも単語で区切る必要はありません。非常に興味深いことですが、これらはモデルに供給され、モデルが数字に変換して対話できるようにします。
また、辞書を使用しているわけではないので、以前に聞いたことのないものも理解できます。これらの単語のそれぞれに辞書を使ったとしても、コンテキストを理解することはできないでしょう。そこで、これらのトークンをシステムに渡します。
これが、私たちが技術的に説明する限界ですが、機械学習は何をしてくれましたか?予測を作成します。ジェネレーティブAIはその予測モデルを使用していますが、より良いコンテキストと会話を提供するためです。
このデコーダーを使用して、次の単語が何である確率を計算します。以前に言ったように、少し宿題を出したいと思います。今すぐやらないでください。セッション終了後に二つのことをお願いします。一つは、re:Inventアプリでこのセッションを評価してください。もう一つは、その時に携帯でメモやテキストメッセージを開いてください。誰かに送る必要はありません。
A, P, Uと入力を始めると、予測テキストは「puppy」という単語を埋めてくれるでしょう。あなたの心を読んでいるのでしょうか?続けて「is to a dog as a kitten is」と入力すると、文章を完成させようとします。これがジェネレーティブAIです。毎日使っていて気づいていないだけです。この予測テキストは私たちのスマートフォンにあります。
この例は非常に簡略化されていますが、ビジネスリーダーは特にジェネレーティブAIの採用に躊躇することがあります。しかし、実は毎日使っていて気づいていないのです。これがセッションの残りの部分がより関連性を持つ理由です。どのように責任を持って使用し、私たちのコンテキストに合わせるかを考えなければなりません。
6.2. ファウンデーションモデルの概念
Scott Friend:ファウンデーションモデルについてもう少し詳しく説明しましょう。ファウンデーションモデルとは、大量の一般ドメインデータで訓練された部分です。これが私たちの「事前学習」と呼ぶものです。
皆さんはこの事前学習を自分で行うのでしょうか?いいえ、そうではありません。なぜなら、膨大な計算能力を用いて何ヶ月もかかる可能性があるからです。そのため、アクセスできる大量のデータを持つ研究機関や多くの企業がこれを行い、私たちはそれらの既成のモデルを消費するのです。
つまり、彼らにはラベル付けされていないすべてのデータを取り込ませ、アルゴリズムを通して実行させ、膨大な計算処理を行わせます。そして最終的に「ファウンデーションモデル」と呼ばれるものを生成します。ファウンデーションモデルは、機械が晒されたすべてのデータから学習したことの表現なのです。
このファウンデーションモデルは、大規模な事前学習の結果として生まれます。私たちがこれを直接構築するのではなく、AWSのようなサービスプロバイダーが提供するモデルを利用します。そして、このファウンデーションモデルが、ジェネレーティブAIシステムの基盤として機能するのです。
ファウンデーションモデルは特定のタスクに特化したものではなく、言語理解や生成など幅広い能力を持っています。その上に、特定の目的に応じた調整や拡張を行うことで、様々なアプリケーションに適用できるようになります。これが、一つのモデルから多様な用途に対応できる柔軟性の源泉となっています。
6.3. 予測モデルとしてのジェネレーティブAI
Scott Friend:ジェネレーティブAIは、その核心において予測モデルとして機能しています。先ほど機械学習が私たちに何をもたらすかという質問について触れましたが、それは予測を作成することです。ジェネレーティブAIはその予測モデルを使用していますが、より良いコンテキストと会話を提供するためです。
このデコーダーを使用して、「次の単語は何である確率が高いか」という計算を行います。例えば、「子犬は犬に対して、子猫は__に対するものです」という文章があるとき、モデルは次の単語として最も確率が高いものを予測します。
このプロセスは、非常に人間的な思考プロセスに似ています。皆さんは「猫」という答えをすぐに思いつきましたね。それは皆さんの脳内にある言語と概念の関連性に基づくものです。ジェネレーティブAIも同様に、膨大なデータから学習した関連性に基づいて予測を行います。
しかし、ジェネレーティブAIの予測は単一の単語や概念に留まりません。文脈を理解し、その文脈に沿った適切な応答を生成することができます。それは単に「次の単語は何か」を予測するだけでなく、「この会話の流れを考えると、どのような応答が適切か」を予測しているのです。
この予測モデルとしての能力があるからこそ、ジェネレーティブAIは質問応答、文書要約、コンテンツ生成など、様々なタスクに対応できるのです。それぞれのタスクにおいて、入力されたプロンプトに対して最も適切な応答を予測し、生成しています。
予測モデルとしてのジェネレーティブAIを理解することは、その能力と限界を把握する上で非常に重要です。そして、このモデルをどのようにビジネスに活用できるかを考える基盤にもなります。
6.4. 日常生活の中のジェネレーティブAI(予測テキスト入力など)
Scott Friend:先ほどお話したように、セッション後にやっていただきたい小さな宿題があります。今すぐする必要はありませんが、このセッションが終わったら、二つのことをお願いします。
一つ目は、re:Inventアプリでこのセッションを評価してください。私たちのセッションがどうだったか教えてください。そして、スマートフォンでメモ帳やテキストメッセージを開いてみてください。誰かに送る必要はありません。ただ開いて、「A, P, U」と入力を始めてみてください。
もし私が何を言おうとしているか分かっていれば、「A, P, U」と入力すると、予測テキストが「puppy」という単語を自動的に埋めようとすることに気づくでしょう。まるであなたの心を読んでいるようですね。さらに「is to a dog as a kitten is」と続けると、文章全体を自動的に埋めようとするでしょう。
これがジェネレーティブAIなのです。私たちは毎日これを使っていながら、それに気づいていないのです。この予測テキスト機能は私たちのスマートフォンに既に組み込まれています。
この例を挙げたのは、特にビジネスリーダーがジェネレーティブAIの採用を躊躇することがよくあるからです。しかし、実は私たちは既に毎日これを使用していて、気づいていないだけなのです。
このテキスト予測の例は非常に単純化されたものですが、その背後にある原理は私たちが議論してきた高度なジェネレーティブAIシステムと同じです。両方とも過去のパターンから学習し、最も可能性の高い次のステップを予測しています。
日常生活の中では、他にもメールの自動補完、写真の自動タグ付け、音声アシスタント、検索エンジンの予測など、多くのジェネレーティブAI技術が使われています。これらはすべて、大量のデータから学習し、コンテキストを理解し、適切な応答を生成するという同じ基本原則に基づいています。
このような身近な例を理解することは、より複雑なビジネスアプリケーションへの橋渡しとなります。セッションの残りの部分では、これらの技術をどのように責任を持って活用し、ビジネスコンテキストに適用するかについて探っていきます。
7. ジェネレーティブAIプロジェクトの計画と実装
7.1. プロジェクトの範囲定義
Scott Friend:さて、プロジェクトを計画してみましょう。これまでジェネレーティブAIが何であるかについての理解を深め、様々なユースケースについて話してきました。では、これを実際のビジネスに適用するにはどうすればよいでしょうか?
プロジェクトの計画には4つのステップがあります。範囲の定義、モデルの選択、モデルの適応、モデルの使用です。定義、選択、適応、使用。これが基本的なアプローチです。
まず範囲の定義についてです。スコープ外のことに時間を費やしたくありません。正しい焦点を持つことが重要です。範囲を定義しましょう。こちらにフライホイールがあります。顧客、コスト、収益、範囲。ビジネス上の決断は投資収益率に基づいて行われます。
財務コストのクラスをするのが大好きですが、それは別の話です。投資収益率は私たちがビジネスリーダーとして行う必要のある決断です。そのためには、コストとそれに対する価値を大まかに予測する必要があります。
いくつかの質問をしましょう。まず、顧客はこれを望んでいるのでしょうか?顧客がそれを望んでいないのなら、なぜそれを行うのでしょうか?単にクールだからですか?次に、私たちはそれができるでしょうか?技術的なギークである私たちは「はい、できます。クールだからやります」と言うかもしれませんが、それをすべきかどうかという問題もあります。できるからといって、必ずすべきとは限りません。
プロジェクトに着手する前に、これらの質問を自問する必要があります。そして、範囲を定義して、これが簡単に勝てるものなのか、手が届きやすい果実なのかを判断します。
既に私たちはテキストメッセージで予測テキストを使用しています。では、なぜコーディングアシスタントとして予測コーディングを使用しないのでしょうか?これは非常に簡単で影響の少ない取り組みです。
あるいは、チャットボットのような、顧客と会話する必要があるものを望んでいるのでしょうか?特に欧州の企業であれば、複数の言語で顧客と会話する必要があり、追加の負担がかかるかもしれません。
私たちの範囲は何でしょうか?それはどのようなものでしょうか?範囲定義はジェネレーティブAIプロジェクトの成功に不可欠な最初のステップです。明確なビジネス目標と期待される成果を設定することで、プロジェクトが軌道に乗り、実際の価値を生み出すことができます。
7.2. モデルの選択
Scott Friend:どのモデルを使用したいでしょうか?先ほどファウンデーションモデルについて説明しました。そのファウンデーションモデルは、大量のデータで訓練された部分です。
ファウンデーションモデルについて他にも説明していませんでしたが、これらのファウンデーションモデルを微調整することができます。モデルにコンテキストを与えることができます。そのファウンデーションモデルに層を追加して、ビジネスや組織のコンテキストを与え、その結果、私たちのために文脈的な判断を行うようにすることができます。
モデルの選択は、どのような機能が必要か、どのようなデータ特性があるか、そしてどのようなビジネス要件があるかによって決まります。例えば、テキスト生成、画像認識、あるいは多言語機能が必要か、それともより特殊な分野固有の応用が必要かを検討する必要があります。
AWSのBedrock、あるいは他のプロバイダーからアクセスできる様々なファウンデーションモデルがあります。各モデルには異なる強みと弱みがありますので、自分のユースケースに最も適したものを選ぶことが重要です。
場合によっては、複数のモデルを組み合わせたり、特定のタスクに特化したモデルを選択したりすることもあります。ここでの決定は、プロジェクトの成功に直接影響します。
また、モデルを選択する際には、コストと性能のバランスも考慮する必要があります。より高性能なモデルは一般的により多くの計算リソースを必要とし、したがってコストが高くなる傾向があります。しかし、特定のユースケースでは、より単純で効率的なモデルでも十分な場合があります。
最終的には、ビジネスニーズと技術的要件の両方を満たすモデルを選択することが重要です。良いモデル選択は、次のステップである適応とカスタマイズの基盤となります。
7.3. モデルの適応(微調整とプロンプトエンジニアリング)
Scott Friend:モデルの適応は微調整ですが、それはプロンプトエンジニアリングでもあります。先ほどビジネス要約を行ったとき、アナリストレポートを見ましたね。そして、そのプロンプトを変更して、プロンプトに実際に判断を下してもらうことができると言いました。「これについての評価を与え、このフォーマットで提供してください。」
アウトプットを改善するために、単に入力を変更するだけで良いのです。プロンプトエンジニアリングは、検索エンジンの調整のようなものです。より良い検索をするためにどのように検索するかを考えるように、より良いプロンプトを書いて、モデルが望む出力を望むフォーマットで提供するにはどうすればよいかを考えます。これはより価値があります。これは最も簡単で負担の少ないアプローチです。
一方、微調整は既存のモデルに追加のレイヤーを置くことです。これはファウンデーションモデルをベースとして、特定のタスクやドメインに特化するよう調整する過程です。例えば、一般的な言語モデルを医療文書の理解や特定の業界の専門用語の生成に特化させることができます。
微調整には追加のトレーニングデータとコンピューティングリソースが必要ですが、特定のユースケースに対してより正確な結果を得ることができます。これは、より深いカスタマイズが必要な場合や、組織固有の知識をモデルに取り込む必要がある場合に特に有効です。
プロンプトエンジニアリングはそれに比べてずっと軽量なアプローチです。モデル自体を変更する代わりに、モデルへの入力方法を最適化します。効果的なプロンプトを設計することで、既存のモデルから大幅に改善された結果を得ることができます。
例えば、「市場調査の要約を作成してください」という単純なプロンプトと、「この市場調査の主な発見を5つの箇条書きにまとめ、各発見に対する戦略的な意味を追加し、経営陣向けの1ページの要約として構成してください」というプロンプトでは、同じモデルでも全く異なる結果が得られます。
多くの場合、プロンプトエンジニアリングから始めて、必要に応じて微調整に進むというアプローチが効果的です。これにより、より複雑で時間のかかる微調整プロセスに投資する前に、比較的簡単な方法で大きな改善を達成できるかどうかを確認できます。
7.4. モデルの利用とフィードバックループ
Scott Friend:そしてモデルを使用する必要があります!確かに、これらすべての問題を経てきましたが、時間とともに進化していくことをお伝えします。これも一種の適応と言えるでしょう。しかし、モデルを使用する必要があります。つまり、それを解放するのです。人々に使わせるのです。それがプログラマーであれ、顧客であれ、人々に使用させるのです。
モデルを人々に使わせるとき、最も重要な部分が終わりに近づいていることを覚えておいてください。ここで真剣に考えるべきことがあります。まず、AIに対して責任を持っているかどうか、そしてAI自体が責任を持っているかどうかを確認する必要があります。適切なフィードバックを得ているでしょうか?このAIの消費者がフィードバックを提供し、「その回答はあまり良くなかった」「それは間違った回答だった」と言えるようになっているでしょうか?
このフィードバックループが必要です。時間の経過とともにパフォーマンスをどのように追跡するか、そしてビジネス価値もどのように追跡するのでしょうか?プログラマーの生産性を向上させているなら、それをどのように定量化するのでしょうか?それもこの一部です。モデルを拡張できるでしょうか?これらすべての重要な要素を把握する必要があります。
AIプロジェクトにこれがどのように適合するかを見ると、再び責任の側面があります。モデルが公平であることを確認したいと思います。異なる入力が平等に扱われることを確認したいのです。これらのモデルはさまざまな場所からの大量のデータで訓練されており、無意識の偏見が入り込むのは非常に簡単です。
これらのモデルの消費者として、私たちのアウトプットが公平であることを保証する責任があります。間違いなく、Stephaneも後でこれについて少し話すでしょう。これは非常に重要なことです。
プライバシーも非常に重要です。セキュリティはどこでもジョブゼロです。データの匿名化を行います。システムに個人情報を入れたくはありませんが、他の参照で匿名化することもできます。システムに個人情報を入れる理由はありません。もちろん、他のシステムを活用することはできますが、個人保護、つまり個人データの利用方法には十分に注意する必要があります。
リスクについては、これが通常皆さんの障壁となる部分です。「ジェネレーティブAIは幻覚を見るから、本当に採用できない」と何度も聞いたことがあります。その言葉を変えさせてください。それは間違いを犯すのです。娘は星を「アッパ」と思っていましたが、彼女は幻覚を見ていたわけではありません。キノコをしていたわけでもありません。彼女はまだ学んでいなかったので間違いを犯しただけです。
このような「幻覚」を悪いものとして考えないでください。これはモデルを改善するためのフィードバックサイクルとして考えるべきです。それは起こりますが、どのようにそれらを特定するのでしょうか?
毒性は非常に重要なことの一つです。ビジネスがあり、ユーザーや顧客がチャットボットに不適切な言葉を入れた場合、チャットボットが「これがこの人が使用している言語構造だから、同様の言語で返信しよう」と言うとしたら、ビジネスとしてそのようなことをしたくないでしょう。そのため、顧客に提示する前に、出力内容が企業の誠実性基準に違反していないか確認する必要もあります。
盗用、不正行為、トレーニングデータの知的財産権についても考慮が必要です。大量の著作権で保護されたデータを使用していて、ファウンデーションモデルを構築していない場合、その出力が著作権で保護された作品をそのまま引用し、それを自分のものとして提示したらどうなるでしょうか?法的な問題になるかもしれません。考慮すべき追加の事項があります。
これらすべてを詳しく説明するつもりはありませんが、責任ある消費者であることが必要だと言いたいのです。顧客により良い体験を提供する一方で、私たちには責任があります。
最後の部分は個人的に私に触れるものです。私たちの誰もが影響を受けると思います。仕事の性質の混乱、排除についてです。私はアメリカのミシガン州、モーターシティ、自動車産業で育ちました。組立ラインにロボット工学がやってきたとき、父や叔父たちが仕事について心配していたのを覚えています。「私の仕事はどうなるのだろう?」と。ロボットが引き継いでいたからです。今回も同じことです!ロボットが私の思考作業を引き継いでいるのです。
そうではありません。少し違ったことをする必要があるだけです。それが混乱の部分です。モデルの利用と同時に、継続的なフィードバックループを確立することで、時間とともにAIシステムが向上し、より価値を提供するようになります。これにより、初期投資からの長期的なビジネス価値を確保できるのです。
8. 責任あるAI活用
8.1. 公平性と偏りの排除
Scott Friend:AIプロジェクトにこれがどのように適合するかを見ると、責任の側面については既に少し触れました。モデルが公平であることを確認したいと思います。異なる入力が平等に扱われることを確認したいのです。
これらのモデルはさまざまな場所からの大量のデータで訓練されており、無意識の偏見が入り込むのは非常に簡単です。ファウンデーションモデルのトレーニングデータに含まれる可能性のある無意識の偏見について考えると、特に注意する必要があります。
これらのモデルの消費者として、私たちのアウトプットが公平であることを保証する責任があります。出力を監視し、潜在的な偏りがないか確認するプロセスを実装する必要があります。
例えば、あるグループに対して不公平な結果を生み出すようなパターンがないか、出力をモニタリングすることが重要です。また、異なる背景を持つ人々に対して異なる答えを提供していないか、様々な種類の入力に対して一貫した回答をしているかといったことを確認する必要があります。
AIシステムの公平性をテストするためには、様々な視点からのテストケースを作成し、システムが特定のグループに対して有利または不利に働いていないか確認することも重要です。同様の質問であっても、異なる文化的コンテキストや言語スタイルで尋ねた場合に同等の品質の回答が得られるかテストすることが大切です。
結局のところ、AIシステムはそれを設計し、実装する人々の価値観を反映します。AIが生成するものは最終的には私たちの責任なのです。このプロセスの中で、多様な視点を持つチームを構成し、異なる角度から潜在的な問題を特定できるようにすることも有効な方法です。
Stephaneも後ほど、CANAL+でのAI実装において、公平性と偏りの排除についてどのように対応しているか話してくれると思います。これは全ての企業が真剣に取り組むべき非常に重要な課題です。
8.2. プライバシーとセキュリティの確保
Scott Friend:プライバシーも非常に重要です。セキュリティはどこでもジョブゼロです。これはAWSでよく使われる表現ですが、最優先事項という意味です。AIシステムを導入する際にも、この原則は変わりません。
データの匿名化を行うことが重要です。システムに個人情報を入れたくはありませんが、必要に応じて他の参照方法で匿名化することもできます。システムに個人情報を入れる理由は基本的にないのです。もちろん、他のシステムを活用することはできますが、個人保護、つまり個人データの利用方法には十分に注意する必要があります。
例えば、顧客データを使ってAIモデルを訓練したり、パーソナライズされた応答を生成したりする場合、そのデータから個人を特定できる情報を取り除くか、匿名化する必要があります。これは単に法的要件を満たすためだけでなく、顧客の信頼を維持するためにも重要です。
データセキュリティに関しては、AIシステムに送信されるデータと、AIシステムから返されるデータの両方を保護する必要があります。暗号化、アクセス制御、監査ログなどの標準的なセキュリティ対策を実装することが重要です。
また、AIモデルに送信するデータについても慎重に検討する必要があります。特に第三者のモデルを使用する場合は、そのデータが他の目的に使用されないように注意する必要があります。契約条件や利用規約を十分に理解し、データがどのように取り扱われるのかを確認することが重要です。
最終的には、データプライバシーとセキュリティはAIの責任ある利用の基本です。この部分をおろそかにすると、規制違反のリスクだけでなく、顧客の信頼喪失という重大なビジネス上のリスクも生じる可能性があります。
8.3. リスク管理(誤った出力、毒性、著作権問題など)
Scott Friend:リスクについて話しましょう。これが通常、皆さんが AI 採用を躊躇する理由となる部分です。「ジェネレーティブ AI は幻覚を見るから、本当に採用できない」と何度も聞いたことがあります。その言葉を変えさせてください。それは間違いを犯すのです。
娘の例を再び使いましょう。彼女は星を「アッパ」と思っていましたが、彼女は幻覚を見ていたわけではありません。キノコをしていたわけでもありません。彼女はまだ学んでいなかったので間違いを犯しただけです。このような「幻覚」を悪いものとして考えないでください。これはモデルを改善するためのフィードバックサイクルとして考えるべきです。それは起こりますが、どのようにそれらを特定し、対処するかが重要です。
毒性も非常に重要な問題の一つです。ビジネスがあり、ユーザーや顧客がチャットボットに不適切な言葉を入れた場合、チャットボットが「これがこの人が使用している言語構造だから、同様の言語で返信しよう」と言うとしたら、ビジネスとしてそのようなことをしたくないでしょう。そのため、顧客に提示する前に、出力内容が企業の誠実性基準に違反していないか確認する必要もあります。
盗用、不正行為、トレーニングデータの知的財産権についても考慮する必要があります。大量の著作権で保護されたデータをコーパスに使用していて、自分でファウンデーションモデルを構築していない場合、その出力が著作権で保護された作品をそのまま引用し、それを自分のものとして提示したらどうなるでしょうか?法的な問題になるかもしれません。
これらすべてを詳しく説明するつもりはありませんが、私たちには責任があることを強調したいのです。顧客により良い体験を提供する一方で、私たちには企業としての責任があります。
リスク管理の一環として、AI システムの出力を定期的に監視・評価するプロセスを確立し、誤った情報や有害な内容が含まれていないか確認することが重要です。また、人間による監視と介入のメカニズムを設け、問題が発生した場合に迅速に対応できるようにすることも必要です。
これらのリスクは確かに存在しますが、適切な対策を講じることで管理可能なものです。責任ある AI の利用とは、これらのリスクを無視するのではなく、認識し、適切に対処することなのです。
8.4. 仕事の変化への対応
Scott Friend:最後の部分は個人的に私に触れるものです。恐らく私たちの誰もが影響を受けると思います。それは仕事の性質の混乱、排除の問題です。私はアメリカのミシガン州、モーターシティ、自動車産業で育ちました。組立ラインにロボット工学がやってきたとき、父や叔父たちが仕事について心配していたのを覚えています。「私の仕事はどうなるのだろう?」と。それはロボットが引き継いでいたからです。
今回も同じことです!ロボットが私の思考作業を引き継いでいるのです。しかし、実際にはそうではありません。私たちは少し違ったことをする必要があるだけです。それが混乱の部分です。
組織がAIを導入する際には、従業員へのコミュニケーションがとても重要です。AIはジョブを置き換えるものではなく、むしろ従業員の能力を拡張し、より価値の高い業務に集中できるようにするためのものであることを強調する必要があります。
例えば、AIが単調な業務を自動化することで、従業員はより創造的な問題解決やお客様との関係構築などに集中できるようになります。これは単なる業務内容の変化であり、仕事がなくなることではないのです。
また、従業員に対して適切なトレーニングとサポートを提供することも重要です。新しいツールを効果的に使用する方法を学び、AIとの協働方法を理解する機会が必要です。これは新しいスキルを開発するチャンスでもあります。
変化に対する恐れや不安は自然なものですが、適切に管理しコミュニケーションをとることで、AIの導入が脅威ではなく機会として捉えられるようになります。最終的には、AIと人間の協力が最も価値を生み出すということを理解し、従業員がこの新しい環境で成功できるよう支援することが重要です。
9. 組織のAI導入準備
9.1. リーダーシップからの始動
Scott Friend:組織がAIの導入準備ができているかどうかを確認するには、リーダーから始めることが必要です。トップから始めなければなりません。合意があり、ビジョン、共有されたビジョンがあることを確認する必要があります。
そのビジョンを伝え、従業員を訓練し、従業員がこれがビジネスの改善であることを理解し尊重することを確認する必要があります。これはジョブを排除するためのものではなく、全体的により良いものを作るためのものです。
どうやってそれを確認するのでしょうか?組織の準備アプローチを経て、そして、はい、従業員を準備します。既に話したとおりです。従業員のための生産性ヘルパーとして、それらの代替としてではなく、そのツールを紹介します。
また、この世界でジョブがどのように変化しているかについての再訓練を支援します。新機能を説明し、おそらくそれらの要求のいくつかに彼らを関与させることさえします。彼らの仕事をどのようにより良くすることができるのでしょうか?
メリットに焦点を当てましょう。そもそもそれをした理由はそれがすべてです。目指していた結果を得ていることを確認し、それを知り、その勝利を祝いましょう。従業員が知ることを確認してください。私たちはこれを行い、目標とした結果を見ています。そしてここがその方法です。
従業員に計画を奨励し、彼らのフィードバックを得て、そのフィードバックに基づいて行動しましょう。このAIを採用している従業員からのフィードバックサイクルを、リアルなフィードバックとして維持してください。
リーダーシップからの強いサポートと明確なビジョンは、AI導入の成功に不可欠です。リーダーがAIの価値を理解し、組織全体にその価値を伝えることで、抵抗を減らし、より円滑な移行を促進することができます。また、リーダーシップの関与は適切なリソース配分とAI戦略の優先順位付けを確保するためにも重要です。
9.2. 従業員のトレーニングと準備
Scott Friend:従業員の準備について詳しく見ていきましょう。従業員のための生産性向上ツールとして、代替手段としてではなく、これらのツールを紹介することが重要です。この世界でジョブがどのように変化しているのかについて再訓練を支援する必要もあります。
新機能を説明し、可能ならば、彼らの要望のいくつかに彼らを関与させることも有効です。「どうすれば彼らの仕事をより良くできるか?」と彼らに問いかけてみましょう。これにより、従業員がプロセスの一部であると感じ、変化の主体者となることができます。
利点に焦点を当てましょう。そもそもAIを導入した理由はそこにあるのです。目標としていた結果が得られていることを確認し、その勝利を祝いましょう。従業員に知ってもらうことが重要です。「私たちはこれを行い、目標としていた結果を得ています。そしてこれがその方法です」と。
従業員に計画に参加するよう促し、彼らのフィードバックを取り入れ、そのフィードバックに基づいて行動しましょう。AIを採用している従業員からのフィードバックサイクルを、リアルで有意義なものとして維持することが重要です。
従業員トレーニングプログラムには、AIツールの基本的な使用方法だけでなく、そのツールがどのようにビジネスプロセスを改善し、従業員が日々の業務でどのように活用できるかについての理解も含める必要があります。これは単なる技術的なトレーニングではなく、思考方法の変化を促すものでなければなりません。
また、早期採用者や「AIチャンピオン」を特定し、彼らが組織内の他のメンバーにその価値を示し、サポートすることを奨励することも効果的です。これにより、組織全体へのAI採用の浸透がより自然なものになります。
最終的に、従業員のトレーニングと準備は継続的なプロセスであるべきです。テクノロジーが進化し続ける中で、定期的なスキルアップデートとさらなるトレーニングの機会を提供することが、長期的な成功のカギとなります。
9.3. 組織的成功のための調整とガバナンス
Scott Friend:成功のための組織について考えると、その分野の専門家と連携することが重要です。すでにその道を歩んできた人々がどのようにそれを行ったかを見てください。データの品質と可用性が適切であることを確認しましょう。
そして、ガバナンスモデルについては、ここで再び言及します。あなたはデータを倫理的に正しく、責任を持って扱う責任があります。何が起こっているかの透明性を確保してください。モデルがそのデータの塊をどのように取って物事に変えたかは見えませんが、モデルの使い方で透明性を確保できれば、何をしているかを示すことができます。
すべての倫理基準と管理を組み込んでいることを確認してください。ガバナンスは非常に重要な部分です。単にそれを展開するだけでは、ガバナンスの部分を導入せずにリスクがあります。
ガバナンスの枠組みを確立することは、AIの責任ある使用を確保するために不可欠です。これには、AIシステムの開発、展開、使用に関する明確なポリシーと手順を定義することが含まれます。また、誰がどのデータにアクセスでき、どの決定がAIによって自動化され、どの決定には人間の監視が必要かを明確にすることも重要です。
データガバナンスについても特に注意を払う必要があります。AIシステムが使用するデータの品質、完全性、プライバシー、セキュリティを確保するためのプロセスを確立することが重要です。これには、データの収集、保存、処理、廃棄に関する明確なガイドラインが含まれます。
また、AIシステムの決定プロセスを監視および監査するメカニズムを実装することも重要です。これにより、問題が発生した場合に迅速に対応し、システムを継続的に改善することができます。
最終的に、強力なガバナンスの枠組みは、AIシステムがビジネスの目標を支え、同時に倫理的、法的、社会的基準を維持することを確保します。これは単なるリスク管理以上のものであり、AIの採用と価値創出を加速させる基盤となります。
9.4. 取るべきアクション
Scott Friend:今すぐ行動を起こすにはどうすればよいでしょうか。ビジネスケースを構築し、ステークホルダーを教育し、実験を行いましょう。実験は、リスクが低い段階から始められます。ジェネレーティブAIをどのように適用して、ポジティブなビジネス成果を生み出せるかを示すのです。
長期的な戦略を立てましょう。小さなことからどのように構築していくのか。ジェネレーティブAI思考を始めましょう。これらは新しいツールになると考え始めるのです。
具体的なアクションとしては、まず小規模なパイロットプロジェクトを立ち上げることをお勧めします。例えば、社内の特定の部門や特定のユースケースに限定してAIを導入し、効果を測定します。これにより、大規模な展開前にリスクを最小限に抑えつつ、価値を実証することができます。
次に、AIリテラシープログラムを開始しましょう。組織全体がAIの基本的な概念、可能性、限界を理解できるようにします。これは技術チームだけでなく、ビジネスリーダーや最終ユーザーも含めるべきです。
また、データ戦略を見直すことも重要です。AIの成功には質の高いデータが不可欠です。データの収集、保存、整理方法を評価し、必要に応じて改善してください。
さらに、技術的な実験と並行して、変化管理計画も策定しましょう。これには、コミュニケーション戦略、トレーニングプログラム、新しいロールとスキルの定義などが含まれます。
最後に、業界内や他の組織とのコラボレーションや知識共有の機会を探りましょう。AIの採用は多くの組織が直面している共通の課題であり、お互いから学ぶことで全体的な成功率を高めることができます。
これらのアクションは段階的に実施し、各ステップから学んだことを次のフェーズに活かしていくことが重要です。AI導入は一度きりのプロジェクトではなく、継続的な旅であることを忘れないでください。
10. CANAL+のジェネレーティブAI活用事例(Stephane Baumier)
10.1. CANAL+グループの概要と課題(レガシーシステム、サイバーセキュリティなど)
Stephane Baumier:ありがとうございます。そして素敵なジャケットですね。私はより伝統的な大企業のCTOなので、青いジャケットを着ています。私はCANAL+グループのCTO(最高技術責任者)です。ご覧のとおり、CANAL+グループは2,700万人の購読者を持ち、60億ユーロの売上を誇る巨大企業です。
なぜこれが重要かというと、私たちは大企業であるだけでなく、古い企業でもあるからです。当社は1984年に創業しましたので、40年の歴史があります。つまり、レガシーシステムがあり、P&L(損益計算書)があり、サイバーセキュリティの課題があり、多くの課題を抱えているのです。
AIは素晴らしいものですが、9,000人が働く企業のCTOとして、うち2,000人がエンジニアや技術者である中で、AIをどのように管理すればよいのでしょうか。収益や様々なことについて多くの約束がありますが、最初にすべきことは資金を投入することです。では、どのように管理し、この課題にどう対応すればよいのでしょうか?
まず始めに、3〜4年前に当社の戦略計画を作成し、CANAL+グループのテクノロジーをどのように管理するかを定義しました。この戦略計画の中で、人工知能をどのように活用したいかを定義し、「AIファクトリー」を作成することを決定しました。
AIファクトリーとは何を意味するのでしょうか?それは、人工知能を単に既製品として購入するのではなく、自分たちで管理したいということです。そして、自分たちで管理すると言うとき、重要なのは人々を訓練することです。
最初に行ったことは、必要なスキルマップを定義することでした。2,000人のエンジニアがいるので、どのように管理するかは想像できるでしょう。私たちはスタートアップではありません。スタートアップではないので、AutoBoostで見つけられる非常に素晴らしいツールを見つけて「これを選びます」と言い、6ヶ月後に変更するというわけにはいきません。それは不可能です。
選択をする必要があるので、プログラムを設計しました。AWSとともに、今はAIですが、チームとブランドアイデンティティのための計画を定義しました。これは、私たちのような企業がどこでAIを活用するかを意味します。人工知能、特にジェネレーティブAIを使えば、映画、CRM、さまざまなことができますが、具体的に何をするのかを考える必要があります。
そこで、矛盾が生じる可能性があることを確認するための包括的なトレーニング計画を作成しました。AWSのコースで350人の従業員を訓練し、すべてのドメインをカバーしました。アーキテクト、サーバーレス、メディアストリーミング、データストリーミング、モデル言語、セキュリティ、CSOPS、CNOPS、すべての言語、そして私たちのような企業にとって非常に重要なFinOpsについても訓練しました。
なぜFinOpsが重要かというと、ご存知のように、これは固定費から変動費への変換であり、多くのリクエストをトレーニングすることになるからです。FinOpsの観点からも同じことが言えます。P&L(損益計算書)が非常に良好であることを確認する必要があります。
また、人工知能に関して従業員が本当に関与し理解していることを確認するために、100人の従業員向けの認証プログラムも開始しました。もちろん、さまざまなイベントやジェネレーティブAIの開発方法についても実施しました。
10.2. AIファクトリーの構築と人材育成
Stephane Baumier:訓練された人材を得たとき、それは私たちにとって一度きりのステップではありません。毎年、ビジネスと技術の両方が含まれるように、AIに関して何をしようとしているのかを理解できるように、さまざまなアニメーションを作成しています。
ハッカソンは、どのようなソリューションが見つかるか、何ができるかを発見するために非常に重要です。そこから最初のジェネレーティブAIのケースを作成します。私たちにとって最も重要なのは、これらのケースに対する投資利益率(ROI)です。多くのものを生成できますが、最終的には、私たちのような大企業にとっては、お金を生み出し価値を創造することが重要です。
その後、インキュベーターを使ってジェネレーティブAIアプリケーションをどのように開発するかを検討し始め、人々を訓練し続けて確実に実行できるようにします。技術だけでなく、来年からさらに本格的に始めようと思っていますが、今年からも少し始めているのは、技術者でない人々にもAIについて訓練することです。彼らにもすべてを理解してもらうためです。
ビジネスに携わる多くの人々にとって、クラウドとは彼らのスマートフォンにあるもの、つまり単なるストレージを意味します。彼らは、クラウドとは正確に何を意味するのか、コンピューティングとプロセスであること、そして顧客レーンがどのように変化するのかを理解する必要があります。
具体的なユースケースに進むと、実際にはスケールする必要があります。冒頭でお見せしたように、私たちは世界的な企業なので、ベトナム、アフリカ、ヨーロッパで機能する必要があります。そのためには、スケーラブルなアプリケーションが必要です。
そこでAWSサービスを活用して、このスケーリングアプリケーションを実現しています。私たちには3つのユースケースがあります。そのうち2つはすでに本番環境にあります。つまり、機能しているということです。「これを行えば、良くなり、将来的には機能するでしょう」という約束ではなく、多くのことを追加できるのです。
それはジェンダー平等、顧客体験のデジタル化のためのチャットボット、そしてコンテンツのマネタイズです。これらは3つの異なるケースであり、非常に重要です。なぜなら、最初のものは規制に関するものだからです。
ジェンダー平等は、シリーズ映画における男性と女性のバランスを見るだけでなく、政治においても重要です。各政党がテレビでどれだけ長く話すかを知りたい場合など、多くのことを管理できます。
チャットボットはビジネスのユースケースにより対応するもので、通話数をどのように制限し、自動応答をどのように実現するかということです。コンテンツのマネタイズは、これから見るように、まだ始まったばかりです。AIファクトリーに技術プラットフォームを作成し、例えば広告などのユースケースやさまざまなメタデータを挿入できるようにしています。
10.3. 具体的なユースケース:ジェンダー平等、チャットボット、コンテンツインテリジェンス
Stephane Baumier:もちろん、私たちはAWS技術、Backbone、Bedrockを使用したBackbone、そして一部ではAmazon Rekognitionを使用しています。ジェンダー平等に関しては、映画やシリーズ、ライブ番組で誰が話しているか、何について話しているかを特定することが目標です。
ビデオ部分にはAWS Rekognitionを使用して、話しているのが男性か女性かを判別できるようにしています。音声部分には、畳み込みニューラルネットワークというオープンソースを使用しています。フランス人の私には聞き取れると思いますが、これはフランスのアルゴリズムで、オープンソースのものを使用しています。これにより、誰が何について話しているかを知ることができます。
実際に機能しています。例えば、新しいチャンネルがあり、そのチャンネルで誰が話しているかを特定し、政治的な割合やテレビでの発言比率を提供することができます。
結果の一例として、フランスのシリーズ「La Fievre」では、全体の発言時間の47%が女性であり、女性がオンスクリーンにいる時間も47%であることがわかりました。これは私たちのESG(環境・社会・ガバナンス)の取り組みにおいて、バランスが取れているかどうかを管理するために非常に重要です。女性と男性に対してできることは、シリーズや映画の任意の人物に対してもできます。統計を取得し、後で提供することができます。これは既に本番環境で機能している具体的なケースです。
2つ目はチャットボットで、これは全く異なります。このチャットボットは、52か国にまたがる7つの企業で機能しています。つまり、ポーランド語、フランス語、ベトナム語、ドイツ語など、さまざまな言語で機能しているのです。
これを管理するためにマイクロサービスを使用し、Bedrockでパワーアップしています。リクエストを受信するためのさまざまな仕組みがあります。サポート用のさまざまなデータベースのベクトル化を行い、AIファクトリーに配置し、あらゆる質問に回答できるようにしています。
もちろん、応答したい質問にのみ回答するように微調整モデルを設定しています。任意の質問をすることができ、データベースから回答を単に取得するだけでは複雑になる可能性があるからです。
なぜこれを行ったのでしょうか?これはAIファクトリーの最初の成果です。サポートデータベースを取得し、ベクトル化したので、このデータベースから回答できるようになりました。しかし明日はプログラム、コンテンツ、セットボックスについての技術情報、テレビや他のものについての情報を入れることができ、それをデータベースにプッシュするだけで自動的に機能します。
つまり、完全にスケーラブルなのです。機能していて、既に本番環境にあります。さまざまなウェブサイトで使用し、Genesisソリューション(Genesisをご存知なら)に統合して、異なる顧客ケア関係に対応しています。現在のところ非常に成功しており、さまざまな質問に対してさらに多くの回答を追加しています。
管理は非常に簡単です。チームにとっては大きな仕事です。だからこそ、彼らを事前に訓練したのです。あらゆるソリューションを考える必要があるからです。先ほどの発表で述べたように、多くのことができますが、テレビチャンネルを放送する企業を管理する場合、24時間365日対応する必要があります。
つまり、チャットボットは私たちがどの国にいるかに関係なく、昼も夜も毎日機能する必要があります。また、問題が発生した場合のために当番やオンコールをする人々も管理する必要があります。
最後は、コンテンツインテリジェンスの管理方法です。私たちはメディア企業なので、多くの動画、クリップ、ライブ放送などを持っています。2つのソリューションがあります。
1つのソリューションは、すべての動画を別の会社に送り、そこでメタデータを生成してもらい、広告、さまざまな分析、ソーシャルエンゲージメントストーリー、環境への影響などにそのメタデータを使用することです。しかしこれを行うと、データの一部を失うことになります。つまり、データを誰かに提供し、その誰かがそれを販売したり配布したりする可能性があり、これは若い技術なのでリスクを取りたくありません。
現在、いくつかのユースケースがありますが、ROIは本当に明確ではありません。そこで何をするかというと、まずこの種のことは技術的に現実的かどうかをテストします。いくつかのテストを開始しました。
コンテンツを取り、Bedrock、Amazon、そしてここに表示されているさまざまなアプリケーションを使用して、各シーンを分析し、シーンで何が起こっているかを確認できるようにしました。これを行うと、シーンを取得して、テーブル、椅子、ボトル、テレビ、ソファに座っている人がいることなどを言うことができます。
この人は映画を見ていて、その映画は戦争についてのものかロマンチック映画かなど、何についてのものかを特定できます。つまり、すべてのメタデータを生成することができるのです。
CANAL+のような企業として、私たちは何をするかというと、これらすべてに関するレポートを作成し、ビジネスに提案します。「今、私たちはこれらすべてを行うことができます。このさまざまなソリューションで何をしたいですか?」環境への影響に関するものかもしれません。つまり、例えば、エコロジーについて話す映画はどれくらいあるかということです。
別の例としては、広告に関するものかもしれません。例えば、フォードのすべての車を知りたいですか?フォードブランドの車がすべてこの映画に登場していると言うことができます。これらの車にフォードの広告を挿入したいですか?そうすれば広告を販売できます。
これらすべてについて、彼らはROIを定義することができ、その時点で私たちはこのメタデータ生成を適用することができるでしょう。なぜなら、数千数千の映画があり、すべての映画でメタデータを生成すると、当然非常に重要になります。そして、これを行う良い理由があるかどうかを絶対に知る必要があり、その理由は収益と価値です。
したがって、すべての映画やシリーズをこの種のジェネレーティブAIに入れてメタデータを生成する前に、ROIを知る必要があります。これは本当にビジネスユースケースと技術の間の作業です。つまり、メタデータを生成できるかどうかを見るためにPOC(概念実証)を行い、ビジネスに提案して、このメタデータで何ができるかを見る必要があります。そして、彼らがこのメタデータでビジネスケースを見つける準備ができたとき、より産業的なことができ、「今、何千何千もの映画を入れてメタデータを生成できます」と言うことができます。
10.4. 実装の課題と対応方法(ROI、サイバーセキュリティ、運用など)
Stephane Baumier:要約すると、実際の課題は、すべての大企業のトップマネジメントからAIとジェネレーティブAIに進むよう要求があることです。メディア企業のCTOとして、どこに行きたいのか、そしてどのようなコストでそれを実現するのかを正確に知る必要があります。
OpEx(運用費)コストは、多くのケースがあるため、非常に非常に速く増加する可能性があります。画像を生成したり、映画を生成したりすることは非常に興味深いかもしれません。毎週、誰かが私のところに来て「ジェネレーティブAIで自動的に映画を生成できます」と言いますが、現時点では多くの課題があります。規制、サイバーセキュリティ、そして40年間持っている本番環境で日常的にどのように管理するかということです。
だからこそ、非常に基本的なことから始めるのです。戦略的計画を立て、AIファクトリーを社内に持ちたいと定義し、チームによって管理されることを決めました。そのため、チームが正確に何をしているかを理解し、自分たちで管理できることを確認するために、3年前からチームに長期的なトレーニングを行うことを決定しました。
最後に重要なのは、チャットボット、規制からのジェンダー平等、そして最後のケースのようなビジネスからの明確なユースケースを見つけることです。メタデータを生成できるので、ビジネスケースを見つける方法を探しています。
ビジネスケースからテクニカルケースに、そしてビジネスに戻るという変化が始まっていることがわかります。
これは少し早足で説明しましたが、何か質問があれば、私のメールを見つけることができると思います。お答えできることを嬉しく思います。皆さんが見ることができるものについて、より具体的な内容をお伝えできたことを願っています。ありがとうございました。
Scott Friend:これで我々のセッションは終了です。Stephaneに改めて感謝します。彼はフランスからやってきて、CANAL+での実際の導入事例を共有してくれました。皆さんの評価をお待ちしています。テキスト予測のテストもぜひやってみてください!
このセッションを通じて、ジェネレーティブAIが単なるバズワードではなく、実際のビジネス価値を創出するための強力なツールであることをご理解いただけたと思います。責任を持って導入し、明確な戦略と準備を整えることで、皆さんの組織でも成功を収めることができるでしょう。ご参加いただきありがとうございました。