※本記事は、AWS re:Invent 2024のセッション「Generative AI in advertising and marketing with Blueshift and VidMob (ADM202)」の内容を基に作成されています。セッションの詳細情報はhttps://www.youtube.com/watch?v=H4KoNIa99w0 でご覧いただけます。本記事では、セッションの内容を要約しております。なお、本記事の内容は登壇者の見解を正確に反映するよう努めていますが、要約や解釈による誤りがある可能性もありますので、正確な情報や文脈については、オリジナルのセッション動画をご視聴いただくことをお勧めいたします。
登壇者紹介:
- Craig Miller氏:AWS Global Solution Portfolio Lead for Advertising and Marketing 広告・マーケティング分野におけるAWSのソリューション戦略を統括。
- Stephanie Layser氏:AWS Global Head of Publisher Ad Tech パブリッシャー向け広告テクノロジーのグローバル責任者。
- Manyam Mallela氏:Blueshift Co-Founder and Chief AI Officer AIマーケティングプラットフォームBlueshiftの共同創業者兼AI責任者。10年以上にわたりカスタマーデータプラットフォームの開発を主導。
- Mickey Alon氏:VidMob Chief Technology Officer and Chief Product Officer クリエイティブデータテクノロジー企業VidMobのCTO兼CPO。40以上の独自AIモデル開発を統括。
本セッションでは、マーケティング分野におけるGenerative AIの実用化事例と、AWS基盤を活用した具体的な実装方法について解説されています。
1. イントロダクションと市場動向
1.1 2023年から2024年へのGenerative AI活用の進化
Craig Miller(Global Solution Portfolio Lead for Advertising and Marketing at AWS):
私たちは現在、Generative AIにおける重要な転換点にいます。2023年には、Generative AIの可能性に対する大きな期待がありました。多くの方々が昨年のre:Inventに参加され、Titanモデルなどの画期的な開発について耳にされたことでしょう。2023年を通じて、私たちはGenerative AIに関する様々な実証実験を行い、この技術を活用した取り組みを探求してきました。
しかし、その時点ではまだ初期段階であり、モデルの種類や leadership、競争の様相も大きく変化していました。多くの実証実験が行われましたが、手動での介入が必要で、実際の本番環境で意味のある規模で運用されるまでには至っていませんでした。
2024年に入り、私たちは大きな転換を目の当たりにしています。これまでの革新が実際の本番環境での運用へと移行し、意味のある成果を生み出し始めています。本日、BlueshiftとVidMobから、AWS関連技術を活用してプラットフォームを構築し、広告主やマーケターにどのように力を与えているかについての具体的な事例をお聞きいただけることを嬉しく思います。
私たちは、基盤モデルとデータを組み合わせることで、パーソナライゼーションやビジネスプロセスの効率化において差別化された成果が生まれていることを確認しています。BlueshiftとVidMobの事例から、皆様がご自身の環境でも試せるようなレシピを得ていただけることを願っています。本日ご参加の皆様は、これらのプラットフォームのユーザーまたは開発者として、広告やマーケティングのユースケースに関心をお持ちのことと思います。
これらの新技術を活用することで、より効率的なビジネスプロセスの実現、優れた顧客体験とパーソナライゼーションによる成果の創出、そしてパブリッシャーの広告収益化ニーズの改善が可能になってきています。Generative AIは、ブランド、広告主、マーケター、そしてパブリッシャーに至るまでの広告・マーケティングのバリューチェーン全体で活用されており、長年の課題解決を支援しています。
1.2 広告・マーケティングにおける主要なユースケース
Craig Miller(Global Solution Portfolio Lead for Advertising and Marketing at AWS):
AWSは、広告・マーケティング業界の長年の課題である「適切な人に、適切なメッセージを、適切なタイミングで届ける」というマントラの実現を支援しています。この目標を達成するためには、意味のある測定可能な成果をデータによって実現する必要があります。
私たちは、主に以下の分野でGenerative AIの革新的な活用を確認しています:
まず、クリエイティブの生成・分析・最適化の分野です。クリエイティブの構成を分析・理解・特徴付けを行い、それを最適化し、さらなるバリエーション、翻訳、ローカライズ、リージョナライズを生成することで、利用可能なデータに基づいたパーソナライゼーションを実現しています。BlueshiftとVidMobは、まさにこれらの領域について話をしてくれる予定です。また、Amazon Advertisingもクリエイティブスタジオを通じてこれらに深く関与しており、昨日発表されたAmazon Novaモデルの開発にも貢献しています。
次に、カスタマーエクスペリエンスのパーソナライゼーションです。マーケターやブランドは、検索結果のパーソナライゼーション、アウトバウンドキャンペーンと次のベストアクションの予測、それらのアクションやオファーに合わせたクリエイティブのペアリング、さらにはコンタクトチャネルを通じたインバウンドカスタマーエクスペリエンスの管理など、消費者とのあらゆる接点やチャネルでの体験向上を目指しています。
また、オーディエンス分析とターゲティングの分野では、消費者のセグメンテーションを理解し、追加のキャンペーンでターゲティングする能力が大きく向上しています。
さらに、コンテキスト広告とブランドセーフティの領域では、クリエイティブ分析の技術をコンテンツに適用することで、大規模なコンテキスト広告の実現やブランドセーフティの向上を可能にしています。パブリッシャーは、これらの技術を活用して、消費者の行動とコンテンツとの関わりを理解し、ユーザーのさらなるセグメンテーションを可能にしています。また、ショッパビリティやバーチャルプロダクトプレイスメントなどの高度なフォーマットも実現可能になっています。これらの機能は、Generative AI以前から存在していましたが、コンテンツの理解と要約、メタ情報の柔軟な抽出により、より効果的に広告・マーケティングのユースケースを実現できるようになっています。
1.3 AWSの差別化要因と提供価値
Stephanie Layser(Global Head of Publisher Ad Tech at AWS):
私たちAWSの差別化要因は、大きく4つの柱から成り立っています。
第一に、目的特化型インフラの提供です。私たちはGenerative AIのインフラストラクチャへの投資を続けており、高性能トレーニング用のTrainiumチップ、リアルタイム推論向けの低レイテンシーInferentiaチップを提供しています。さらに、AWSならではのGenerative AIワークロードに対応した弾力的なスケーリングを実現しています。これらすべてがパフォーマンス、コスト、スケーラビリティの最適化のために設計されています。
第二に、広範なサービスとモデル選択肢の提供です。広告とマーケティング専用に構築された多様なGenerative AIサービスを提供しています。これらはAmazon Bedrock上の最も広範なGenerative AIモデル群と統合されており、クリエイティブの最適化、パーソナライゼーション、コンテンツモデレーション、オーディエンス分析に活用できます。
第三に、広告・マーケティング専門のGenerative AIパートナーエコシステムです。検証済みのパートナーソリューションにより、事前に構築されテスト済みのGenerative AIモデルを活用して、より迅速な市場投入が可能になります。また、経験豊富なパートナーによる実装パッケージは、適切な導入と効果的な活用を保証します。広告コピー、コンテンツ、画像など、ブランドやオーディエンスに合わせて最適化された高性能なモデルやソリューションも提供しています。
最後に、セキュリティ、プライバシー、責任保護ツールです。AWSならではの堅牢なセキュリティ制御により、データが存在する場所でGenerative AIワークロードを実行し、プライバシーを保持しながら完全な制御を維持することができます。また、自動化された不正利用検出機能により、責任ある、監査可能で、コンプライアンスに準拠したGenerative AI導入を実現します。さらに、業界をリードする包括的な知的財産制御により、Generative AIサービスの出力に関する著作権請求から保護し、AWS Generative AIとそのトレーニングデータの使用における侵害請求からも保護します。
2. AWSのインフラストラクチャとサービス
2.1 目的特化型インフラの特徴
Craig Miller(Global Solution Portfolio Lead for Advertising and Marketing at AWS):
AWSは、広告・マーケティング分野でのイノベーションを支援するために、様々な技術革新を進めています。昨日発表されたAmazon Novaファミリーのモデルは、昨年のTitanモデルの発表に続くものです。特筆すべきは、NovaがAmazon Advertisingでのクリエイティブ生成に活用され、マーケットプレイスの出品者による広告キャンペーンの実施を5倍に増加させ、広告による購入も2倍に増加させたことです。
これは単なるクリエイティブ生成モデルの革新にとどまりません。価格性能比の面でも、Novaモデルは同クラスの競合モデルと比較して75%の改善を実現しています。このような成果は、Amazonが主導し、Amazon Advertisingが採用している技術の民主化とイノベーションによって実現されました。
Stephanie Layser(Global Head of Publisher Ad Tech at AWS):
私たちは、チップレベル、シリコンレベルでのイノベーションにも注力しています。InferentiaチップファミリーとTrainiumチップファミリー、そして汎用計算用のGravitonを通じて、効率的な価格性能比を実現しています。これらは、広告・マーケティングにおいて重要な、パーソナライゼーション、クリエイティブ生成、インテリジェンスを必要な規模で実現するために不可欠な要件です。
私たちのインフラストラクチャは、消費者エンゲージメントデータを活用し、次にどのようなアクションを取るべきか、適切なタイミングで適切なメッセージを適切な人に届けるための意思決定を可能にし、その効果を理解することができます。これにより、広告・マーケティングに関連するユースケースを効率的に運用することが可能になっています。
2.2 Amazon Bedrockの概要と特長
Stephanie Layser(Global Head of Publisher Ad Tech at AWS):
Amazon Bedrockは、最新のモデルイノベーションにアクセスしながら、Generative AIアプリケーションの構築とスケーリングを支援する完全マネージド型サービスです。既に数万人のお客様がAmazon Bedrockを基盤としてGenerative AIアプリケーションを構築しています。その理由は、ファーストパーティおよびサードパーティのLLMとFM(Foundation Models)の中から最も広範な選択肢にアクセスできることにあります。
特に人気の高いモデルの一つが、Anthropicのstate-of-the-artなClaudeモデルです。最近では、Anthropicのより高度な知能を備えたClaude 3.5 Sonnetモデルのサポートも発表しました。これは業界の新しい標準を設定するものです。
Amazon Bedrockの大きな特徴は、モデル選択の自由度の高さです。私たちの調査では、大多数のお客様が複数のモデルを使用していることがわかっています。これは、アプリケーションごとに最適なモデルを選択できるためです。
一方で、特定のユースケースに対して独自のモデルを構築・トレーニングする必要のある企業もあります。既にLLMやFMを実験・構築している方もいらっしゃるかもしれません。これらは全てのGenerative AIアプリケーションの基盤となるものです。
AWS上での経験から言えることは、全ての企業がGenerative AIの力を認識し、自社のGenerative AIビジョンの構築に取り組んでいるということです。多くの場合、基盤モデルとLLMに焦点が当てられますが、これは氷山の一角に過ぎません。GenerativeAIから最大の価値を引き出すためには、その基盤となるデータが重要な役割を果たします。
2.3 データ基盤の重要性と活用アプローチ
Stephanie Layser(Global Head of Publisher Ad Tech at AWS):
Generative AIアプリケーションを構築する際、忘れてはならないのは、これらも結局はアプリケーションだということです。LLMを呼び出す以外のすべての対話ステップをサポートするために、運用データベースが必要不可欠です。また、ドメイン固有のデータを蓄積するためのアナリティクスとデータレイクも重要な役割を果たします。
データ基盤には、データソースからのデータ統合、そしてすべてのデータ基盤に対するガバナンスとコンプライアンスのニーズも含まれます。AWSは、これらすべての領域において、適切なツールを適切な用途に提供し、パフォーマンス、コスト、結果において妥協する必要がないようにしています。
私たちは、「one-size-fits-all(すべてに適合する一つのサイズ)」という考え方はGenerative AIのニーズには適さないという哲学を持っています。これは、ベクトル埋め込みの保存、検索、インデックス作成に使用するツールにも当てはまります。
ビジネスニーズに合わせてGenerative AIアプリケーションを構築する際、組織のデータこそが差別化要因となります。すべての企業が同じLLMや基盤モデルにアクセスできますが、自社のデータをGenerative AIアプリケーションに活用する企業は、ビジネス価値のある実用的なアプリケーションを作り出すことができます。これこそが、一般的なGenerative AIアプリケーションと、あなたのビジネスと顧客を深く理解するアプリケーションの違いです。
私たちは、データを創造的に活用した事例として、インテリジェントな会話型チャットボット、テキストからのプログラミングコード生成、書籍や文字起こしなどの長文のナラティブの要約など、様々なユースケースを目にしています。あなたのデータを活用することで、このような差別化された価値を生み出すことが可能になるのです。
3. Blueshiftの事例:AIマーケティングプラットフォーム
3.1 プラットフォームの概要と4つの柱
Manyam Mallela(Co-Founder and Chief AI Officer at Blueshift):
Blueshiftは、AI主導のマーケティングのためのカスタマーデータプラットフォームを提供しています。組織やブランドは、業界用語でファーストパーティデータと呼ばれる自社データの価値を increasingly認識しており、これを活用して顧客体験やパーソナライゼーションを向上させ、エンゲージメント指標を有意に改善しています。
Blueshiftが提供するプラットフォームは、3つの重要な基盤層を統合しています。統合データインデックス、AIエンジン、そしてあらゆるチャネルでの顧客体験を調整する機能です。私たちは10年以上にわたってこの基盤を構築してきました。
通常、ユーザーやブランドは私たちのプラットフォームを活用して、メールコミュニケーション、SMSコミュニケーション、サイト、カスタマーチャット、カスタマーサポート、そしてファーストパーティデータが体験を向上させうるあらゆる顧客接点に活用しています。
私たちのプラットフォームは、予測型AIと生成型AIを組み合わせることで差別化を図っています。これは、マーケティング実践における長年のデータサイエンスと機械学習の歴史の中でGenerative AIを考える上での私たちの重要な秘訣です。
数千万の顧客を扱う組織であれば、インデックスには膨大なデータが存在します。これらの顧客プロファイルに関するリアルタイムの予測を組み合わせることで、顧客とのコミュニケーションや、サイトやアプリでの体験をより適切なものにすることができます。ここにGenerative AIを組み合わせることで、パーソナライズされたコンテンツをより迅速に作成することが可能になります。ただし、これは既に構築された予測モデルの基盤と組み合わせる必要があり、私たちのソリューションを使用することで、コンテンツ作成とユーザーに対するコンテキストパーソナライゼーションのフライホイールを回すことができます。
3.2 LLMを活用したコンテンツレコメンデーション
Manyam Mallela(Co-Founder and Chief AI Officer at Blueshift):
約18ヶ月前、私たちの顧客から興味深い課題が提起されました。コンテンツレコメンデーションやレコメンデーションエンジンは長年存在していましたが、コンテンツの意味的理解はまだ限定的でした。
従来のレコメンデーションは、主にアイテムとアイテムの関係性に焦点を当てていました。例えば、eコマースサイトでは、Amazon等に見られるように、ある商品を見ているユーザーに対して類似商品を表示したり、「この商品を見た人は他にこんな商品も見ています」といった推奨を行っていました。これらは主にサイト上のセッション履歴や数回のユーザーインタラクションに基づいていました。
しかし、Generative AIを活用したコンテンツの登場により、なぜその商品がその人にとって重要なのか、その商品が個人のライフスタイルや顧客体験にどのように適合するのかといった、より深い文脈を提供できるようになりました。
特筆すべきは、Generative AIによるコンテンツ作成の効率性です。Zapierの調査によると、Generative AIを使用した画像作成のコストは従来の方法と比較して200分の1に低下しています。さらに、昨日発表されたAmazon SupernovaやNova Reel、Novaなどの4つの異なる階層のモデルにより、コスト面でさらなる改善が期待できます。
しかし、重要な課題は、大量のコンテンツを作成できるようになった今、それをどのように活用するかということです。良質なコンテンツを大量に作成できることは、ゴールではなく始まりに過ぎません。どのようにしてそのコンテンツを顧客やユーザーと結びつけ、無限のコンテンツの海の中で適切なものを提供できるかが、次の重要な課題となっています。このような課題に対して、私たちは顧客が最近あなたのブランドで何をしたのか、何をしていないのか、長期的な興味関心は何かを理解し、それらをすべて組み合わせることで解決を図っています。
3.3 Sweetwaterでの実装事例と50%のCTR改善
Manyam Mallela(Co-Founder and Chief AI Officer at Blueshift):
私たちの技術革新の成果を、北米の主要な音楽機器小売業者であるSweetwaterでの実装を通じてご紹介したいと思います。音楽を志す人やプロのミュージシャンの間でよく知られている企業です。
Sweetwaterのユニークな点は、単に機器を販売するだけでなく、顧客教育に重点を置いているところです。例えば、特定のアンプや特定のギターを選ぶ理由、利用可能なオプション、楽器の調整方法、適切なソフトウェアの選び方などを教育しています。また、実際にその機器を使用している人のポッドキャストを聴いたり、彼らのYouTubeインフルエンサーが投稿した機器の使用方法に関する動画を視聴することもできます。
このように、Sweetwaterは目的意識の高いコミュニティを形成しており、音楽の旅を始めようとする人から、テレビやグラミー賞で見かけるような人になるまでの journey に寄り添っています。彼らが持つコンテンツの範囲は非常に広く、購入の journey と教育の journey を結びつけることができます。
私たちは、LLMレコメンデーションを彼らのニュースレターに組み込んだところ、クリックスルー率が50%向上するという成果を得ました。これは、以前の協調フィルタリングモデルからマルチモーダル埋め込みを使用したLLMベースのレコメンデーションに移行したことで実現されました。
この劇的な改善は、商品を購入する際に関連する教育コンテンツ(アンプを購入する際にそのアンプの機能や関連する楽器について、ポッドキャスト、動画、記事を通じて学べる)を適切に組み合わせることで達成されました。このように、購入の journey と教育の journey を効果的に統合することができました。
3.4 実装における主要な学び
Manyam Mallela(Co-Founder and Chief AI Officer at Blueshift):
私たちの実装過程で得られた主要な学びをお伝えしたいと思います。まず、埋め込みは時間とともに複数の属性でインデックス化できることがわかりました。これにより、インクリメンタルな更新が可能になります。
実行時には、適切なインデックスを使用してそれらを取得することができます。これはある意味で、スーパーRAGのようなものです。通常のRAGでは特定のユニットのみを生成・取得しますが、この場合、より大きなベクトルインデックスを主要なインデックスとともに持つことができ、リアルタイムでコンテキストに応じたパーソナライゼーションを実現できます。
AWSと協力して、Titan埋め込みを使用したソリューションを構築しました。マルチモーダル埋め込みをレコメンデーションエンジンの問題に組み込む優れた方法です。AWSのウェブサイトで完全なブログをご覧いただけますが、他のプロバイダーとの比較結果や、パーソナライゼーションのユースケースへの変換方法についても詳しく説明されています。
参照アーキテクチャとして、Amazon EMRクラスターとECSクラスターを大量のデータ取り込みに使用していますが、LLMベースのパイプラインの多くはGlueを使用して実行しています。これは優れたサービスで、事前にインフラストラクチャをプロビジョニングする必要がなく、完全にマネージドされています。パイプラインには動的にGlueを実行でき、データが入力されると適切にスケールし、Amazon Bedrockサービスから取得した適切な埋め込みでレコメンドエンジンを更新します。
これらの学びを通じて、コンテンツ生成だけでは不十分であり、顧客との意味のある接続を作り出すためには、Sweetwaterの例で見たように、アンプを購入する際の教育コンテンツ(ポッドキャスト、ビデオ、記事を通じた)との関連付けが同様に重要であることが明確になりました。
4. VidMobの事例:クリエイティブデータ技術
4.1 クリエイティブデータの定義と重要性
Mickey Alon(Chief Technology Officer and Chief Product Officer at VidMob):
VidMobは、クリエイティブデータテクノロジー企業として、Kenvue、J&J、Coca-Colaなどの大手ブランドが、クリエイティブシグナルを通じて自社のオーディエンスについて学ぶことを支援しています。これらの企業は毎日メディアに関する意思決定を行っています。よく「適切なメッセージを、適切なタイミングで、適切な人に」という言葉を耳にしますが、私たちはそのメッセージ、つまりコンテンツに焦点を当て、それを解読して実際の嗜好を理解し、それに対応できるようにしています。
私たちは、これまでに1,800万以上の動画を分析し、1フレームごとにその内容を詳細に理解してきました。11の主要なチャネルと接続し、これらのブランドのアセットは3兆以上のデータポイントを生成しています。これは、クリエイティブ要素とそれに付随するパフォーマンスデータの交点となるものです。
クリエイティブデータをより深く理解し抽出するために、40以上の独自モデルを開発してきました。これらのモデルは、動画、静止画をより深く理解し、関連するデータを抽出することに特化しています。私たちは、あらゆるインプレッションを学習の機会と捉えています。通常、ブランドはクリエイティブを通じて、どのようにコミュニケーションを取りたいか、どのようにアイデンティティを構築したいか、どのような指標を追求したいかを考えます。
私たちのアプローチは、各フレームを分析し、そこで何が起きているかを理解することです。オブジェクト、テキスト、インタラクション、さらには感情や製品との接触といった高度な要素も分析します。これらの要素をビュースルー率やクリックスルー率などのメディア指標と相関させることで、マーケターが求める成果を導き出します。30秒の動画から約10,000のデータポイントが生成され、これらはオーディエンスが実際に何を好むのかをブランドに伝えるための学習機会となっています。
4.2 ブランドが直面する課題
Mickey Alon(Chief Technology Officer and Chief Product Officer at VidMob):
ブランドがこのデータに注目する理由は、調査によってクリエイティブの品質がキャンペーン全体の成功の50%以上を占めることが明らかになっているからです。「何を」伝えるかが、常に言われている「適切なメッセージを、適切な人に、適切なタイミングで」の50%を占めているのです。そのため、ブランドはクリエイティブデータへの投資を重視しています。
Generative AIの登場により、より多くのコンテンツをより迅速に、より低コストで作成できるようになり、クリエイティブの豊富さへと移行していることは非常に興味深い点です。しかし、ブランドは現在いくつかの重要な課題に直面しています。
まず、ブランドアイデンティティと品質管理が極めて重要になっています。Generative AIを使用して多くの異なるアセットを生成する場合、ブランドアイデンティティをどのように維持するかが課題となります。例えば、リステリンのボトルやコカ・コーラの缶など、皆さんはすぐにそれらを識別できますが、それが突然奇妙に見えると、アイデンティティの問題が生じます。品質管理も同様に重要です。生成されたものすべてを理解することが、主要な課題の一つとなっています。
また、研究によると、消費者は毎日ブランドが送信する情報のわずか15%しか記憶していないことが分かっています。そのため、メモラビリティ(記憶に残りやすさ)が新たな課題となっています。ブランドは、実際にメッセージを記憶してもらうためにブランドの一貫性をどのように確保するかに注力しています。この一貫性は、オブジェクト、メッセージングなどの見え方に関わるものです。
これらの課題に直面する中で、Generative AIの時代においては、何を作るべきかを知っているマーケターが勝者となります。ノイズをカットし、ブランドの一貫性を生み出すことができる能力が求められているのです。
4.3 Creative Data Distilleryアーキテクチャ
Mickey Alon(Chief Technology Officer and Chief Product Officer at VidMob):
私たちは、Creative Data Distillery(クリエイティブデータの蒸留所)と呼ぶアーキテクチャを構築しました。AWSとのパートナーシップを通じて、データを活用してインサイトを得るための手法を確立しました。これは長い道のりであり、ビデオの処理、メディアメトリクスの理解、それらの関連付け、大規模なデータベースへの保存、日々増加し続けるデータの管理など、多くの要素が含まれています。
アーキテクチャの右上部分は、11のチャネルからのデータとクリエイティブの取り込み方法を示しています。自動スケーリングメカニズムを採用しており、ビデオを取り込み、フレームに分割し、SageMakerと通信することで各フレームを理解します。SageMakerでは私たちの独自モデルをホストしています。
SageMakerへの移行は、私たちにとって大きな転換点でした。以前は、データサイエンスのリリースやトレーニングに長時間を要していましたが、SageMakerによってデータサイエンスチームに権限を与え、サービスを私たちの分析とソリューションの一部として展開できるようになりました。
私たちは、Amazon Recognitionなどの既存のサービスも活用していますが、それらをすべて組み合わせて、画像全体の理解を構築しています。また、メディアメトリクスを取得して相関関係を見出し、このクリエイティブデータを蒸留しています。このデータは、今後どのようなインサイトを引き出すかを見ていく上で重要な役割を果たします。
データの増加に伴い、高性能なデータベースでの保存が重要です。私たちはSnowflakeを使用してこれらの相関関係をすべて保存し、ベクターデータベースを活用して、会話型UIを構築する際にどのようなインサイトを引き出すべきかを理解しています。Amazon Bedrockの活用により、異なるモデルをテストし、マルチモデルと接続し、顧客が独自のモデルを持っている場合にはそれらのモデルも使用できるようになりました。コードを変更することなく、モデルを切り替えることができるのは非常に強力な機能です。
4.4 RAGパイプラインの実装と課題
Mickey Alon(Chief Technology Officer and Chief Product Officer at VidMob):
私たちは、Retrieval Augmented Generation(RAG)アーキテクチャを活用したパイプラインを構築し、これにより会話型UIでのコパイロットのプロンプトを処理できるようになりました。このRAGアーキテクチャにより、複数のデータベースにアクセスし、異なる領域にまたがるデータを処理することが可能になっています。
しかし、このアーキテクチャを実装する上でいくつかの課題に直面しました。まず、ベクターデータベースの設計において、質問やプロンプトが複数のデータソースを必要とし、それらをまたがる場合の処理が課題となりました。これに対して、私たちはプロンプトを分類し、関連するベクターを使用して対応する方法を採用しています。
また、インサイトを求めるプロンプト、特に複雑なインサイトを必要とする場合、すべてのデータを分析する必要があります。これは、LLMがマルチステップを使用し、コンテキストを理解する必要があることを意味します。単にLLMにデータの束を投げ込むだけでは答えは得られません。ブランドの目的や達成したい目標を理解するためのコンテキストを、時間をかけて提供する必要があります。
さらに、会話型UIを製品に導入する際には、フィードバックメカニズムも同時に導入することが重要です。これにより、顧客が「このインサイトは素晴らしい」あるいは「これは適切ではない」といったフィードバックを提供できるようになります。エージェントが適切な回答を提供しなかった場合や、幻覚が発生した場合に、どのモデルがパフォーマンスを発揮できなかったのか、何が問題だったのかを理解することが課題の一つでした。
私たちのシステムでは、LLMへの制御の委譲度合いによって出力の予測可能性が変化することに気付きました。マルチステップでは特に、LLMに与える制御が多いほど、予測可能性が低下する傾向がありました。この課題に対して、まずクラシファイアを構築してどのルートを取るべきかを判断し、エージェントからある程度の制御を取り除くことで、より予測可能な結果を得られるように設計を変更しました。
将来的には、より多くのサービスを公開するにつれて、より自律的なシステムになっていくと考えていますが、現時点ではLLMがまだ成熟段階にあり、このような対応が必要だと考えています。
4.5 Adobe統合による実践的活用
Mickey Alon(Chief Technology Officer and Chief Product Officer at VidMob):
私たちは、独自のエディターを作成する代わりに、Adobeとのパートナーシップを選択し、VidMobプラグインをAdobeスイートに統合することを決定しました。このプラグインは、Photoshop、After Effect、Premiere Proで動作し、私たちのクリエイティブデータ、つまりクリエイティブ要素とインサイトへの導管として機能します。
このプラグインでは、Amazon BedrockとRAGを活用して、マルチモーダルなテキストから画像、テキストからLLMモデルに情報を提供し、何を生成すべきかを指示します。パーソナライゼーションの観点から考えると、これは非常に大きな可能性を秘めています。インサイトやクライアントの好みに基づいて、大量のクリエイティブを迅速に生成することが可能です。
私たちは、同じインサイトをコパイロットで見たものをこのブランドに適用し、その結果を確認しました。最初のプロンプトでは、クリエイティブデータを使用せずにTitanモデルに単純にペットケアブランドのCTAつきクリエイティブの生成を依頼しました。結果は良好でしたが、テーブルの上の食べ物の横にいる人物やCTAがないなど、期待とは異なる点がありました。
次に、クリエイティブデータをRAGを通じてクリエイティブに注入したところ、インサイトに基づいて構造化された広告が生成されました。これらのインサイトは、以前に見たものと同じで、TikTokでのクリックスルー率を向上させるペットとの本物の瞬間を捉えています。Titanがこれを取り込み、すぐに使用できる状態のクリエイティブを生成しました。最後の調整や微調整は可能ですが、基本的にすぐに使用できる状態です。将来的にはNovaもサポートする予定です。
また、数十万のアセットを生成する可能性を考慮して、エンドポイントに直接組み込まれた品質スコアリングメカニズムも実装しています。これはAdobeのAfter Effectで、クリエイティブをアップロードしてブランドのベストプラクティス、要件、一貫性を満たしているかを確認できます。これにより、パフォーマンスだけでなく、効率性も大幅に向上します。
4.6 初期の実験結果
Mickey Alon(Chief Technology Officer and Chief Product Officer at VidMob):
現在クローズドベータ段階ですが、初期の実験結果は非常に有望なものとなっています。まず、クリエイティブ戦略の理解にかかる時間が大幅に短縮されました。従来、クリエイティブストラテジストがブランドを理解し、4〜5つの異なる分析レポートを検討してスライスアンドダイスし、インサイトを見出すには数時間を要していました。現在は、プロンプトを通じてこれを実現でき、システムは継続的に改善を重ねています。
効率性の面では、各クリエイティブの生成には通常、マーケターが本当に求めているものを実現し、ベストプラクティスに合致するまでに多くのコミュニケーションと試行錯誤が必要でした。私たちのシステムにより、このサイクルを25%効率化することができました。
さらに、生成できるクリエイティブの量とバリエーションは10倍以上に増加しています。実際、この数値は上限に達しているわけではありません。ブランドが提供したいデータの粒度に応じて、異なるアセットを生成し、迅速に展開することが可能です。
AWSとのパートナーシップは、この急速に進化する業界において非常に有益でした。Bedrockへの迅速な接続、SageMakerの運用準備、そして迅速なイノベーションの継続を支援してくれました。
クリエイティブ効果の革新について考えると、将来的にはプロンプトがクリエイティブそのものになっていくと考えています。ブランドの動きが遅くなることは、ますます少なくなっていくでしょう。
また、AIモデルの進化は継続的な journey であり、私たちはRAGアーキテクチャとBedrockを活用することで、大規模なコード変更なしに迅速に適応できています。新しいモデルが登場した場合でも、単純な切り替えで対応が可能です。
最後に、brands がGen AIを安心して使用できるよう、より多くのクリエイティブ品質管理を提供することにコミットしています。一部のブランドは依然としてブランドリスクを懸念しており、制御なしでの使用を躊躇しているためです。