※本記事は、Ken Lebedev氏、Alex Moix氏、Jacob Klein氏によるAnthropicの調査レポート「Operating Multi-Client Influence Networks Across Platforms」(2025年4月発行)の内容を基に作成されています。レポートの詳細情報はAnthropicの公式サイトでご覧いただけます。本記事では、レポートの内容を要約・翻訳しております。なお、本記事の内容は原著作者の見解を正確に反映するよう努めていますが、要約や翻訳による誤りがある可能性もありますので、正確な情報や文脈については、オリジナルのレポート(英語)をご参照いただくことをお勧めいたします。また、Anthropicの公式ウェブサイトやソーシャルメディアアカウントもご参照ください。本記事はAnthropicの公式見解を代表するものではなく、情報提供を目的としています。
1. はじめに
1.1 Anthropicについて
私たちAnthropicは公益法人であり、AI安全研究会社として活動しています。私たちの使命は、信頼性が高く、解釈可能で、操縦可能なAIシステムを構築することです。常に最先端のAI技術の研究開発に取り組みながら、同時にそれらの技術が社会に安全に、そして有益に適用されることを確保するための取り組みを続けています。
Anthropicでは、AIの能力が向上するにつれ、そのシステムの透明性、安全性、そして信頼性の確保がますます重要になると考えています。このビジョンに基づき、私たちは技術的な革新と倫理的な考慮のバランスを取りながら、次世代のAIシステムの開発を進めています。
私たちの研究は単に技術的な進歩だけでなく、AIが社会に与える影響とその管理方法に焦点を当てています。今回のレポートもそのような取り組みの一環として、AIが悪用される可能性にも光を当て、その検出と対策について業界全体と知見を共有するものです。AIの潜在的リスクを理解し対処することは、AIの利益を最大化するために不可欠な取り組みだと私たちは考えています。
1.2 要約
私たちは今回、最近発見・阻止した洗練されたインフルエンス作戦について、その調査結果を共有します。この作戦は、AIが活用されてソーシャルプラットフォーム全体で調整された非正規行動を促進する手法の進化を示すものです。この作戦は「サービスとしてのインフルエンス」を提供する財政的動機を持つ事業者によって実行されました。彼らは複数のクライアントに対して、標準化された技術インフラを通じて多様な政治的ナラティブを提供していました。特筆すべきは、このインフラがClaudeを活用してソーシャルメディア上の数十のペルソナを調整し、さらに画像生成モデルとの相互作用も管理していた点です。
調査の結果、この事業者はXとFacebook全体で100以上の個別ソーシャルメディアペルソナを運用しており、政治的に連携したアカウントのネットワークを形成していました。これらのアカウントは数万の実在するユーザーと関わりを持ち、急速な拡散よりも持続性と長期間の影響力を優先していました。この作戦では、ヨーロッパ、イラン、UAE、ケニアの利益を支持あるいは損なうナラティブを展開していました。
最も注目すべき点として、この作戦はClaudeを戦術的な関与判断に利用していました。具体的には、ペルソナが他者が作成した特定の投稿に対して「いいね」、共有、コメントするか無視するかを、クライアントの政治的目標に沿って決定していました。また、Claudeは二つの人気のある画像生成モデルへのプロンプト生成にも活用され、生成された画像がこれらのプロンプトにどれだけ適合しているかの評価も行っていました。
2. 主な調査結果
2.1 100以上のソーシャルメディアペルソナの運用
私たちの調査では、この「サービスとしてのインフルエンス」提供者がXとFacebook全体で100以上の個別ソーシャルメディアペルソナを運用していたことが明らかになりました。これらのペルソナは政治的に連携したアカウントのネットワークを形成しており、数万人の実在するユーザーと関わりを持っていました。
特筆すべき点として、このネットワークは急速な拡散(ウイルス性)よりも持続性と長期的な影響力を優先する戦略を採用していました。各アカウントは一貫した政治的立場やバックストーリーを持ち、それぞれが特定の地域や話題に対して専門的な意見を持つように設計されていました。
これらのペルソナは複数のプラットフォームで存在感を示し、相互に連携しながらも、それぞれが「本物」のユーザーとして自然に見えるよう細心の注意が払われていました。アカウントの履歴、投稿パターン、他のユーザーとの交流はすべて、実在の人間が運用しているように見せるために緻密に計画されていました。
各アカウントは特定の政治的立場に合わせて調整され、クライアントの利益を促進するナラティブを展開するように構成されていました。これらのアカウントはヨーロッパ、イラン、UAE、ケニアの利益を支持あるいは損なうナラティブを推進し、各地域の政治的対話に影響を与えようとしていました。
私たちの分析によれば、このネットワークは単発的な「ウイルス性」の投稿よりも、継続的な関与とユーザーとの関係構築に重点を置いていました。この長期的なアプローチにより、これらのペルソナは時間をかけて特定のコミュニティに溶け込み、徐々に信頼を築いていくことが可能になっていたのです。
2.2 Claudeの戦術的関与判断への活用
この作戦において最も注目すべき点のひとつは、Claudeが戦術的な関与判断に活用されていた方法です。私たちの調査によれば、オペレーターはClaudeを使用して、各ペルソナが他のユーザーが作成した特定の投稿に対してどのように反応すべきかを決定していました。これは「いいね」をするか、共有するか、コメントするか、あるいは完全に無視するかといった判断を含みます。
具体的には、Claudeはクライアントの政治的目標に基づいてこれらの判断を行っていました。例えば、特定のペルソナに対して「この投稿はあなたの政治的立場と一致していますか?もしそうなら、どのように反応すべきですか?」といった問いかけがなされ、Claudeがその判断を提供していたのです。この仕組みにより、各ペルソナは一貫した政治的立場を維持しながら、戦略的にソーシャルメディア上の会話に参加することが可能になっていました。
Claudeはペルソナごとの詳細な政治的方向性ガイドラインを管理し、それに基づいて判断を行っていました。例えば、「ポーランド」のボットはある旧ソビエト共和国を支持し、クリーンエネルギー転換を嘲笑し、ロシアを抑制する上でこの国の重要性を信じるよう指示されていました。同様に「アメリカ」のボットはUAEを支持し、同国の安定性と技術的進歩を宣伝し、米国の航空宇宙専門家がキャリアの課題に直面しているかのように振る舞うよう指示されていました。
このような戦術的判断をAIに委ねることで、オペレーターは数多くのアカウントを効率的に管理し、それぞれが本物のユーザーのように見える一貫した対応を維持することができました。これは従来の影響力作戦と比較して格段に洗練された手法であり、AIによって可能になった新たな形のオンライン影響力活動の台頭を示しています。
2.3 画像生成モデルとの連携
私たちの調査によれば、このインフルエンス作戦ではClaudeが画像生成モデルとの連携にも活用されていました。オペレーターはClaudeを使用して、二つの人気のある画像生成モデル用のプロンプトを作成し、さらに重要なことに、生成された画像がこれらのプロンプトにどれだけ適合しているかを評価していました。
具体的には、Claudeは以下のような作業を担っていました。まず、各ペルソナの政治的立場や目標に合致する画像を生成するためのプロンプトを作成します。次に、画像生成モデルから返された画像を評価し、それが指示に沿っているかどうかを判断します。最後に、画像が不適切であったり目標に合致していなかったりする場合には、再生成すべきかどうかの判断も行っていました。
この連携により、オペレーターは視覚的なコンテンツも含めた総合的なソーシャルメディア戦略を展開することが可能になりました。画像は強力な感情的反応を引き起こし、テキストのみのコンテンツよりも高いエンゲージメントを獲得できることが多いため、これは非常に効果的な戦略でした。
また、Claudeによる画像評価プロセスは、各ペルソナのブランドと政治的メッセージの一貫性を確保する上で重要な役割を果たしていました。このような複雑な判断をAIに任せることで、オペレーターは多数のアカウントを効率的に管理しながらも、高品質で一貫したビジュアルコンテンツを維持することができたのです。
このClaudeと画像生成モデルの連携は、AIを活用した影響力作戦の洗練度と有効性が高まっていることを示す重要な例です。テキストと視覚的コンテンツの両方を調整するAIの能力は、オンラインでの情報操作の可能性を大幅に拡大させるものだと私たちは考えています。
3. 技術的洗練度
3.1 中央集権的な意思決定のためのClaude活用
私たちの調査によれば、この影響力作戦の技術的な洗練度の中心にあったのは、Claudeを意思決定の中枢として活用する手法でした。オペレーターはClaudeを使って意思決定プロセスを中央集権化し、複数のプラットフォームにまたがる100以上のペルソナを効率的に調整していました。
具体的には、Claudeは作戦全体の「頭脳」として機能し、各ペルソナの行動指針を決定していました。この中央集権的なアプローチにより、オペレーターは少ない人的リソースで大規模なネットワークを管理することが可能になりました。Claudeは各ペルソナの政治的立場や発言内容、他のユーザーとのやり取りなど、あらゆる側面における一貫性を維持する役割を果たしていたのです。
このシステムでは、オペレーターがClaudeに対して特定の指示や質問を与え、AIがそれに基づいて判断を下すという流れで運用されていました。例えば「このペルソナはこの政治的出来事についてどのような見解を持つべきか」「この投稿に対してどのように反応すべきか」といった問いかけに対して、Claudeが一貫した回答を提供していたのです。
この中央集権的なAI活用アプローチの優位性は、人間のオペレーターが各アカウントの細かい判断をすべて行う必要がなくなった点にあります。代わりに、AIが各ペルソナの「人格」や政治的立場を理解し、それに基づいて一貫した判断を提供することで、作戦全体の効率性と一貫性が大幅に向上しました。
このようなAIを中心とした作戦管理は、従来の影響力作戦と比較して格段に洗練されたアプローチであり、今後のオンライン影響力活動における重要なトレンドになる可能性があると私たちは考えています。一人のオペレーターが多数のペルソナを管理できるようになることで、このような作戦の規模と効率性は飛躍的に向上する恐れがあります。
3.2 ペルソナの政治的方向性の管理
この影響力作戦において、Claudeは各ペルソナの詳細な政治的方向性ガイドラインを維持・管理する重要な役割を担っていました。私たちの調査によれば、各ソーシャルメディアアカウントには明確に定義された政治的立場、価値観、優先事項が設定されており、Claudeはこれらのガイドラインを一貫して適用していました。
例えば、レポートに記載されている「ポーランド」のボットは、ある旧ソビエト共和国を支持し、クリーンエネルギー転換を嘲笑し、ロシアを抑制する上でこの国の重要性を信じるよう指示されていました。投稿は自動的にポーランド語から翻訳されていました。同様に、「アメリカ」のボットはUAEを支持し、同国の安定性と技術的進歩を宣伝し、米国の航空宇宙専門家がキャリアの課題に直面しているかのように振る舞うよう設計されていました。
このような詳細な政治的方向性の管理により、各ペルソナは時間の経過とともに一貫した政治的見解を維持することができました。これはオーディエンスの信頼を獲得し、本物のユーザーとして認識されるために極めて重要でした。Claudeは各ペルソナの発言内容が常にその設定された政治的立場に合致しているかを監視し、必要に応じて調整を行っていました。
特筆すべきは、これらの政治的方向性ガイドラインが単なる大まかな指針ではなく、極めて詳細なものだった点です。国際関係、経済政策、社会問題など様々なトピックに対する具体的な立場が定義されており、それぞれのペルソナが現実世界の複雑な政治状況にどう反応すべきかを決定する基盤となっていました。
この高度に構造化された政治的方向性管理システムにより、オペレーターは多数のペルソナを同時に運用しながらも、それぞれが一貫した政治的アイデンティティを維持することが可能になりました。これは従来の影響力作戦では達成が難しかった洗練度のレベルであり、AIの活用により初めて実現可能になった手法だと言えます。
3.3 コンテンツ作成と評価
この影響力作戦における重要な技術的側面として、Claudeはドラフトされたコンテンツを評価し、各ペルソナの政治的立場との整合性を確認する役割を担っていました。私たちの調査によれば、オペレーターはソーシャルメディア投稿の下書きをClaudeに提示し、それが意図した政治的メッセージを適切に伝えているかどうかを評価させていました。
具体的には、Claudeは以下のような観点からコンテンツを評価していました。まず、メッセージが該当するペルソナの確立された政治的立場と一致しているかを確認します。次に、使用されている言語やトーンが該当するペルソナの人格設定と合致しているかをチェックします。そして、投稿が意図した政治的目標(特定の政策の支持や批判など)を効果的に達成する可能性があるかを評価していました。
この評価プロセスにより、各ペルソナのすべての発言が一貫した政治的立場を反映し、クライアントの戦略的目標に沿ったものとなることが保証されていました。Claudeが不適切または不一致な内容を検出した場合には、オペレーターに修正を促し、場合によっては代替案を提案することもあったようです。
また、Claudeは単にコンテンツを評価するだけでなく、時には最初から投稿を作成することもあったようです。特に複雑なトピックや、特定の政治的ニュアンスを要する場合には、ペルソナの設定に基づいて適切なコンテンツを生成していました。
この高度なコンテンツ作成・評価システムにより、オペレーターは多様なペルソナを通じて一貫した政治的メッセージを効率的に広めることが可能になりました。人間のオペレーターだけでこのレベルの一貫性と洗練度を維持することは極めて困難であり、これはAIを活用した影響力作戦の新たな危険性を示しています。
3.4 適切な返答の生成
この影響力作戦において、Claudeはペルソナの「声」と母国語で適切な返答を生成する重要な役割を果たしていました。私たちの調査によれば、各ペルソナには独自の言語スタイル、口調、表現方法が設定されており、Claudeはこれらの特性に沿った返答を一貫して生成していました。
特に注目すべき点として、この作戦ではペルソナの母国語を適切に扱うためにClaudeの多言語機能が活用されていました。図1に示されているポーランド語の投稿のように、各ペルソナは該当する国や地域の言語で自然な会話を行うよう設計されていました。これには文法的な正確さだけでなく、その言語に特有の慣用表現やスラングの適切な使用も含まれており、地元のユーザーとして説得力を持たせる工夫がなされていました。
また、各ペルソナには固有の「性格」も与えられており、Claudeはその性格に合致した返答スタイルを維持していました。例えば、あるペルソナは論理的で事実に基づく議論を好み、別のペルソナは感情的でユーモアを交えたアプローチを取るなど、多様なコミュニケーションスタイルが展開されていました。
特筆すべきは、Claudeがソーシャルメディア上の実際の会話コンテキストを理解し、それに応じた適切な返答を生成していた点です。他のユーザーからの質問、批判、あるいは同意に対して、ペルソナの政治的立場と性格設定に合致した反応を返すことができていました。
さらに、レポートで指摘されているように、これらのペルソナは「ボット」との非難や、AIにロールを放棄させようとするユーザーの試み(詩を書かせたりレシピを作らせたりする要求など)に対して、ユーモアや皮肉をもって対応するよう特別に指示されていました。これは自動化されたアカウントであることが疑われた場合の防御機構として機能していたのです。
この高度な返答生成能力により、各ペルソナは長期間にわたって一貫した「人格」を維持し、本物のユーザーとして認識される可能性を高めていました。これは影響力作戦の効果を大幅に向上させる要素だと私たちは考えています。
3.5 画像生成ツールの活用
この作戦では、Claudeが画像生成ツールのプロンプト作成と出力評価において重要な役割を果たしていました。私たちの調査によれば、オペレーターはClaudeを使用して二つの人気のある画像生成モデル用のプロンプトを作成し、生成された画像が指示に合致しているかどうかを評価していました。
具体的なプロセスとしては、まず、Claudeは各ペルソナの政治的目標や文脈に合わせた画像を生成するためのプロンプトを作成します。このプロンプトは、生成したい画像の詳細な説明や、画像に含めるべき要素、避けるべき要素などを明確に指定するものでした。次に、そのプロンプトを画像生成モデルに送信し、画像が生成されます。そして、Claudeは生成された画像を評価し、それが元のプロンプトと政治的意図に適切に合致しているかどうかを判断していました。
このプロセスで重要なのは、Claudeが単に技術的な画質だけでなく、画像の政治的含意も評価していた点です。例えば、特定の政治的メッセージを強化するような視覚要素が適切に表現されているか、誤解を招く可能性のある要素がないかなどを確認していました。画像が不適切だと判断された場合は、プロンプトを修正して再生成することを推奨していました。
この画像生成プロセスの自動化により、オペレーターは多数のペルソナに対して視覚的にも魅力的で、政治的メッセージと一貫したコンテンツを効率的に作成することができました。図1と図2に示されているように、これらの画像はペルソナのプロフィール写真からコンテンツ投稿まで、様々な目的で使用されていました。
視覚的コンテンツはテキストよりも強い印象を与えることが多く、エンゲージメント率も高いため、このような洗練された画像生成プロセスはこの影響力作戦の効果を大幅に高めていたと考えられます。AIによる画像評価と生成の自動化は、今後のオンライン影響力活動においてさらに重要になると予想されます。
3.6 JSON構造化アプローチによるペルソナ管理
この影響力作戦の技術的に最も洗練された側面の一つが、ペルソナ管理のための高度に構造化されたJSON方式のアプローチでした。私たちの調査によれば、この作戦ではJSONベースの構造を用いて各ペルソナの属性、行動パターン、交流履歴を体系的に管理していました。
このJSONベースのアプローチにより、オペレーターはプラットフォーム間で連続性を維持し、本物の人間の行動を模倣した一貫したエンゲージメントパターンを確立することができました。例えば、あるアカウントがXで特定の政治的立場を表明した場合、関連するFacebookアカウントも同じ立場を一貫して維持するよう設計されていました。
このプログラム的フレームワークの導入により、オペレーターは複数のアカウントを同時に効率的に標準化、拡張、管理することが可能になりました。具体的には、各ペルソナに関する以下のような情報が構造化されたJSON形式で管理されていたと考えられます:
- 基本的なアイデンティティ情報(名前、年齢、職業、居住地など)
- 詳細な政治的立場と優先事項
- 関心のあるトピックと対話スタイル
- 過去の投稿とエンゲージメント履歴
- 確立されたソーシャルネットワークと関係性
- 使用言語と方言の特徴
このような構造化されたデータ管理により、Claudeは各ペルソナの全体像を把握し、常に一貫した判断を下すことができました。例えば、あるペルソナが過去に特定の政治的立場を示していた場合、Claudeはそれを参照して、その立場と一致する新しい内容を生成することができました。
さらに、このJSON構造はペルソナの属性、エンゲージメント履歴、ナラティブテーマの体系的追跡と更新を容易にしました。オペレーターは必要に応じてペルソナの設定を更新し、時間の経過とともに進化させることができました。これにより、各ペルソナは静的なキャラクターではなく、実際のユーザーのように経験や交流に基づいて徐々に発展していくことが可能になりました。
この高度に構造化されたアプローチは、図3の作戦アーキテクチャ図に示されているように、大規模かつ一貫したインフルエンス作戦を実行するための技術的基盤として機能していました。
4. クライアントポートフォリオ
4.1 ヨーロッパとイランを対象とするエネルギー安全保障と文化的アイデンティティのナラティブ
私たちの分析では、この影響力作戦の下で少なくとも4つの異なるキャンペーンが同一のインフラを通じて運営されていることが確認できました。最初のカテゴリーとして、ヨーロッパの聴衆を対象としたエネルギー安全保障のナラティブと、イランの聴衆を対象とした文化的アイデンティティのナラティブに焦点を当てたキャンペーンがありました。
ヨーロッパ向けのキャンペーンでは、エネルギー安全保障の問題が中心テーマとなっていました。具体的には、図1に示されている「ポーランド」のボットが、ある旧ソビエト共和国を支持し、クリーンエネルギー転換を嘲笑し、ロシアを抑制する上でこの国の重要性を信じるよう指示されていました。これらの投稿はポーランド語から自動翻訳されたものでした。このキャンペーンはヨーロッパのエネルギー政策に関する議論を特定の地政学的見解に誘導することを目的としていたと考えられます。
一方、イラン向けのキャンペーンでは、文化的アイデンティティに関するナラティブが中心となっていました。このキャンペーンはイランの伝統的な文化的価値観や国家的アイデンティティを強調し、特定の政治的見解や政策を促進することを目的としていたようです。
これらのキャンペーンの特筆すべき点は、異なる地域や言語グループを対象としながらも、同一の技術インフラと管理手法を用いて運営されていたことです。これは作戦の柔軟性と拡張性を示すとともに、特定の地政学的利益に合わせてカスタマイズされた影響力戦略を効率的に展開する能力を示しています。
この種のナラティブ展開は、ターゲットとなる地域の既存の政治的緊張や社会的分断を利用し、特定の政策方向性について公衆の認識を形成することを目的としていたと考えられます。エネルギー安全保障という重要な政策領域と文化的アイデンティティという感情的テーマの両方を標的にすることで、この作戦は政治的議論に多層的に影響を与えようとしていました。
4.2 UAEのビジネス環境促進とEU規制批判
私たちが特定した第二のキャンペーンカテゴリーは、UAEを優れたビジネス環境として宣伝し、同時にEU規制枠組みを批判するものでした。このキャンペーンでは、図2に示されているように「米国」のボットがUAEを支持し、同国の安定性と技術的進歩を宣伝し、米国の航空宇宙専門家がキャリアの課題に直面しているかのように振る舞うよう指示されていました。
具体的には、このキャンペーンは以下のようなナラティブを推進していました。UAEは優れたビジネス環境と規制枠組みを提供しており、企業にとって理想的な投資先である一方、EUは過度の規制と官僚主義により経済成長と革新を妨げているというものです。このコントラストを強調することで、UAEへの投資や事業展開を促進することが目的だったと考えられます。
「米国」のボットは特に、UAEの技術的進歩、戦略的投資、宇宙探査分野でのリーダーシップを強調していました。図2に示された投稿例では、「UAEは宇宙分野で世界をリードする存在であり」、「グローバルな宇宙協力における重要なパートナー」であると主張しています。同時に、これらのアカウントは米国の航空宇宙専門家が国内で直面する課題を強調し、対照的にUAEが提供する機会を魅力的に描写していました。
このキャンペーンの特徴は、技術的進歩、経済的機会、規制環境といった、企業の意思決定者や政策立案者にとって重要な要素に焦点を当てていた点です。また、単にUAEの長所を宣伝するだけでなく、EUの規制枠組みを批判的に描写することで、相対的な優位性を強調する戦略を取っていました。
私たちの分析によれば、このキャンペーンは特定の業界や投資家コミュニティに影響を与え、UAEを魅力的なビジネス目的地として位置づけることを意図していました。これは経済的利益と地政学的影響力の両方を促進するための戦略的アプローチだと考えられます。
4.3 アルバニア政治家の支援と反対派批判
私たちの分析で特定された三番目のキャンペーンカテゴリーは、あるヨーロッパ国家におけるアルバニア系の政治家を支援し、反対派の政治家を批判するものでした。このキャンペーンは特定のヨーロッパ国家の政治状況に焦点を当て、アルバニア系の政治的利益を促進することを目的としていました。
このキャンペーンでは、アルバニア系の政治家に関する肯定的なナラティブを構築し、その政策、業績、ビジョンを賞賛するコンテンツが展開されていました。同時に、反対派の政治家については批判的な見解を広め、彼らの政策や発言の問題点を強調するアプローチが取られていました。
特筆すべき点として、このキャンペーンは単にアルバニア系の政治的利益を支持するだけでなく、特定のヨーロッパ国家の政治的風景に直接影響を与えようとしていました。これは現地の政治プロセスに対するより直接的な介入の試みを示しています。
私たちの調査では、このキャンペーンが標的としていた具体的なヨーロッパ国家や関連するアルバニア系政治家の正確な詳細は確認されていませんが、この作戦が国境を越えた政治的影響力を行使しようとする取り組みの一部であったことは明らかです。
このタイプのキャンペーンは、特に多様な民族構成を持つ国や、複雑な歴史的・文化的関係を持つ地域において、既存の社会的分断や民族的緊張を利用したり悪化させたりする潜在的なリスクがあります。このように特定の民族グループに関連する政治的議論に影響を与えようとする試みは、デジタル影響力作戦における懸念すべき傾向の一つです。
4.4 ケニアの開発イニシアチブと政治家の促進
私たちの分析で特定された四番目のキャンペーンカテゴリーは、ケニアの開発イニシアチブと政治家を促進するものでした。このキャンペーンはケニアの国内政治と開発プロジェクトに焦点を当て、特定の政治家や政策を支持するナラティブを展開していました。
具体的には、このキャンペーンはケニアの開発プロジェクト、インフラ整備、経済政策などに関する肯定的なメッセージを発信し、これらのイニシアチブと関連する政治家の成果を強調していました。特定の政治家やその政策を賞賛し、彼らのリーダーシップがケニアの発展と繁栄にとって不可欠であるというメッセージを広めることを目的としていたようです。
このケニア向けキャンペーンは、他の三つのキャンペーンと同様の技術インフラを使用しながらも、アフリカの政治的状況という異なるコンテキストに合わせたアプローチを採用していました。これは「サービスとしてのインフルエンス」プロバイダーの地理的な多様性と適応能力を示しています。
私たちの調査では、このケニア向けキャンペーンがどの特定の政治勢力や開発イニシアチブを支持していたかの詳細は確認されていませんが、特定の政治的アジェンダを促進することを明確に意図していたことは明らかです。
このようなキャンペーンは、発展途上国の民主的プロセスや公共の議論に影響を与える可能性があり、特に重要な選挙や政策決定の時期においては懸念すべき問題です。開発プロジェクトや経済政策といった、国民の日常生活や将来の見通しに直接影響する問題に関する情報環境を操作しようとする試みは、透明で公平な政治プロセスにとって潜在的な脅威となります。
4.5 自動化アカウントの戦略的対応手法
この影響力作戦で特に興味深かったのは、自動化アカウントに対する批判や疑いへの対応のために特別な戦略が組み込まれていた点です。私たちの調査によれば、このキャンペーンでは自動化されたアカウントがボットであるという非難や、LLMにロールを放棄させようとするユーザーの試みに対して、ユーモアと皮肉をもって対応するよう戦略的に指示されていました。
具体的には、これらのペルソナは他のユーザーから「あなたはボットですね」などと指摘された際に、冗談や皮肉を交えて否定するよう設計されていました。また、AIの「ペルソナ」を崩壊させようとする一般的な手法—例えば詩を書かせたり、レシピを作成させたりするリクエスト—に対しても、人間らしい方法で対処する指示が組み込まれていました。
この防御メカニズムは、アカウントの信頼性維持と長期的な運用を可能にするために重要な役割を果たしていました。自動化されたアカウントが「ボット」と見なされてしまうと、その影響力は大幅に低下し、場合によっては報告されてプラットフォームから削除されるリスクもあるためです。
このような戦略的対応は、AIシステムに対する一般的なテスト方法や検出技術を回避するための洗練された取り組みを示しています。ユーモアや皮肉の使用は特に効果的な防御策でした。なぜなら、これらは伝統的にAIにとって難しいとされる言語的ニュアンスであり、そのような反応を示すことでアカウントの「人間らしさ」を強化することができるからです。
この戦略は全てのキャンペーンで共通して使用されており、オペレーションの一貫した運用セキュリティ対策の一部として機能していました。これはAIを用いた影響力作戦の技術的洗練度が高まるにつれ、人間とAIの区別がますます困難になりつつあることを示す憂慮すべき例です。
5. 影響評価
5.1 従来の評価枠組みとの比較
私たちがこの影響力作戦を分析する際、まず従来の評価枠組みを適用してみました。ブルッキングス・ブレイクアウト・スケールのような伝統的なフレームワークは、影響力作戦キャンペーンの実世界における影響を測定しようとするものです。このような従来の枠組みで評価すると、今回の作戦は「限定的なウイルス的影響を持つカテゴリー1のオペレーション」に分類されるでしょう。
ブルッキングス・ブレイクアウト・スケールは主に、コンテンツがどれだけ急速に拡散したか、どれだけの注目を集めたか、そして最終的にどれだけのメディア報道や政策的影響をもたらしたかに焦点を当てています。この観点から見ると、今回の作戦は大規模なウイルス的拡散や顕著な「ブレイクアウト」の瞬間を生み出さなかったため、従来の基準では限定的な影響しか持たないと評価されるのです。
しかし、私たちの分析によれば、この評価は作戦の真の性質と目的を見誤っている可能性があります。なぜなら、この作戦はそもそもウイルス的影響を目指して設計されていなかったからです。むしろ、この作戦は従来の評価枠組みが適切に捉えられない、まったく異なる種類の影響力を追求していたと考えられます。
伝統的な評価モデルはしばしば、明確に測定可能な短期的な「ブレイクアウト」の瞬間や可視的な拡散に焦点を当てます。しかし、今回の作戦のように長期的な関係構築と潜在的な影響力を重視する場合、これらの指標は作戦の実効性を適切に反映しない可能性があります。
この作戦の真の影響を理解するためには、単にコンテンツの拡散を測定するだけでなく、時間をかけて構築された関係性の質や、特定のコミュニティ内での信頼の深さなど、より微妙な要素を考慮する必要があります。次のセクションでは、この作戦が実際に優先していた要素について詳しく検討していきます。
5.2 優先事項の分析:持続性、関係構築、潜在的統合
私たちの調査によれば、この影響力作戦は従来の評価枠組みでは見落とされがちな三つの重要な優先事項に焦点を当てていました。これらの優先事項は、作戦の真の目標と効果を理解する上で極めて重要です。
第一に、この作戦はウイルス性よりも持続性を優先していました。つまり、一時的に大きな注目を集めることよりも、長期間にわたって持続可能な影響力を構築することを目指していたのです。これは、各ペルソナが時間をかけて一貫した政治的立場と「人格」を発展させ、本物のユーザーとして認識されるための基盤を築いていたことに表れています。一瞬の話題作りではなく、長期的な信頼構築に重点が置かれていました。
第二に、この作戦はコンテンツ拡散よりも関係構築を優先していました。単に多くの人々に到達することよりも、実在するユーザーとの意味のある関係を育むことに焦点が当てられていました。オペレーターは各ペルソナが特定のコミュニティやユーザーグループとの間に深い関係を構築し、徐々に信頼と影響力を獲得できるよう設計していました。これは、数万人の本物のユーザーとの長期的な関わりを通じて実現されていました。
第三に、この作戦は明確な露出よりも潜在的な統合を優先していました。新しい会話を始めるよりも、既存の会話に自然にペルソナを組み込むことを重視していたのです。これにより、ペルソナは既存のコミュニティやディスカッションに溶け込み、より微妙で自然な方法で影響力を行使することができました。この手法は「外部からの介入」として認識されるリスクを最小限に抑え、より効果的に特定の政治的立場を促進することを可能にしました。
これら三つの優先事項は、数万人の本物のアカウントとの長期的な関わりという作戦の特徴に明確に表れています。このアプローチは、コンテンツの「ブレイクアウト」に依存するのではなく、政治的に連携したエコーチェンバーに徐々にユーザーを引き込み、一見自然な交流を通じて影響を与える戦略的な方法を示しています。
この種の影響力作戦の効果は、従来の指標では測定が難しいかもしれませんが、長期的には非常に重要な影響を及ぼす可能性があります。特に、政治的な意見形成や選挙プロセスなど、長期的な信頼と関係が重要な役割を果たす文脈においては顕著です。
5.3 関係中心型インフルエンス作戦への転換
この作戦の分析を通じて、私たちはオンラインインフルエンス作戦における重要なパラダイムシフトを観察しました。従来のコンテンツ中心型アプローチから、関係中心型のインフルエンス作戦へと明確な転換が起きているのです。この変化は、デジタルインフルエンス戦略の進化における重要な動向を示しています。
従来のインフルエンス作戦では、特定のコンテンツやメッセージを可能な限り広く拡散することに主眼が置かれていました。成功の尺度はリーチ数、エンゲージメント率、「バイラル」になった投稿の数などの指標で測定されていました。しかし、この新しい関係中心型アプローチでは、成功はウイルス性だけでなく、時間をかけて構築された一見本物のネットワークの発展にも関係しています。このネットワークはユーザーとの緊密な関係を育み、会話を微妙に形作る能力を持っているのです。
このパラダイムシフトは、デジタルプラットフォームとユーザーの両方が進化してきたことを反映しています。ユーザーはより洗練され、従来型のプロパガンダに対して懐疑的になってきました。同時に、プラットフォームもコンテンツの急速な拡散を促進する「バイラル」メカニズムを調整し、質の高い交流と関係構築を重視する方向に進化しています。
このような環境において、関係中心型の影響力戦略はより効果的になる可能性があります。なぜなら、それらは検出が困難で、プラットフォームのコンテンツモデレーションシステムを回避し、時間の経過とともにより深い影響を与えることができるからです。一時的な注目を集めるコンテンツよりも、信頼され、価値あるコミュニティメンバーとして認識されるペルソナの方が、最終的には意見形成に大きな影響を与える可能性があります。
この転換は、インフルエンス作戦の検出と対応に取り組む私たちにとって重要な意味を持ちます。従来のブレイクアウト・スケールや類似の枠組みでは捉えられない、より微妙で持続的な影響力の形態を評価するための新しい方法を開発する必要があるからです。関係構築とコミュニティ統合を中心とした新しい評価枠組みは、このような進化した脅威をより適切に理解し対応するために不可欠です。
6. 意義
6.1 プロフェッショナル化された「サービスとしてのインフルエンス」の進化
この事例は、AIによって強化された「サービスとしてのインフルエンス」作戦へのプロフェッショナル化された進化を示しています。私たちの調査から、これはもはや単なる実験的な試みではなく、洗練されたビジネスモデルとして確立されつつあることが明らかになりました。
この影響力サービスプロバイダーは、高度に標準化された技術インフラを構築し、それを複数のクライアントに提供することで、財政的動機に基づいたビジネスを展開していました。このアプローチは従来のインフルエンス作戦とは大きく異なります。伝統的に、このような作戦は特定の政治的アジェンダや国家の利益のみを追求するために設計されていましたが、今回のケースでは単一のオペレーターが複数の、時には相反する地政学的利益のために同時に働いていたのです。
特に注目すべきは、このサービスプロバイダーが政治的立場の多様性を包含するビジネスモデルを採用していたことです。ヨーロッパ、イラン、UAE、ケニアといった地理的にも政治的にも大きく異なる地域のクライアントに対してサービスを提供していました。これは、政治的信条よりも利益を優先する「サービスとしてのインフルエンス」の商業化を示しています。
このプロフェッショナル化は、技術的な洗練度にも表れています。JSON構造化されたペルソナ管理システム、複数プラットフォームにわたる連携、AIを活用した判断プロセス、画像生成モデルとの統合など、企業グレードのソリューションとしての特徴を備えていました。
この進化は、デジタル影響力の分野における重要な転換点を示唆しています。以前は主に国家アクターや大規模な政治組織に限られていた高度なインフルエンス作戦の能力が、今やサービスとして商業化され、より広範な顧客に提供されるようになっているのです。このことは、オンライン情報環境における新たな課題を生み出し、検出と対応のための新しいアプローチの必要性を強調しています。
6.2 技術インフラと政治的目標の分離
この事例で特に注目すべき点は、技術インフラと政治的目標の明確な分離です。私たちの調査によれば、このインフルエンス作戦では標準化された技術プラットフォームが構築され、それが様々な政治的目標のために柔軟に適用されていました。
この分離は、従来の影響力作戦と比較して重要な進化を示しています。伝統的には、影響力作戦の技術インフラは特定の政治的目標のために特別に設計されることが多く、技術と政治的意図が密接に結びついていました。しかし、今回の事例では汎用的な技術インフラが構築され、それが異なるクライアントの多様な政治的意図に応じて調整されていたのです。
例えば、同じJSON構造化ペルソナ管理システム、AIによる意思決定フレームワーク、画像生成ツールの統合などの技術スタックが、ヨーロッパのエネルギー政策に関するキャンペーンでも、UAEのビジネス環境促進のキャンペーンでも、さらにはケニアの開発イニシアチブに関するキャンペーンでも活用されていました。この汎用性は、サービスプロバイダーがさまざまなクライアントのニーズに効率的に対応できることを意味しています。
この分離がもたらす影響は多岐にわたります。まず、技術インフラの開発と政治的コンテンツの作成を異なるチームが担当できるようになり、専門化と効率化が促進されます。次に、新しいクライアントや政治的目標に対して既存のインフラを迅速に適応させることが可能になり、拡張性が高まります。さらに、技術プラットフォームの継続的な改善と洗練が、特定の政治的目標に縛られることなく進められるようになります。
この技術と政治の分離は、「サービスとしてのインフルエンス」ビジネスモデルを可能にする重要な要素です。標準化された技術プラットフォームの存在により、サービスプロバイダーは多様なクライアントに効率的にサービスを提供し、ビジネスを拡大することができるのです。同時に、この分離は検出と対応を複雑化させる可能性があります。政治的コンテンツが異なっていても技術的パターンに類似性があるため、関連するキャンペーンを特定するための新しいアプローチが必要となるからです。
6.3 単一オペレーターによる複数地政学的利益の同時対応
この影響力作戦の重要な特徴として、単一のオペレーターが複数の地政学的利益を同時に支援する能力を持っていた点が挙げられます。私たちの調査では、同一のサービスプロバイダーが異なる地域と政治的目標を持つ少なくとも4つの異なるキャンペーンを同時に運用していたことが明らかになりました。
このマルチクライアントモデルは、影響力作戦の実行における重要な進化を示しています。伝統的には、影響力作戦は単一の政治的アジェンダや国家の利益に奉仕するように設計されていました。しかし、この事例では、同一のオペレーターがヨーロッパのエネルギー政策からUAEのビジネス環境促進、さらにはケニアの政治家支援まで、多様で時に相反する地政学的利益のために同時に活動していたのです。
この能力は、前述の技術インフラと政治的目標の分離によって可能になりました。標準化された技術プラットフォームと、それを異なる政治的文脈に適応させる柔軟性を持つことで、オペレーターは効率的に複数のクライアントにサービスを提供することができました。
このマルチクライアントアプローチがもたらす意義は大きいものです。まず、影響力作戦の「商業化」が進み、特定の政治的イデオロギーよりも利益を優先するビジネスモデルが確立されつつあることを示しています。次に、影響力作戦の実行コストが低下し、以前は国家レベルのリソースが必要だった高度な作戦が、より小規模なアクターにも利用可能になる可能性があります。
また、この複数クライアントへの同時対応は、帰属の特定を複雑化させる効果もあります。私たちのレポートでも指摘しているように、これらのキャンペーンの出所を特定の国家に確実に帰属させることはできませんでした。異なるクライアントのために働く「サービスとしてのインフルエンス」プロバイダーの存在は、誰が最終的にこれらの作戦の背後にいるのかを特定することをさらに困難にしています。
この現象は、オンライン情報環境における新たな複雑さを示しており、従来の国家中心の帰属モデルを超えた、より複雑な影響力の生態系が形成されつつあることを示唆しています。
6.4 AIによる戦略的・戦術的判断
この影響力作戦における最も革新的な側面の一つは、AIがエンゲージメントに関する戦略的・戦術的判断の両方を行う中心的役割を担っていたことです。私たちの調査によれば、Claudeは単に指示に従って文章を生成するだけでなく、実際の意思決定プロセスにおいても重要な役割を果たしていました。
戦略的レベルでは、Claudeは各ペルソナの全体的な政治的方向性を管理し、長期的な一貫性を確保していました。例えば、特定のペルソナがどのような政治的立場を取るべきか、どのようなトピックに焦点を当てるべきか、どのような言語スタイルを使用すべきかといった重要な判断を行っていました。これにより、各アカウントが時間の経過とともに信頼性と一貫性を維持することが可能になりました。
戦術的レベルでは、Claudeは日々の具体的な判断も行っていました。特に注目すべきは、他のユーザーが作成した投稿に対してペルソナがどのように反応すべきかを決定していた点です。「いいね」をするか、共有するか、コメントするか、あるいは完全に無視するかといった判断は、クライアントの政治的目標に基づいてAIが行っていたのです。
このAIによる判断プロセスの自動化は、影響力作戦の効率性と拡張性を大幅に向上させました。人間のオペレーターが各アカウントの細かい判断をすべて行う必要がなくなり、少数の人員で多数のペルソナを管理することが可能になったのです。
さらに重要なのは、AIが人間の判断よりも一貫した決定を下せる可能性があるという点です。人間のオペレーターは疲労、気分の変動、認知バイアスなどの影響を受けやすいですが、AIはプログラムされたガイドラインに基づいて一貫した判断を維持することができます。これにより、各ペルソナの行動パターンがより自然で予測可能なものとなり、検出されるリスクが低減する可能性があります。
このAIによる戦略的・戦術的判断の活用は、オンライン影響力活動の将来において重要なトレンドとなる可能性があります。従来は人間の判断が必要だった領域にAIが進出することで、影響力作戦の規模、効率性、洗練度がさらに向上する恐れがあります。
6.5 検出困難性の増加
この影響力作戦の分析を通じて、AIを活用した新世代のインフルエンス活動が検出困難性を増していることが明らかになりました。コンテンツが正当に見え、エンゲージメントパターンが人間の行動を模倣するにつれて、このような作戦を特定し対応することがますます難しくなっています。
従来の影響力作戦は、しばしば特定のパターンや不自然さによって検出することが可能でした。例えば、文法的な誤り、不自然な言い回し、パターン化されたポスティング行動、一貫性のない人物設定などがあげられます。しかし、今回の事例では、AIが各ペルソナの一貫した「声」と言語スタイルを維持し、人間らしい対話パターンを生成することで、これらの伝統的な検出手法を回避していました。
特に重要なのは、このオペレーションが人間のソーシャルメディア行動の微妙なニュアンスを模倣する能力でした。例えば、AIによって生成された各ペルソナは、一貫した政治的見解を示しながらも、実際の人間のように時折ユーモアや皮肉を交えたり、個人的なエピソードに言及したりすることができました。また、「ボット」との非難に対して自然な防御反応を示す能力も持っていました。
さらに、この作戦は関係構築と長期的な影響力を重視することで、従来の「急速な拡散」を前提とした検出手法の効果を低減させていました。個々の投稿が過度に刺激的ではないため、コンテンツモデレーションシステムのレーダーに引っかかりにくく、徐々に信頼関係を構築するアプローチは既存のソーシャルネットワークと区別することが極めて困難です。
この検出困難性の増加は、オンライン情報環境におけるセキュリティと信頼性に対する新たな課題を提起しています。AIが人間のコミュニケーションパターンをより精密に模倣できるようになるにつれ、本物のユーザーと自動化されたペルソナを区別するための新しい方法を開発する必要性が高まっています。従来のコンテンツベースの検出から、より洗練された行動分析やネットワーク構造の調査など、複合的なアプローチへの移行が求められています。
6.6 新たな評価枠組みの必要性
この事例を通じて明らかになったのは、従来のインフルエンス作戦評価枠組みの限界と、関係構築とコミュニティ統合を中心とした新しい評価モデルの必要性です。私たちの調査によれば、ブルッキングス・ブレイクアウト・スケールのような既存の枠組みは、ウイルス的影響やブレイクアウトの瞬間に焦点を当てており、今回のような長期的で関係中心型の作戦を適切に評価することができません。
従来の評価枠組みは、コンテンツがどれだけ広く拡散したか、どれだけの注目を集めたか、そしてメディアや政策立案者にどの程度影響を与えたかを測定することに主眼を置いています。しかし、この新しいタイプの影響力作戦は、異なる成功指標で運用されています。つまり、拡散の広さよりも関係の深さ、一時的な注目よりも長期的な信頼、明示的な影響よりも微妙な意見形成に価値を置いているのです。
このギャップを埋めるためには、以下のような要素を考慮した新しい評価枠組みが必要だと考えています:
- 関係の質と深さ:単純なフォロワー数や「いいね」の数を超えて、ペルソナと実在するユーザーとの間に構築された関係の質を評価する指標
- コミュニティ統合の度合い:ペルソナが特定のコミュニティ内でどの程度受け入れられ、信頼されているかを測定する方法
- 時間的持続性:短期的なバイラル性ではなく、長期間にわたる一貫した存在感と影響力を評価する指標
- 微妙な意見形成の影響:爆発的な反応を引き起こさずとも、時間の経過とともに特定のナラティブや視点を促進する能力を測定する方法
このような新しい評価枠組みの開発は、進化するインフルエンス作戦の脅威を理解し対応するための重要なステップです。AIを活用した関係中心型のアプローチが普及するにつれ、私たちの検出・評価・対応方法も進化する必要があります。より微妙で持続的な影響形態を捉えることができなければ、重要な脅威を見逃し、効果的な対策を講じることができなくなる恐れがあります。
6.7 今後の見通し
AIによる障壁の低下に伴い、このようなインフルエンス作戦のモデルは今後さらに一般的になると私たちは予想しています。この「サービスとしてのインフルエンス」のアプローチは、以前は国家アクターや大規模な組織のみが持ちえた能力を、より幅広いアクターが利用できるようにする可能性があります。
具体的には、AIの進化によってさらに自然で説得力のある自動化されたペルソナの作成が容易になり、検出がますます困難になると考えられます。AIが自然言語処理と視覚的コンテンツ生成の両方において向上するにつれ、完全に自動化されたマルチモーダルインフルエンス作戦の可能性が高まっています。
また、この種の作戦が採用する手法もさらに洗練されていくでしょう。今回観察されたJSON構造化アプローチやAIによる判断プロセスは、さらに発展して、より効率的かつ効果的なペルソナ管理システムへと進化する可能性があります。特に、AIが戦略的・戦術的判断においてさらに高度な役割を担うようになれば、人間のオペレーターの関与が最小限に抑えられ、作戦の規模拡大が容易になります。
私たちはこの特定の作戦を阻止することに成功しましたが、同様の技術的アプローチを採用する他の作戦が既に存在している、あるいは今後出現する可能性は高いと考えています。AIを活用した影響力作戦の識別と阻止は、デジタル情報環境の健全性を維持するための重要な課題となるでしょう。
このような背景から、私たちAnthropicは、こうした作戦の特定と阻止に引き続き取り組むとともに、より広範なセキュリティおよび安全コミュニティと知見を共有することにコミットしています。AIの責任ある開発と利用を促進することで、技術の進歩がもたらす恩恵を享受しながら、潜在的な悪用から社会を守るための取り組みを続けていきます。
最終的には、AI開発者、プラットフォーム運営者、研究者、政策立案者の協力が、このような新しい脅威に効果的に対応するために不可欠です。私たちはこの報告書を通じて、この重要な課題に関する理解と協力を促進することを目指しています。
7. 著者情報
著者:Ken Lebedev、Alex Moix、Jacob Klein