0. エグゼクティブサマリ
本論文「BookWorld: From Novels to Interactive Agent Societies for Creative Story Generation」は、既存の文学作品に基づいたマルチエージェントシミュレーションシステムを提案している。大規模言語モデル(LLM)の進歩を活用し、小説の登場人物や世界観を忠実に再現しながらも、新たなストーリーを生成する「BookWorld」を開発した。このシステムは、キャラクターの自律性を保ちつつ、地理的制約や世界観の設定を考慮したインタラクティブなシミュレーションを可能にする。実験の結果、BookWorldは従来の方法と比較して、キャラクターの一貫性や没入感において優れた物語を生成することが示された。このアプローチは、既存の小説作品の拡張や探索に新たな可能性を提供するとともに、創造的なストーリーテリングの自動化に大きく貢献する。
1. 研究背景と位置づけ
近年のAI研究では、大規模言語モデル(LLM)を活用したマルチエージェントシステムによる社会シミュレーションが注目を集めている。この分野の先行研究は主に、新たに定義されたペルソナを持つエージェントを一から作成する方法に焦点を当てており、特定のシナリオでの社会的行動のシミュレーションや、タスク指向のマルチエージェントシステムの開発が行われてきた。
しかし、既存の架空世界を模倣したエージェント社会のシミュレーションはまだ十分に探求されていない。小説などの文学作品には豊かな世界観や複雑なキャラクター設定が含まれており、これらを活用したシミュレーションは実用的な価値が高いにもかかわらず、研究が進んでいない状況であった。
本研究はこの課題に取り組み、書籍ベースのマルチエージェント社会を構築・シミュレーションするための包括的なシステム「BookWorld」を提案している。BookWorldは、多様で動的なキャラクター、架空の世界観、地理的制約とその変化などの現実世界の複雑さを考慮した設計となっている。これにより、物語生成、インタラクティブゲーム、社会シミュレーションなど多様なアプリケーションが可能になり、既存の文学作品を拡張・探索する新しい方法を提供している。
2. 原論文 日本語訳+逐次解説
2.1 アブストラクト
【本文訳】 大規模言語モデル(LLM)の最近の進歩により、マルチエージェントシステムを通じた社会シミュレーションが可能になりました。これまでの取り組みは、新たに定義されたペルソナをエージェントに割り当て、一からエージェント社会を作成することに焦点を当ててきました。しかし、既存の架空世界やキャラクターをシミュレーションすることは、その実用的価値が高いにもかかわらず、ほとんど未探索のままです。本論文では、書籍に基づくマルチエージェント社会を構築・シミュレーションするための包括的なシステム「BookWorld」を紹介します。BookWorldの設計は、多様で動的なキャラクター、架空の世界観、地理的制約とその変化など、現実世界の複雑さを包括的にカバーしています。BookWorldは、物語生成、インタラクティブゲーム、社会シミュレーションなど多様なアプリケーションを可能にし、愛される架空の作品を拡張・探索する新しい方法を提供します。広範な実験を通じて、BookWorldが原作本に忠実さを保ちながら創造的で高品質の物語を生成し、75.36%の勝率で従来の方法を上回ることを実証しました。本論文のコードはプロジェクトページ(https://bookworld2025.github.io/)で入手できます。
【解説ノート】 このアブストラクトでは、研究の背景、提案するシステム「BookWorld」の概要、その応用可能性と評価結果が簡潔にまとめられている。特に注目すべき点は、既存の架空世界やキャラクターのシミュレーションという未探索の領域に焦点を当てている点である。LLMの進歩により可能になったこの技術は、物語生成やインタラクティブシミュレーションという形で、創造的なコンテンツ制作の新たな可能性を開いている。75.36%という高い勝率は、このアプローチの有効性を示す重要な指標である。URL情報からはプロジェクトページの存在が示唆されているが、論文提出時点ではまだ公開されていない可能性もある。
2.2 イントロダクション
【本文訳】 「今、私たちは本の中で生きていることを知っています。」 「もしあなたの言うことが本当なら、私は本から逃げ出して自分の道を行きます。」 – ヨースタイン・ゴルデル著『ソフィーの世界』
架空の作品に登場するキャラクターは、一度確立されると、作者の操作を超えて独自の生命を持つべきです。架空のキャラクターや世界に命を吹き込むことは、長い間フィクション愛好家の想像力を捉えてきました。大規模言語モデル(LLM)の最近の進歩を活用することで、マルチエージェントシステムを通じて本のキャラクターのためのインタラクティブな人工社会を構築できるようになりました。これらのシステムは人間の社会的相互作用をシミュレーションし、インタラクティブゲーム、社会シミュレーション、物語創作などの多様なアプリケーションを促進します。
これまでの取り組みは主に、エージェントのペルソナが簡潔な説明や人口統計学的特徴によって新たに定義されるエージェント社会を一から作成することに焦点を当ててきました。これには次のようなものが含まれます:1)討論や戦略的ゲームなどの特定のシナリオから、オープンエンドの社会シミュレーションまで、エージェントの社会的行動を研究する社会シミュレーション、2)協調的コーディングやストーリー生成など、エージェントが異なるサブタスクに特化しているタスク指向のマルチエージェントシステム。しかし、既存の架空世界をシミュレートするエージェント社会はまだ十分に探求されていません。
本研究では、架空世界でのストーリー進行をシミュレートし、物語創作を促進する、書籍ベースのマルチエージェント社会のための包括的なシステム「BookWorld」を提案します。BookWorldは原作本からキャラクターデータと背景知識を抽出し、これらのデータを使用してマルチエージェントシステムを構築します。このシステムは、キャラクターのロールエージェントとシミュレーション制御のためのワールドエージェントで構成されています。シミュレーションは個々のシーンを通じて進行し、関与するキャラクターのロールエージェントが、作業、コミュニケーション、取引などのさまざまな相互作用に従事します。彼らは継続的に記憶、状態、目標を更新します。ワールドエージェントはシステムワークフローの管理、グローバルステータスの維持、環境フィードバックの提供などによってシミュレーションを調整します。シミュレーションが終了すると、その履歴がストーリーを織り成し、それらはLLMによって一貫性のある小説スタイルの物語に洗練されます。私たちのシステムはまた、ユーザー指定のプロットやスクリプトを通じてシミュレーションを制御するという人間の介入もサポートしています。
さらに、私たちは書籍からシステマティックに世界観データを収集し、架空世界のシミュレーションを強化しています。架空の作品にはしばしばさまざまな空想的な背景要素が含まれるため、私たちは社会規範、文化的コンテキスト、用語説明など、包括的な世界観データを抽出してBookWorldを充実させています。これらのデータにより、BookWorld内のエージェントは対応する世界観の下で適切に行動できるようになります。
本研究の主な貢献は以下の通りです: • 私たちの知る限り、本研究は架空世界のシミュレーションのための書籍ベースのエージェント社会に関する最初の研究です。このようなシミュレーションはキャラクター主導の物語を可能にし、創造的なストーリー生成を促進します。 • 私たちはBookWorldを導入します。これは書籍ベースのエージェント社会を構築・シミュレーションするための包括的なフレームワークであり、データ準備、シミュレーション、言い換えのための体系的な方法論をカバーしています。 • 私たちは包括的な定量的・定性的分析を通じてBookWorldを評価しました。結果は、BookWorldが原作資料に忠実さを保ちながら高品質の物語を生成し、75.36%のケースで以前の方法を上回ることを示しています。
【解説ノート】 イントロダクションでは、研究の動機づけとして「ソフィーの世界」からの引用を効果的に用いている。架空のキャラクターに自律性を持たせるという哲学的テーマを示すことで、本研究の目的が単なる技術的な実験ではなく、フィクションにおける創造性と自律性の探求であることを示唆している。
マルチエージェントシステムの研究において、これまでは新たに定義されたペルソナによるシミュレーションが主流だったが、既存の架空世界のシミュレーションはまだ未開拓であるという研究の位置づけが明確に示されている。BookWorldの特徴として、キャラクターエージェントとワールドエージェントの区別、シーンベースのシミュレーション進行、記憶や状態の継続的更新、そして人間の介入可能性が挙げられている。
特に重要なのは、架空作品特有の「世界観データ」の抽出と活用である。ファンタジーや空想世界では、現実世界とは異なる社会規範や文化的背景が存在することが多く、これらを適切にシミュレートすることで、より原作に忠実なストーリー生成が可能になる。
2.3 関連研究
【本文訳】
2.1. マルチエージェントシステム
世界シミュレーション 世界シミュレーションのためのマルチエージェントシステムは、実世界のアプリケーションにおける社会的ダイナミクスを探索するために開発されています。このようなシミュレーションは、小規模な範囲内で社会科学の理論をテストするか、大規模な現実的な社会現象を伴う仮想空間やコミュニティを構築することができます。
Park et al. (2023)は、Simsのようなインタラクティブなサンドボックス環境内で生成的エージェントを開発し、ユーザーが自然言語インタラクションを通じて25のエージェントからなる小さなコミュニティと交流できるようにしています。Project Sid (AL et al., 2024)は、Minecraftで異なる性格を持つ約1,000のエージェントを配置し、取引や選挙などの複雑な人間の社会活動を伴う「AI文明」を確立しています。Yang et al. (2024)は、OASISを開発しました。これは何百万ものエージェント間の相互作用を調整できる大規模なソーシャルメディアシミュレーションフレームワークです。
ストーリー生成 いくつかの研究ではマルチエージェントシステムを活用してストーリー生成を行っています(Chen et al., 2024; Han et al., 2024)。これらの研究では、著者(または監督)、編集者、俳優エージェントを構築し、協力してストーリー生成タスクを解決することによって、あらかじめ定義された概要を書き、拡張することでストーリーが生成されます。
これらの研究は世界シミュレーションとストーリー生成において大きな可能性を示していますが、書籍ベースの仮想環境構築とそのストーリー創作への応用についてはまだ限られた探索しかありません。
2.2. 自動ストーリーライティング
初期の研究方法は、キャラクターの特性と社会的制約に基づくアルゴリズム計画を強調しています(Meehan, 1977; Lebowitz, 1984)。ニューラルネットワークの台頭により、研究は徐々にデータ駆動型の機械学習手法へとシフトし(Yao et al., 2019; Goldfarb-Tarrant et al., 2020; Kreminski et al., 2021)、物語の組み合わせや選別が行われるようになりました。
大規模言語モデルの出現は、自動ストーリーライティングの風景を大きく変えました(Yuan et al., 2022)。現代のアプローチのほとんどはトップダウン方式を採用し、作家や監督の視点から物語を生成します。まず高レベルのストーリー概要を作成し、その後段階的に詳細なコンテンツを開発して、物語生成の全体的な品質を向上させます。一部のアプローチは単一の大規模言語モデルに依存していますが(Mirowski et al., 2023)、他のアプローチはストーリーを生成するためにマルチエージェントアーキテクチャを活用しています(Han et al., 2024; Chen et al., 2024)。
しかし、実験結果は、これらのアプローチがまだ本質的な創造性とテキストの複雑さにおいて人間のプロの作家に遅れをとっていることを示しています(Tian et al., 2024)。しばしばサスペンスや緊張感に欠ける物語を生成し、均質化された創造性に欠けるコンテンツを生み出す傾向があります(Gómez-Rodríguez and Williams, 2023; Ismayilzada et al., 2024)。
【解説ノート】 関連研究セクションでは、BookWorldを位置づける上で重要な2つの研究分野、マルチエージェントシステムと自動ストーリーライティングについてレビューしている。
マルチエージェントシステムの研究では、Park et al.の生成的エージェントや、Project Sidのような大規模シミュレーションなどの最近の進展が紹介されている。これらは人間の社会的相互作用をシミュレートする技術基盤を提供しているが、既存のフィクション作品を基にしたシミュレーションには焦点が当てられていない。
自動ストーリーライティングの分野では、初期のアルゴリズム的アプローチから、ニューラルネットワークを経て、最近のLLMベースの方法へと進化の歴史が示されている。特に、現代のアプローチはトップダウン方式が主流で、ストーリーの概要を先に作り、それを詳細化していく手法が多い。しかし、これらの手法はまだ人間の作家のレベルには達しておらず、特にサスペンスや創造性の面で課題が残っている。
これらの先行研究のレビューを通じて、BookWorldがこれまでの研究の限界を超え、既存の文学作品に基づく自律的エージェントによるボトムアップなストーリー生成という新しいアプローチを提案していることを際立たせている。
2.4 BookWorld
【本文訳】 本セクションではBookWorldの設計について詳しく説明します。BookWorldの主な目的は、書籍ベースのマルチエージェントシミュレーションのためのインタラクティブなシステムを構築することであり、これには2つの主要な目標が含まれます: • キャラクターエージェント(およびユーザー)が架空の世界に位置しているかのような没入型体験を提供すること • システム内でのキャラクターの自律性を高めながら、確立された彼らの性格と経験への忠実さを保持すること
これらの目標に向けて、私たちはデータとエージェントの設計原則に集中します。元のテキストはよく設計された抽出方法を通じて構造化データに変換され、エージェントを構築するために使用される主要な情報がフィルタリングされます。さらに、私たちは架空の世界観におけるグローバルな規範への遵守を確保するため、世界観の詳細を収集するための専門化された方法を革新的に開発しました。
BookWorldでは、キャラクターエージェントに実質的な自律性が与えられています。彼らの行動には環境の探索、他のキャラクターとの相互作用、さまざまな刺激への反応が含まれます。動的属性の更新メカニズムにより、彼らはキャラクターの忠実さと一貫性を保ちながら、シミュレーション全体を通じて自分の経験を反映することができます。
3.1. 概要
全体的なシミュレーションパイプラインは図2に示されています。
データ準備 シミュレーションが始まる前に、私たちは原作資料からキャラクターと世界観のデータを抽出し、書籍からシステムへの構築に使用します。抽出方法の詳細は§3.4で説明します。
シミュレーション シミュレーションはロールエージェントとワールドエージェントを初期化し、キャラクタープロファイル、地理空間マップ、世界観データ、その他の必要な情報を読み込むことから始まります。各キャラクターは、「私の国を守る」といった根本的な願望を表す長期的な動機を確立します。エージェントに関する詳細は§3.2で紹介されています。
初期化が完了すると、シミュレーション段階が始まります。物語的な完全性と一貫性を保持するために、ドラマ理論(McKee, 1999)を参照し、私たちは最小の物語単位をシーンとして定義しています。シーンは、小説の章に類似した区切られたセグメントです。シミュレーションはユーザーが指定した数のシーンにわたって続きます。シーンはモジュール的な独立性を保ち、それらが集合的に一体的で一貫性のある物語を構成します。
各シーンでは、選択されたロールエージェントのグループが次々に行動します。彼らは個人的な目標に基づいて行動を実行し、他のエージェントや環境と相互作用します。詳細なシーンの配置は§3.3で説明されています。
BookWorldは包括的な地理空間モデリングを取り入れており、システムはロールエージェントの位置を動的に追跡・更新します。キャラクターが架空の世界を通じて移動する際、その動きは地理的制約と移動時間によって支配されます。エージェントが移動を決定すると、目的地に到着する前に、数シーンの移動中状態を過ごす必要があります。このプロセスはワールドエージェントによって調整され、ワールドエージェントはまた、キャラクターの現在の居場所と過去の相互作用に基づいてシーン参加者を選定します。
リフレーズ シミュレーションが終了した後、私たちはシミュレーション記録を収集し、LLMを適用して最終的な小説スタイルの物語に言い換えます。
3.2. アーキテクチャ
私たちのアプローチは、空間的・文化的に基盤のある仮想世界内でキャラクターが行動できるようにし、彼らの相互作用から自然に物語が生まれることを可能にします。これを達成するために、私たちはロールエージェントとワールドエージェントという2つのコアコンポーネントを導入しています。これらのコンポーネントは協力して動作するように設計されており、個々のキャラクターの動機とグローバルな環境制約を橋渡しし、物語の創造性と論理的一貫性の両方を確保しています。
3.2.1. ロールエージェント
ロールエージェントはBookWorldの中核です。彼らは内在的な特性に基づいて行動を取ることができ、複雑な社会的行動を示し、シミュレーション中に個別の動機と記憶を形成します。これらのエージェントは検索拡張に基づく長期記憶モジュールを装備しています。
属性 ロール属性には、エージェント構築に不可欠な基本的特性が含まれています。これらの属性は静的と動的のタイプに分類されます:
- 静的属性 静的属性には、性別、年齢、外見、性格などの固有の特性が含まれます。キャラクタープロファイルで指定されるこれらの属性は、キャラクターの一貫性を維持するためにシミュレーション全体を通じて一定のままです。
- 動的属性 動的属性には主に目標、状態、記憶が含まれます。開始時に初期化されるこれらの属性は、物語の進行とともに進化し、動的なキャラクター開発を可能にします。
アクション キャラクターのアクションは物語の進行の大部分を構成します。固定されたアクション空間に依存する代わりに、私たちのシステムはアクションの詳細を記述するために自然言語を利用し、オープンドメインの行動を可能にします。
アクションは能動的または反応的のいずれかです。イニシエーターとしての彼らのターンの間、キャラクターは自分の目標、状態、他者に関する情報に基づいて能動的に行動を計画・実行します。アクションのターゲットとして指定された場合、キャラクターはそれに応じて反応する必要があります。
イニシエーターが取ることができるアクションは、相互作用のターゲットに基づいて以下のタイプに分類されます:
- キャラクター相互作用 イニシエーターは個別または集団のいずれかでキャラクターと関わることができます。アクセス可能なキャラクターには主要キャラクターとノンプレイヤーキャラクター(NPC)が含まれます。街の商人などのNPCは、特定のロールエージェントが割り当てられていないキャラクターです。NPCに接近すると、システムは相互作用を管理するために一時的な、記憶のないNPCエージェントを作成します。
- 環境相互作用 イニシエーターは情報収集やタスク完了のために環境を含む行動を実行できます。例えば、周囲の地域を調査するなどです。
- 相互作用なし 相互作用のターゲットを指定しない場合、イニシエーターは読書など、孤独な活動を行うことができます。
記憶 長期シミュレーションをサポートするために、私たちは生成的エージェント(Park et al., 2023)に従った長期・短期記憶メカニズムを設計しています。
- 短期記憶(STM) STMは容量制限まで最近のイベントと完全な対話の詳細⟨...,𝑑𝑖−1,𝑑𝑖⟩を保存し、現在のシナリオでの即時の応答を可能にします。
- 長期記憶(LTM) LTMはSTM制限を超える記憶の凝縮された要約を保存します。STMが容量に達すると、古い記憶はLTMに抽象化され(例えば𝑚𝑖 = summarize(𝑑𝑖))、保存され、必要なときに検索できるようになります。
3.2.2. ワールドエージェント
ワールドエージェントはこのシステムの不可欠なコンポーネントとして機能し、キャラクター間の相互作用を超えたすべてのタスク、環境管理やストーリー概要の処理を含む、を処理します。
属性 ワールドエージェントは主に基本的な世界観を必要とします。これは仮想世界の主要な特性とコア設定を包含する基本的な説明を指します。この概要はエージェントに世界の本質的な特徴を素早く理解するための基本的なフレームワークを提供します。
アクション ワールドエージェントは仮想環境を維持し、主にキャラクターエージェントによって取られた行動に応答します。その機能には以下が含まれます:
- 環境応答 キャラクターエージェントが環境と相互作用すると、ワールドエージェントは世界観の設定と現在の場所の関連情報に基づいて結果を生成します。例えば、キャラクターがドアを突破しようとする場合、一般的な村の設定ではアクションが成功する可能性が高いですが、厳重に警備された城では失敗する可能性があります。
- イベント生成と更新 ワールドエージェントはシステム内でグローバルイベントを管理します。物語は対立によって駆動されますが、ガイダンスなしで運用されるロールエージェントは明確な目標を失い、反復的な行動を示す可能性があります。したがって、刺激的なイベントを生成することは物語の魅力を大幅に向上させます。ユーザー設定によってイベント刺激が必要な場合、ワールドエージェントは背景設定に基づいて対立が豊富なイベントを生成し、キャラクターのリアルタイムの行動に応じて更新します。
3.2.3. マップ
BookWorldは環境内の空間的関係を導入するために離散的なマップを実装しています。マップは主要な場所に自然言語の説明を装備し、場所間の距離に重み付き無向グラフを使用します。
場所プロファイル 各場所には、固有の名前、簡単な説明(外観、雰囲気、歴史)、およびオプションの詳細情報(地元の習慣、特別なアイテム)があります。
距離ネットワーク 場所間の距離は重み付き無向グラフによって表現されます。キャラクターは隣接する場所間を移動するか、指定された時間単位を消費してより長い経路を通ることができます。BookWorldでは、1シーンを時間単位として指定します。
3.3. シミュレーション実装
シーンと決済 各シーンの開始前に、ワールドエージェントは共通の場所を共有する必要がある参加キャラクターを選択し、物語の焦点と相互作用の一貫性を確保します。
各シーンは複数のラウンドで構成され、キャラクターはイニシエーターとして複数のアクション機会を持ちます。固定されたシーケンスに従うのではなく、ワールドエージェントはキャラクターの状態と物語展開の要件に基づいてイニシエーターを動的に決定します。彼/彼女のラウンド中に、イニシエーターは目標と現在の状況に基づいて計画と行動を行います。利用可能なアクションタイプは§3.2.1で説明されています。
システムはアクション記録を通じてシーンの完了を評価します。シーン終了時に、キャラクターは別の場所に移動することを選択できます。ワールドエージェントは最近の展開に基づいて現在のイベントを更新し、スクリプトモードでは次の物語段階のガイダンスを提供します。移動の計算は移動中のキャラクターに対して実行され、指定された移動ラウンドを完了したキャラクターは目的地に到着します。
コントロール可能なストーリー生成 実用的な要件に基づいて、ユーザーはキャラクターの自発的な行動を観察するか、物語の展開を直接制御するかを望む場合があります。これらの多様なニーズに対応するために、このシステムは異なるフィードバックメカニズムを持つ2つの操作モードを実装しています:フリーモードとスクリプトモードです。
スクリプトモードはユーザー定義のスクリプトを取り入れて、キャラクターの行動をガイドし、スクリプトの概要に従いながら詳細な行動を生成します。シミュレーションの開始時に、システムは与えられた𝑠𝑐𝑟𝑖𝑝𝑡を重要な行為⟨𝑎𝑐𝑡1, 𝑎𝑐𝑡2, ...⟩に分割します。シミュレーション中に、システムは進行状況をチェックし、現在の𝑎𝑐𝑡𝑖に基づいてロールエージェントに指示を出し、各セッションで物語の一貫性を維持します。
フリーモードでは、キャラクターは完全な自律性を持ち、彼らの確立された設定と特性に基づいて行動します。ユーザーはまた、ドラマと登場人物の関与を高めるために、初期のインシデントを設定することができます。イベントはシミュレーションの進行とともにリアルタイムで更新されます。
3.4. データ準備
一般情報抽出 私たちはYuan et al. (2024)にインスパイアされた増分更新に基づく自動抽出方法を提供しています。元のテキストはまずチャンクに分割されます。ターゲットキャラクターには初期プロファイルが割り当てられます。そして、私たちはチャンクを通過し、キャラクタープロファイルや他者との関係を含むキャラクター情報を再帰的に更新します。この情報は最終的に、エージェント構築に使用される構造化データに整理されます。
私たちは6つの中国語作品と10の英語作品から情報抽出を行い、合計453のプリセットを生成しました。プリセットには主に本の特定の行為における概要と現在のキャラクターに関する情報が含まれます。
BookWorldを世界観データで豊かにする 小説、特にフィクションには、しばしば一様なフォーマットで提示されていないが、コンテキストから推測できる暗黙的、非構造化の知識が含まれています(Wang et al., 2023b)。例えば、ハリーポッターの世界では、一般の人々は魔法使いの存在を知らないはずです。シミュレーション中に確立された設定に違反すると、体験の物語的没入感が中断されるでしょう。したがって、ターゲット作品の世界観要素の包括的なデータベースが不可欠です。
私たちは関連する設定を統合するための用語ベースの抽出方法を提案しています。シミュレーション中に、特定の用語が言及されたり、コンテキストが特定の設定に強く関連している場合、これらの設定は参照としてプロンプトに組み込まれ、シミュレーション全体を通じて環境の没入感と一貫した世界構築を強化します。
各抽出された設定には4つの属性が含まれます:
- 用語: 説明の対象(例えば、「透明マント」、「ホワイトウォーカー」)。架空の世界内の一般的な社会的雰囲気や普遍的事実を記述する場合、用語は空の文字列である可能性があります。
- 性質: 設定のカテゴリー。これには「アーティファクト」、「社会規範」などが含まれる場合があります。
- 詳細: 設定の包括的なテキスト記述。特定の用語については、詳細はその特性を説明します。
- ソース: 設定が抽出された章。これにより、作品内の異なるタイムラインを区別できます。
私たちは4つのステップで情報を抽出します。手順は図4に示されています。まず、章を処理可能なチャンクに分割します。次に、各チャンクを分析して関連する世界観の知識を抽出します。このためにLLMを装備して、チャンクの要素とその性質と詳細を識別します。その後、シミュレーションを妨げる可能性のあるキャラクターの行動と常識的な情報を除去するために、これらの要素をフィルタリングします。最後に、類似の記録をクラスター化して統合し、冗長性を排除しながら重要な詳細を保持します。各要素はソース章でタグ付けされ、検証とその後のアプリケーションでのタイムライン制御の両方を容易にします。私たちは上記と同じソース資料から9912の設定を収集し、44.8%が中国語、55.2%が英語です。抽出された設定に関する詳細は付録Bに示されています。
【解説ノート】 このセクションでは、BookWorldの設計と実装の詳細が説明されている。システムの中核となる2つのコンポーネント、ロールエージェントとワールドエージェントの機能と役割が詳細に記述されている。
特に注目すべき点は、キャラクターの自律性とシステムの柔軟性のバランスである。BookWorldは、キャラクターの自律的な行動を可能にしながらも、原作に忠実な世界観とキャラクター設定を維持するよう設計されている。これを実現するためのキーとなる機能の一つが、短期・長期記憶のメカニズムであり、これによってキャラクターは過去の経験に基づいて行動し、成長することができる。
また、地理空間のモデリングも重要な特徴である。現実的な移動時間や地理的制約を考慮したシミュレーションが可能になり、より没入感のある物語生成につながる。
データ準備セクションでは、原作からのキャラクター情報と世界観データの抽出方法が説明されている。特に世界観データの抽出は、BookWorldの独自性を示す重要な部分である。用語ベースの抽出方法によって、架空世界特有の社会規範や文化的背景、特殊な概念などを構造化し、エージェントの行動や環境応答に反映させることができる。
2.5 実験
【本文訳】 本セクションでは、ストーリー生成を通じてBookWorldの有効性を評価します。私たちは生成された物語の品質に焦点を当て、広範な実験を行います。
4.1. 評価指標
物語に対する具体的なスコアを与えることは人間の評価者にとっても非常に難しいタスクであるため、私たちは以前の研究(Chen et al., 2024)に従って、異なる方法で生成された物語間の複数の次元での一対比較を採用しています。このフレームワーク内で、任意の2つの方法からの出力が対比較され、LLMが優れたパフォーマンスを判断します。私たちはこの方法の信頼性を人間の評価Aと比較することで実証しています。
私たちは2つのシナリオ、与えられた概要によるストーリー生成と概要なしのストーリー生成について実験と評価を行います。2つのシナリオでは異なる評価次元が必要です。前者については、与えられた概要へのシステムの遵守を測定するストーリーライン品質(SQ.)を評価します。後者については、システムが革新的で新鮮な新しい物語を生み出すことができるかどうかを評価する創造性(Cr.)を計算します。さらに、両方のシナリオに一般的に適用される4つの一般的な評価指標があり、各タイプの実験で評価される合計5つの指標となります:
人間性(An):非人間的なエンティティに人間の特性を帰属させながら、その本来の性質を保持する効果。
キャラクターの忠実さ(CF):キャラクターの行動と行為が、彼らの確立された特性と背景と一致する一貫性。
没入感と設定(IS):環境と雰囲気の詳細を通じて説得力があり魅力的な物語世界を作成する能力。
文章の質(WQ):物語に役立つライティングのメカニクスとスタイルの技術的な実行。
4.2. 実験設定
ベースライン 私たちは3つの方法で生成された物語を比較します:1)直接生成、すべての処理された本のデータでLLMに直接プロンプトを与えるもの、2)HoLLMwood (Chen et al., 2024)、LLMを使用して人間の物語執筆プロセスを再現するもの。作家エージェントは編集者エージェントのフィードバックに基づいて概要を洗練・分解し、俳優エージェントはキャラクターの役割を採用して物語を膨らませる。そして3)BookWorldです。
モデル シミュレーションのために、私たちはロールエージェントとワールドエージェントのベースモデルとしてオープンソースモデルとクローズドソースモデルの両方を採用しています。実験中、私たちは方法間で対話ターン数を一貫して保っています。各実験は2~4のシーンをシミュレートし、平均で合計4,230語となります。最終結果はgpt-4o-2024-08-06を使用して評価されます。
4.3. 評価結果
表1は5つの評価指標にわたるBookWorldと2つのベースライン方法の勝率を示しています。BookWorldは評価されたすべての指標とモデルにおいて、特に没入感において強いパフォーマンスで、直接生成ベースラインを一貫して上回っています。HoLLMwoodに対しては、BookWorldは没入感とキャラクターの忠実さにおいて優位性を保持していますが、ストーリーラインの品質と文章の品質において課題に直面しています。
ほとんどのモデルで、BookWorldはベースラインアプローチに対して大きな利点を示しています。しかし、Llama-3.3-70Bを使用すると、BookWorldは特定の次元で直接生成とHWを下回っています。このパフォーマンスギャップは2つの要因に起因します。まず、マルチエージェントシミュレーションは本質的に直接生成よりも複雑であり、構造化された出力の処理と複雑な指示に従う高度な能力が必要です。次に、私たちの実験は部分的に中国語データを含んでおり、これはLlama-3.3-70Bの得意とするところではありません。
4.4. アブレーション研究
私たちはBookWorldの主要な機能についてアブレーション研究と比較分析を行いました。エージェントのベースモデルとしてgpt-4o-mini-2024-07-18を使用し、§4.3と同じプリセットを採用し、特定の機能が有効または無効のBookWorldの出力品質を比較し、各次元の勝率を計算しました。最終結果は表2に示されています。
結果は基本的に期待通りです。環境出力を削除すると没入感に大きく影響し、それが文章の質を低下させましたが、ストーリーラインの品質にはあまり影響しませんでした。一方、シーンモードを無効にすると、すべての次元で品質が低下し、ストーリーラインへの影響が最も大きくなりました。
4.5. 議論
私たちは表3にBookWorldの出力の興味深い例をいくつか表示しています。ほとんどの場合、BookWorldは情報を正しく処理し、エージェントが環境と相互作用し、相互作用を開始するときに適切な結果を生み出すことができます。システムは長期の記憶と状態を維持・活用する能力を持っています。私たちはまた、世界観設定の導入の影響を実証しました。これらの設定を組み込む前は、モデルは現実世界の常識に基づいて環境応答を生成し、「月光」や「銀色」などの描写をリードしていました。これらはソラリスの世界観と一致しません。
【解説ノート】 実験セクションでは、BookWorldの評価方法とその結果が詳細に示されている。評価は主に生成された物語の品質に焦点を当てており、「一対比較」という方法を採用している。これは、2つの異なる方法で生成された物語を比較し、どちらが優れているかをLLMが判断するというアプローチである。
評価指標として、人間性、キャラクターの忠実さ、没入感と設定、文章の質、ストーリーラインの品質(または創造性)の5つの次元が設定されている。これらは物語の質を多角的に評価するための包括的な指標である。
結果として、BookWorldは直接生成ベースラインに対してはすべての次元で優れており、特に没入感において強い優位性を示した。HoLLMwoodとの比較では、没入感とキャラクターの忠実さでは優れているものの、ストーリーラインの品質や文章の質では課題があることが示された。これは、BookWorldのボトムアップアプローチがキャラクターと環境の一貫性には強いが、全体的な物語構造の制御では課題があることを示唆している。
アブレーション研究では、環境出力を削除すると没入感に大きな影響があること、シーンモードを無効にするとすべての次元で品質が低下することが示された。これはBookWorldの設計において、環境応答とシーンベースの構造が重要な役割を果たしていることを示している。
また、「ソラリス」の例では、世界観設定の重要性が示されている。適切な世界観データがなければ、モデルは現実世界の常識に基づいた応答を生成してしまい、作品の世界観と一致しない表現になってしまう。
2.6 結論
【本文訳】 本論文では、静的な文学作品を動的でインタラクティブな環境に変換する包括的なシステムであるBookWorldを紹介しました。私たちのアプローチは以前の研究と異なり、これらの文学作品を魅力的にする独自の世界観、地理的設定、対人関係のダイナミクスを特に再現することに焦点を当てています。実験結果は、BookWorldが没入型の書籍ベースの社会を構築することで高品質の物語を成功裏に作成することを示しています。私たちのアプローチはさまざまなシナリオに渡って高いスケーラビリティと広い適用性を示しています。この研究がマルチエージェント技術とキャラクターシミュレーション技術の発展をさらに進めることを期待しています。
限界
一般化可能性とオープン性を優先するために、BookWorldはインタラクティブな環境の非常に単純化された表現を採用しています。このトレードオフにより、特定の作品やシナリオ用に特別に設計されたシステムと比較して性能が低下します。例えば、BookWorldでウェアウルフ(ソーシャルディダクションゲーム)の完全なゲームを完了することはほぼ不可能です。
さらに、ロールプレイ技術における現在の研究は、主にユーザーとキャラクター間の一対一のチャットに焦点を当てており、現実的な環境におけるキャラクターの意思決定プロセスへの注目は限られています。この研究ギャップにより、キャラクターは複雑な状況に直面すると優柔不断な行動を示します。この限界に対処するには、特に複雑なマルチエージェントシナリオにおけるキャラクターの能力を強化する、ロールプレイ技術のさらなる進歩が必要です。
【解説ノート】 結論では、BookWorldの主要な貢献と限界が簡潔にまとめられている。このシステムの最大の特徴は、既存の文学作品の世界観やキャラクターを忠実に再現しながら、新たな物語を創造できることにある。実験結果はこのアプローチの有効性を示している。
しかし、一般化可能性とオープン性を優先した結果、特定の作品やシナリオに特化したシステムよりも性能面では劣る部分があるという限界も正直に示されている。例として挙げられているウェアウルフゲームは、社会的推論や欺瞞などの複雑な相互作用が必要とされるが、現在のBookWorldでは完全に実現することは難しい。
また、現在のロールプレイ技術が主にユーザーとキャラクターの一対一の対話に焦点を当てており、複雑な環境でのキャラクターの意思決定プロセスに関する研究が限られていることも限界として挙げられている。これは今後の研究課題として重要な示唆を与えている。
これらの限界は、BookWorldが今後さらに発展する可能性と方向性を示すものであり、研究の透明性と誠実さを示している。
3. 詳細内容抽出と分析
3.1 メタデータ
- Title: BookWorld: From Novels to Interactive Agent Societies for Creative Story Generation
- Authors: Yiting Ran, Xintao Wang, Tian Qiu, Jiaqing Liang, Yanghua Xiao, Deqing Yang (复旦大学 / Fudan University)
- Venue: arXiv preprint
- Date: 2025年4月20日
- Keywords: 大規模言語モデル、マルチエージェントシステム、物語生成、社会シミュレーション
- Citations: 論文内引用文献22件(Park et al., 2023; Chen et al., 2024など)
3.2 Abstract Analysis
アブストラクトは研究の背景、ギャップ、提案、結果を効果的に構成している。大規模言語モデル(LLM)の進歩により社会シミュレーションが可能になったが、既存の架空世界のシミュレーションは未開拓であるという研究ギャップを明確に特定している。この課題に対処するために「BookWorld」というシステムを提案し、その主な特徴(多様なキャラクター、世界観、地理的制約など)を簡潔に述べている。実験結果として75.36%の勝率で既存手法を上回ったことを具体的数値で示し、信頼性を高めている。プロジェクトページURLも提供され、研究の透明性とアクセシビリティを確保している。
3.3 Introduction Deep Dive
イントロダクションは「ソフィーの世界」からの引用で始まり、研究の哲学的基盤を提示している。これは単なる技術的な実験ではなく、架空のキャラクターに自律性を与えるという深い問いに基づく研究であることを示唆している。研究の背景として、LLMを活用したマルチエージェントシステムの可能性と、既存研究が新たなペルソナ定義に焦点を当てている現状を詳細に説明している。
BookWorldの主要な特徴として以下が強調されている:
- 原作本からのキャラクターデータと背景知識の抽出
- キャラクターのロールエージェントとシミュレーション制御のためのワールドエージェントの設計
- シーン単位での進行とキャラクターの記憶・状態の更新
- 人間の介入を可能にするインターフェース
- 架空作品特有の世界観データの抽出と活用
研究の貢献として、架空世界シミュレーションにおける最初の研究であること、包括的なフレームワークの提供、そして実験による有効性の検証が明確に示されている。
3.4 Method and Implementation
BookWorldは主に2つのコンポーネントから構成されている:
- ロールエージェント
- 静的属性(性別、年齢、外見、性格)と動的属性(目標、状態、記憶)を持つ
- 短期記憶と長期記憶のメカニズム
- 能動的または反応的なアクション機能(キャラクター相互作用、環境相互作用、相互作用なし)
- ワールドエージェント
- 環境応答の生成
- グローバルイベントの管理と更新
- 全体的なシミュレーションフローの制御
システムはさらに以下の機能を持つ:
- 離散的なマップによる地理空間モデリング
- シーンベースのシミュレーション進行
- フリーモードとスクリプトモードによる制御可能なストーリー生成
- 自動化された情報抽出と世界観データの構築
データ準備に関しては、6つの中国語作品と10の英語作品から情報を抽出し、453のプリセットと9912の世界観設定を構築している。特に世界観データの抽出は、用語(Term)、性質(Nature)、詳細(Detail)、ソース(Source)の4つの属性を持つ構造化データとして実装されている。
3.5 Experimental Design and Results
実験設計では3つの方法を比較している:
- 直接生成 - すべての処理された本のデータでLLMに直接プロンプトを与える
- HoLLMwood - 人間の物語執筆プロセスを模倣するマルチエージェントアプローチ
- BookWorld - 著者らの提案手法
評価指標としては5つの次元を使用:
- 人間性(An)
- キャラクターの忠実さ(CF)
- 没入感と設定(IS)
- 文章の質(WQ)
- ストーリーラインの品質(SQ)または創造性(Cr)
実験は概要ありと概要なしの2つのシナリオで行われた。評価はLLMによる一対比較で行われ、人間評価との相関係数(Cohen's Kappa)が0.637~0.786と高い一致を示している。
結果として、BookWorldは直接生成に対してはすべての次元で優れており、特に没入感(IS)で91.3%~100%と高い勝率を示した。HoLLMwoodとの比較では没入感とキャラクターの忠実さで優れていたが、ストーリーラインの品質や創造性ではモデルにより結果が分かれた。また、Llama-3.3-70Bでは全体的に性能が低下し、モデルの能力がマルチエージェントシミュレーションの複雑さに対応できていない可能性が示唆された。
アブレーション研究では、環境出力の削除が没入感に大きく影響し、シーンモードの無効化がすべての次元で品質低下をもたらすことが示された。
3.6 System Components
BookWorldのシステムコンポーネントは明確な階層構造を持ち、各部分が特定の役割を果たしている:
- データ抽出レイヤー
- 一般情報抽出(キャラクター情報、関係性)
- 世界観データ抽出(用語、性質、詳細、ソース)
- 地理空間情報の構築
- シミュレーション実行レイヤー
- ロールエージェント管理(記憶、目標、行動計画)
- ワールドエージェント制御(環境応答、イベント管理)
- シーン管理とキャラクター選択
- インタラクションレイヤー
- フリーモード(キャラクターの自律的な行動)
- スクリプトモード(ユーザー指定の物語展開)
- 出力生成レイヤー
- シミュレーション記録の収集
- 小説スタイルへの言い換え
各コンポーネントはLLMの能力を最大限に活用し、特に記憶管理やキャラクターの一貫性維持において革新的なアプローチを示している。
3.7 Evaluation Methods
評価方法は一対比較を基本としており、同一の条件で生成された異なる手法の出力を比較する形式を取っている。評価は以下のプロセスで行われた:
- 方法間のペア比較
- BookWorld vs 直接生成
- BookWorld vs HoLLMwood
- 評価指標による採点
- 人間性(An)
- キャラクターの忠実さ(CF)
- 没入感と設定(IS)
- 文章の質(WQ)
- ストーリーラインの品質(SQ)または創造性(Cr)
- 評価方法の信頼性検証
- LLM評価と人間評価の一致度測定
- Cohen's Kappaによる相関係数算出(0.637~0.786)
この評価方法は主観的な物語の質を客観的に評価するための工夫であり、特にLLMによる評価と人間の評価に高い相関があることを示すことで、評価結果の信頼性を高めている。
4. 批判的評価
4.1 Research Quality
本研究は高い研究品質を示している。特に以下の点が評価できる:
- 明確な研究ギャップの特定:既存のマルチエージェント研究が新たなペルソナ創造に焦点を当てる中、既存の文学作品に基づくエージェント社会という未開拓の領域を特定している。
- 体系的な方法論:データ準備、エージェント設計、シミュレーション実行、評価に至るまで一貫した方法論を提示している。特に世界観データの抽出と活用という独自の手法は高く評価できる。
- 詳細な実験と分析:複数のモデル、評価指標、および比較手法を用いた包括的な実験設計を行い、結果を詳細に分析している。アブレーション研究によりシステムの各コンポーネントの寄与度も明らかにしている。
- 限界の誠実な記述:システムの制限事項を正直に記述し、今後の研究方向性を示している点は学術的誠実さを示している。
一方で、以下の点に改善の余地がある:
- 実験データの多様性:使用された作品が主に西洋文学と中国文学に限られており、より多様な文化的背景を持つ作品での検証が望まれる。
- 長期的なキャラクター発展:現在のシステムはシーンベースで短期的な相互作用に焦点を当てているが、長期的なキャラクター発展の評価は限定的である。
4.2 Innovation and Impact
本研究は以下の点で革新的である:
- 書籍ベースのエージェント社会:既存の文学作品からキャラクターと世界観を抽出し、自律的なエージェント社会を構築するという新しいアプローチを提案している。これは従来のマルチエージェントシステムとストーリー生成の両分野に新たな視点をもたらしている。
- 世界観データの体系的抽出:架空作品の暗黙的な知識や設定を構造化するための方法論を開発し、これをシミュレーションに統合している点は非常に革新的である。
- 地理的・文化的制約の組み込み:キャラクターの移動や相互作用に地理的・文化的制約を考慮している点は、より現実的なシミュレーションを可能にしている。
潜在的な影響としては以下が考えられる:
- エンターテイメント産業:愛されている文学作品を拡張し、インタラクティブなコンテンツとして再利用する新たな可能性を提供している。
- 創造的ライティング支援:作家が架空世界やキャラクターの可能性を探索するためのツールとして役立つ可能性がある。
- 社会シミュレーション研究:文学作品をベースにした社会シミュレーションは、架空社会のダイナミクスを理解するための新しい研究方法となりうる。
4.3 Communication Effectiveness
本論文の伝達効率は概ね高いが、いくつかの改善点も存在する:
- 明確な構造と説明:全体的に論文は論理的に構造化されており、システムの設計と機能が明確に説明されている。特に図2のパイプラインの説明は非常に有効である。
- 具体例の効果的な使用:表3の具体例は、システムの機能とその効果を理解するのに役立っている。特に世界観データの有無による出力の違いは説得力がある。
- 技術的詳細のバランス:技術的な詳細と概念的な説明のバランスが良く取れており、読者は複雑なシステムの全体像を把握しやすい。
改善点としては:
- 略語や専門用語の説明:一部の略語(CF、IS、SQなど)がアブストラクトで十分に説明されていない点は改善の余地がある。
- 実験結果の視覚化:表1と表2の数値データは重要な情報を含んでいるが、これをグラフなどでより視覚的に表現するとさらに理解しやすくなるだろう。
- 読者の前提知識:論文は一部のセクションで読者がマルチエージェントシステムやLLMに関する基本的な知識を持っていることを前提としている。より幅広い読者層に向けた基礎概念の簡潔な説明があるとよい。
5. URL 由来の補足資料
URL | Purpose / Content (≤200 字) | Status |
https://bookworld2025.github.io/ | 論文のコードとデータセットを提供するプロジェクトページ。シミュレーション実験の再現と追加実験のためのリソースを含む。 | unavailable |
6. 再現手順メモ
# プロジェクトページが公開され次第、以下のようなコマンドで再現可能と思われる
git clone https://github.com/bookworld2025/bookworld.git
cd bookworld
pip install -r requirements.txt
# データ準備
python scripts/extract_character_info.py --book_path data/books/sample.txt
python scripts/extract_worldview.py --book_path data/books/sample.txt
# シミュレーション実行
python run_simulation.py --config configs/sample_config.yaml --mode free
推定実行環境:
- Python 3.9以降
- CUDA対応GPUが推奨(大規模言語モデルの実行に必要)
- 最低16GB RAM
- 予想実行時間:データ抽出に数時間、シミュレーション実行に1シーンあたり5-10分程度
7. 考察と含意
本研究は、マルチエージェントシステムとストーリー生成の分野に重要な貢献をしている。特に、既存の架空作品に基づくエージェント社会の構築という新しいアプローチは、両分野に新たな研究方向性を示している。
理論的影響としては、キャラクターの自律性と一貫性のバランス、集合的物語創発のメカニズム、架空世界のシミュレーションにおける文化的・社会的制約の重要性など、複数の興味深い概念が提示されている。これらは認知科学、物語理論、社会シミュレーションなどの分野にも波及する可能性がある。
実践的影響としては、エンターテイメント産業(ゲーム、インタラクティブ小説)、教育(文学作品の体験的学習)、創造的ライティング支援などへの応用が考えられる。特に、ユーザーが愛する物語世界に没入し、その拡張に参加できるという可能性は魅力的である。
さらに、このアプローチは社会科学研究のための新しいツールとなる可能性もある。文学作品には人間の相互作用や社会構造に関する豊かな知見が含まれており、これらを計算モデル化することで、人間の社会的振る舞いへの新たな洞察が得られるかもしれない。
8. 限界と今後の課題
本研究には以下のような限界と課題がある:
- インタラクション環境の単純化:一般化可能性とオープン性を優先するため、インタラクティブな環境が単純化されており、特定の複雑なシナリオ(ウェアウルフなどのゲーム)には適していない。
- 意思決定プロセスの制限:複雑な状況におけるキャラクターの意思決定能力が限定的であり、より高度な社会的推論や長期的計画が必要なシナリオでは課題がある。
- モデル依存性:実験結果がモデルによって大きく異なり、特にLlama-3.3-70Bでのパフォーマンス低下は、システムの安定性と一貫性に課題があることを示している。
- 評価の主観性:物語の質の評価は本質的に主観的であり、LLMと人間の評価の間に高い相関があるとはいえ、異なる文化的背景や文学的趣向を持つ読者間での評価の違いは検討されていない。
今後の研究方向性としては:
- より洗練された意思決定モデル:社会的推論、長期的計画、感情的反応などを含む、より複雑な意思決定プロセスの開発。
- クロスカルチャル評価:異なる文化的背景を持つ文学作品でのシステムの評価と、文化横断的な物語生成の可能性の探求。
- ユーザー参加型シミュレーション:ユーザーがより深くシミュレーションに参加し、キャラクターと相互作用できるシステムの開発。
- 物語構造の改善:キャラクター主導のボトムアップアプローチと全体的な物語構造を制御するトップダウンアプローチを統合するメカニズムの開発。
- マルチモーダル拡張:テキストだけでなく、視覚的要素や音声などを含むマルチモーダルな物語体験の創出。
9. 用語集 & 参考文献
Term | 日本語訳/定義 |
大規模言語モデル(LLM) | 大量のテキストデータで訓練され、人間のような文章生成や理解が可能な人工知能モデル。本研究ではエージェントの基盤として利用。 |
マルチエージェントシステム | 複数の自律的なエージェントが相互作用する計算システム。本研究では架空の社会をシミュレートするために使用。 |
ロールエージェント | 特定のキャラクターを演じるエージェント。静的・動的属性を持ち、物語世界内で行動する。 |
ワールドエージェント | 環境応答やイベント管理などを担当するエージェント。物語世界全体の一貫性を維持する役割を持つ。 |
世界観データ | 架空世界の社会規範、文化的背景、特殊用語などに関する構造化されたデータ。エージェントの行動の一貫性を保つために使用。 |
シーン | 物語の最小単位。同じ場所にいるキャラクター間の相互作用のまとまり。 |
長期記憶(LTM) | エージェントが過去の経験から抽象化した記憶。必要に応じて検索可能。 |
短期記憶(STM) | エージェントが現在の状況で利用する直近の詳細な記憶。容量制限あり。 |
フリーモード | キャラクターが完全に自律的に行動するシミュレーションモード。 |
スクリプトモード | ユーザー指定の概要に従ってシミュレーションが進行するモード。 |
参考文献
(Park et al., 2023) Park, J. S., O'Brien, J., Cai, C. J., Morris, M. R., Liang, P., & Bernstein, M. S. (2023). Generative agents: Interactive simulacra of human behavior. In Proceedings of the 36th annual acm symposium on user interface software and technology, pages 1–22.
(Chen et al., 2024) Chen, J., Zhu, X., Yang, C., Shi, C., Xi, Y., Zhang, Y., Wang, J., Pu, J., Zhang, R., Yang, Y., et al. (2024). Hollmwood: Unleashing the creativity of large language models in screenwriting via role playing. arXiv preprint arXiv:2406.11683.
(AL et al., 2024) AL, A., Ahn, A., Becker, N., Carroll, S., Christie, N., Cortes, M., Demirci, A., Du, M., Li, F., Luo, S., et al. (2024). Project sid: Many-agent simulations toward ai civilization. arXiv preprint arXiv:2411.00114.
(McKee, 1999) McKee, R. (1999). Story: Substance, Structure, Style, and the Principles of Screenwriting. Methuen film. Methuen.
(Yao et al., 2019) Yao, L., Peng, N., Weischedel, R., Knight, K., Zhao, D., & Yan, R. (2019). Plan-and-write: Towards better automatic storytelling. In Proceedings of the AAAI Conference on Artificial Intelligence, volume 33, pages 7378–7385.
(Wang et al., 2023b) Wang, Y., Lin, J., Yu, Z., Hu, W., & Karlsson, B. F. (2023b). Open-world story generation with structured knowledge enhancement: A comprehensive survey. Neurocomputing, page 126792.
(Yuan et al., 2024) Yuan, X., Yuan, S., Cui, Y., Lin, T., Wang, X., Xu, R., Chen, J., & Yang, D. (2024). Evaluating character understanding of large language models via character profiling from fictional works. arXiv preprint arXiv:2404.12726.