※本記事は、2024年12月4日に開催されたGLOCOM六本木会議オンライン#89「生成AIで2025年のはたらき方を創造する~プロンプトとAI 合わせ技で活用の幅を広げる~」の内容を基に作成されています。本セッションはZoomウェビナーとして配信され、約130名が参加しました。セッションの詳細は https://roppongi-kaigi.org/ でご覧いただけます。 本記事は、主に登壇者である橋本大也氏(デジタルハリウッド大学教授)の発言内容を中心に構成されています。橋本氏は『頭がいい人のChatGPT & Copilotの使い方』(かんき出版)の著者で、2024年に2000時間以上の生成AI使用実績を持つ実践者です。 なお、本記事の内容は講演の要旨を正確に反映するよう努めていますが、要約や解釈による誤りがある可能性があります。正確な情報や文脈については、オリジナルの講演動画(https://www.youtube.com/watch?v=KTP5FSrVsQw )をご視聴いただくことをお勧めいたします。 GLOCOM六本木会議は、国際大学グローバル・コミュニケーション・センターが主催する、情報社会の課題や論点を共有し理解を深めるための活動です。2017年9月の設立以来、情報通信分野における革新的な技術や概念について、産官学民による議論の場を提供しています。
1. はじめに
1.1. 講演者の紹介と背景
本講演の登壇者である橋本大也氏は、デジタルハリウッド大学教授およびメディアライブラリー館長を務めています。橋本氏は、ビッグデータと人工知能の技術ベンチャー企業であるデータセクション株式会社の創業者として知られており、同社を上場させた後、顧問に就任し、教育者および事業家として新たな道を歩んでいます。
現在は、教育とIT領域でのイノベーションを追求しており、多摩大学大学院客員教授、早稲田情報技術研究所取締役も兼任しています。また、プロンプト・エンジニアリングの教育コンテンツを開発するブンシン社のCEOとしても活動しています。
著書には「頭がいい人のChatGPT & Copilotの使い方」(かんき出版)、「英語は10000時間でモノになる」(技術評論社)、「データサイエンティスト データ分析で会社を動かす知的仕事人」(SB新書)、「情報力」(翔泳社)があり、翻訳書として「アナロジア AIの次に来るもの」(早川書房)を手がけています。
特筆すべきは、橋本氏の生成AI活用実績です。2024年には2000時間以上の生成AI利用経験を持ち、その豊富な経験と知見を活かして、実践的な生成AI活用法の教育や研究を行っています。「頭がいい人のChatGPT & Copilotの使い方」は、この実践的な経験に基づいて執筆され、ベストセラーとなっています。
本講演は、グローコム六本木会議オンライン#89として、2024年12月4日にZoomウェビナーで開催され、約130名の参加者にライブ配信されました。これは橋本氏にとって、生成AIシリーズとしては3回目の登壇となります。第1回目は2023年7月に「生成AIブームとその次に来るもの」をテーマに、第2回目は2024年2月に「ChatGPT & コーパイロットプラスアルファ一歩進んだ面白い活用法」をテーマに講演を行っています。
1.2. 本講演の目的と概要
本講演は、生成AIの急速な進化に伴う使い方の変化と活用範囲の拡大について、実践的な観点から解説することを目的としています。生成AIの世界は変化が早く、特に2024年春に橋本氏の著書『頭がいい人のChatGPT & Copilotの使い方』が出版された後も、様々な新しい生成AIが登場し、技術の進化が続いています。
今回の講演では、特に「AIの合わせ技」という観点に焦点を当てています。これは、単一のAIツールの使用だけでなく、複数の生成AIを組み合わせることで、より創造的で効果的な成果を生み出す方法についての提案です。
この背景には、生成AIの急速な進化に伴い、AIを使用するユーザー側にもより高度な知識と創造性が求められているという現状があります。AIが賢くなればなるほど、それを使いこなすユーザーもより賢くならなければならないという逆説的な状況が生まれています。
また、新しいクリエイティブな使い方を開拓する冒険精神や遊び心の重要性も強調されています。特に2025年に向けて、生成AIの活用範囲はさらに広がっていくことが予想され、従来の枠にとらわれない創造的な活用方法の開発が重要になってきています。
本講演では、これらの課題に対して、実際の活用事例や実験結果を交えながら、今後のAI活用の方向性を示すとともに、ユーザーに求められる新しいスキルや考え方についても提示していきます。特に、複数のAIを組み合わせた「合わせ技」の実践例を通じて、生成AIの新しい可能性を探っていきます。
2. 生成AIの実験と活用事例
2.1. AIを活用した映像制作の実験(テッドネルソンのケース)
橋本氏:先週、私は京都大学で開かれたテッドネルソンの来日公演イベントに参加しました。テッドネルソンは87歳で、ザナドゥというコンセプトを考案した人物です。ザナドゥは、インターネットの原型とも言われるもので、ハイパーテキストやテキスト同士のリンクなど、そういうハイパーテキスト・ハイパーネットワークの世界を、まだコンピューターが普及していない時代に想像し提唱していました。そのコンセプトに啓発されて現在のインターネットが生まれたと言えます。
このテッドネルソンについて、私は4つのAI(ChatGPT、Midjourney、クリップチャンプ、音声フォント)を連携させて映像を制作する実験を行いました。まず、ChatGPTにテッドネルソンのザナドゥの仕組みを可視化するよう依頼すると、インターネットの原型を示す図を生成してくれました。
次に、テッドネルソンの人生を説明する5枚の絵を生成するよう依頼しました。最初は検索せずに架空の人生を描いてしまいましたが、ChatGPTの検索機能を使って正確な情報を収集した後、改めて生成し直しました。その結果、1940年代の幼少期、1950年代の大学生時代、ザナドゥプロジェクトに取り組む様子、1980年代の技術会議での説明、2000年代のデジタル世界への影響を振り返る姿など、5つの時期の絵を生成することができました。
さらに、現代のハイパーテキストとテッドのザナドゥの違いについて説明を求め、それをPowerPointのプレゼンテーションに変換しました。ChatGPTは背後にPythonプログラミング言語が内蔵されているため、PowerPointを作成するライブラリを使用して自動的にスライドを生成しました。
その後、各画像とスライドに対するナレーションを音声フォントで生成し、BGMはSuno AIで作成しました。最後にWindows付属のクリップチャンプで全ての要素を組み合わせ、字幕付きの映像を完成させました。
この一連の作業はわずか45分で完了し、テッドネルソンの人生とザナドゥの概念を分かりやすく説明する映像コンテンツを作り上げることができました。これは複数のAIを組み合わせることで可能になった新しいコンテンツ制作の形だと考えています。数年後には、このような複数のAIの連携が一発で自動的に行われるようになるかもしれません。
2.2. 主要20カ国リーダーの比較分析
橋本氏:次にAIの特性の違いが分かる面白い分析として、ChatGPT、Claude、Geminiを使った各国リーダーの比較実験を行いました。まずChatGPTに対して、世界の主要20カ国のトップのプロフィールを表にして、国名、名前、年齢、経歴、人気度(10段階)、独裁度(10段階)、主な政策という項目で作成するよう依頼しました。ChatGPTは検索機能があるため、すでに岸田総理から新しく就任した舛添総理の情報まで含めた最新のデータを提供してくれました。
次に、同じ依頼をClaudeに行いました。Claudeは検索機能がないため、データが若干古く、日本の首相が岸田文雄のままでした。さらにGeminiでも同様の分析を依頼したところ、Googleの検索機能を使用できるため、最新の情報を含んだデータを提供してくれました。
これら3つのAIが作成したデータを比較分析したところ、興味深い特性の違いが見えてきました。例えば、トップの人気度の平均値を計算すると、Claudeが最も大きい数値を出す傾向があり、Geminiが最も控えめな評価をしていました。また、記述量ではChatGPTが最も詳細な経歴説明を提供していました。
3つのAIの評価を平均すると、人気度が高い国のリーダーとして中国、インド、インドネシア、メキシコ、ロシア、サウジアラビア、イタリア、オランダ、トルコ、ブラジル、ポーランドが上位に挙がり、日本は5.3ポイントと下位に位置しました。アメリカも中間よりも下位でした。
独裁度については、中国、サウジアラビア、ロシア、トルコ、インドが上位となり、アメリカと日本は最下位付近に位置していました。これは民主主義の度合いを反映している可能性があります。
人気度をX軸、独裁度をY軸にマッピングし、クラスタリング分析を行うと、「独裁度高め・認知度高め」「独裁度低め・認知度中程度」「独裁度中程度・認知度高め」という3つのクラスターに分類することができました。
この分析を通じて、各AIの特徴が明確になりました。ChatGPTは中庸で平均的な評価を行い、Claudeは想像力が高く特徴を強調する傾向があり、Geminiは最も保守的で控えめな評価を行う傾向が見られました。これは他の分析でも一貫して見られる各AIの個性だと考えています。
2.3. 六本木会議オンライン盆踊りの作成実験
橋本氏:私は過去87回分の六本木会議オンラインの開催データを全てテキストにまとめ、Claudeに投げかけてみました。Claudeは最もクリエイティブなAIですので、このデータを基に面白い分析をしてくれると考えたからです。
まず、このデータを読み込ませ、キャッチコピーの特徴を分析させたところ、「〜を探る」「〜を考える」「最前線」「同行」「これから」「緊急開催」という言い方や、「〜とは何か」という本質を問う表現が特徴的だと指摘してくれました。
この分析結果を踏まえて、六本木会議オンライン盆踊りの作成をお願いしました。すると、「よいよいDX そろそろAI みんなでもうデジタルか」「世界で繋がる情報の輪」といった歌詞を作ってくれました。
この歌詞をSuno AIに入力して音楽を生成しようとした時、私は面白い試みをしてみました。スタイルオブミュージックという欄に「日本の盆踊り」と入力したのです。すると、予想以上に日本の盆踊りらしい音楽を生成してくれました。
歌詞は「それ六本木で未来を語る オンライン今日も明日もつづくよ デジタル社会そ来るぞ よいよいDX それそれみんなで進もうデジタルか 世界とつながる情報の輪」といった内容で、さらに「ChatGPTにさんすみさんも加わって 先生で夢を見る令和の時代」といった具合に、過去の会議で出てきた生成AIの名前なども取り入れられていました。
これは驚きでした。AIが過去の会議データを理解し、その文脈を活かしながら、日本の伝統的な盆踊りの形式に合わせて新しい歌を作り出したのです。特に、キーワードを拾って歌詞に組み込んでいる点は、AIの理解力の高さを示していると思います。
2.4. レトロ風動画制作の実験
橋本氏:私は次に、ロモグラフィーというレトロフィルムカメラの特徴を生かした映像制作実験を行いました。AIに「日本の街角写真をロモグラフィー風に生成して」と指示したところ、レトロな雰囲気の画像を生成してくれました。その画像が良い出来だったので、同じプロンプトで10回繰り返して10枚の画像を生成しました。
これらの画像をLeiapixという動画化AIに入力し、画像を動画として連結しました。さらに、Suno AIで音楽を生成して、映像と組み合わせました。この時、異なる雰囲気の音楽を試してみました。例えば「エイリアン」や「ダンシングクイーン」、「80年代」といったキーワードで音楽を生成すると、それぞれ全く異なる雰囲気の作品が出来上がりました。
この実験は、画像生成AI、動画編集AI、音楽生成AIという異なる種類のAIを組み合わせることで、クリエイティブな作品制作が可能になることを示しています。特に興味深いのは、それぞれのAIが生成した要素を組み合わせることで、単独のAIでは作れないような独特の雰囲気や世界観を持つコンテンツを作り出せる点です。
3. 主要生成AIの特徴と比較
3.1. ChatGPT(GPT-4)の特徴と進化
橋本氏:ChatGPTの最近の大きな変化は、2023年秋に発表されたGPT-4 Turboプレビューの登場です。これは現在最も頭がいいAIと言えるかもしれません。特に思考の深さが他のバージョンとは異なります。
OpenAIが公開している数値データによると、GPT-4 Turboは以前のバージョンと比較して、あらゆる面で能力が向上しています。特にコーディング能力が大幅に改善されており、私はその能力の高さに驚かされました。
GPT-4 Turboの特徴的な点は、考える時間が長いことです。他のAIは1〜2秒で回答を返しますが、このモデルは数分かけて深く考えてから回答を出します。例えば、私が「賛否両論がある問題を100個リストにしてカテゴリー分類し、難易度の星最高5つをつけて、それぞれ詳しく解説して」と依頼したところ、55秒間考えた後に100個の問題を詳細に分析して回答してくれました。
さらに興味深いのは、これらの問題に「キャッチーな議論の問い」をつけることもできました。例えば、移民政策の改革という項目に対して「移民は国の活力か、それとも脅威か」というような問いを設定してくれます。このデータはCSVファイルとしてダウンロードすることもでき、全100個の問題が難易度、カテゴリー、解説、議論の問いとともに整理されています。
従来のGPT-4では解けなかった複雑な論理問題も解けるようになりました。例えば「王女の年齢は王子が次の年齢になった時と同じです。その年齢とは王女の年齢が王子の過去のある時点での年齢の2倍になる時の王子の年齢です。そして、その過去の時点とは王子の年齢が王子との現在の年齢の合計の半分だった時です」というような複雑な問題も、数分かけて正確に解答することができます。
このように、パーソナルライティング以外の分野、特にコンピュータープログラミング、データ分析、数学計算において、GPT-4 Turboは以前のバージョンを大きく上回る性能を示しています。
3.2. Claude(Anthropic)の新機能と特徴
橋本氏:現在、Claudeは最大のChatGPTのライバルと言えます。最近、Artifactsビジュアル、PDFs、プロジェクツ、コンピューターユースという4つの重要な機能をリリースしました。
特にClaudeの特徴は、その想像力の高さです。ChatGPTは当たり前のことしか言わないのに対して、Claudeは面白いことを言ってくれます。エッセイを書かせたり、小説を書かせたり、歌詞を書かせたりする際には、Claudeが抜群に良い成果を出してくれます。また、言語能力としても最高峰で、日本語の能力もChatGPTより現在は上です。
ただし、弱みとしてWeb検索機能がないことと画像生成機能がないという制約があります。これはある意味で、Claudeの創造性の高さと表裏一体かもしれません。検索に頼らないからこそ、独自の発想で面白い表現ができるのだと考えています。
例えば、最近ニューヨークタイムズの「ジョーズ」に関する長い記事を分析させる実験を行いました。英語の長文をClaudeに入力し、翻訳とポイントの抽出を依頼したところ、新しいArtifacts機能を使って、フローチャート形式で時系列に沿った分かりやすい可視化を行ってくれました。ベンチリー(「ジョーズ」の原作者)の人生を、執筆開始から映画化、そしてサメ保護活動に従事するまでの流れを、視覚的に整理してくれたのです。
このように、Claudeは単なる文章生成だけでなく、情報の構造化や視覚化においても優れた能力を発揮します。ただし、その能力を最大限に活用するためには、検索機能の制約を理解した上で、適切なプロンプトを与える必要があります。
3.3. Google Geminiの特徴と強み
橋本氏:Googleが開発したGeminiは、Google製品との連携が最大の強みです。私が実験したところ、例えば「六本木に近い美味しいラーメン店を5件熱くリコメンドして」と尋ねると、店舗の紹介と共にGoogleマップも表示してくれます。マップ上の店舗をクリックすれば、通常のGoogleマップとして詳細情報にアクセスできます。
また、新刊書籍の情報を尋ねると、Googleの検索機能を活用して最新の情報を提供してくれます。例えば、「ユヴァル・ノア・ハラリの最新刊ネクサスの内容と評価を教えてください」と質問すると、まだ翻訳が出ていない本についても、2025年3月5日に河出書房から日本語版が出版予定であるといった最新情報まで教えてくれます。
Geminiの特筆すべき機能として、ファクトチェック機能があります。回答の下部にある「ダブルチェックレスポンス」というボタンをクリックすると、Googleを使ったファクトチェックが実行されます。回答内容が緑色でハイライトされた部分はウェブ上で裏付けが取れた情報、赤色の部分は裏付けが取れない可能性のある情報として表示されます。さらに、緑色の部分についてはその情報源となるリンクも表示されます。
また、Gmailとの連携機能も特徴的です。例えば「六本木会議についてメールのやり取りを要約して」と依頼すると、私のGmailにアクセスして関連するメールを分析し、会議の詳細や進行状況を要約してくれます。
ただし、Geminiは他のAIと比べて非常に保守的な回答傾向があります。これは、以前Googleの別のAIが問題発言で炎上した経験を踏まえ、安全策を重視している結果だと考えられます。そのため、創造的な表現や大胆な提案は期待できませんが、確実で信頼性の高い情報を得る用途には適しています。
3.4. GitHub Copilotの進化と特徴
橋本氏:GitHub Copilotは基本的にChatGPTの兄弟のようなもので、中身はChatGPTと似ていますが、大きな特徴としてMicrosoft製品との連携があります。特に、WindowsのOSやMS Officeとの連携が強みとなっています。
最近、Copilotの進化が顕著に表れているのがパワーポイントとの連携です。Microsoft 365を利用していると、パワーポイントにCopilotが搭載されており、プレゼンテーションの作成を支援してくれます。以前はこの機能の精度が最悪で全く使い物にならなかったのですが、最近はかなり賢くなってきました。
例えば、「AI翻訳の時代に人間が英語を学ぶ意義について」というテーマでプレゼンテーションを作成するよう依頼すると、まず構成を提案してくれ、その後スライドを自動生成してくれます。生成されたスライドには画像やアニメーションも含まれており、デザイン面でもある程度の完成度を備えています。
ただし、現時点でもまだGamma(パワーポイント生成専用AI)と比べると見劣りする部分があります。例えば、同じテーマでGammaに依頼すると、より洗練されたデザインと充実した内容のプレゼンテーションを作成してくれます。しかし、CopilotはMicrosoft製品との統合が進んでいるため、既存のOffice環境での作業効率を高めるツールとしては非常に有用です。
3.5. AIごとの性格の違いと使い分け
橋本氏:私の評価では、現在の主要な生成AIは、多能性(総合性)と創造性(想像性)という2つの軸で特徴を整理することができます。それぞれのAIの位置づけを説明させていただきます。
ChatGPTは総合力でトップに位置しています。特にPythonとの連携によるデータ分析が得意で、さらに多彩なGPT、外部のアプリケーションとの連携が可能という点が大きな魅力です。常に中庸な立場で、極端な回答を避ける傾向があります。
Claudeは想像性が非常に高いのが特徴です。ChatGPTが当たり前のことしか言わないのに対して、Claudeは面白い発想や独創的な表現を提供してくれます。エッセイ、小説、歌詞の作成などクリエイティブな作業において抜群の能力を発揮します。また、日本語の言語能力としても現在はChatGPTより優れています。ただし、Web検索機能や画像生成機能がないという制約があります。
Googleが開発したGeminiは、非常に保守的な回答傾向を持っています。面白いことはあまり言ってくれませんが、その分、信頼性の高い情報を提供してくれます。Googleのアプリケーションとのシームレスな連携が最大の魅力です。
Copilotは基本的にChatGPTと似た特性を持っていますが、検索機能とOSやMS Officeとの連携が強みです。特にWindows環境での作業効率を高めるのに適しています。
これらのAIを使い分ける際のポイントとして、例えば文章作成では、一般的な文書はChatGPT、創造的な文章はClaude、事実確認が必要な文書はGeminiというように、目的に応じて適切なAIを選択することが重要です。データ分析にはChatGPTが向いていますし、Office文書の作成にはCopilotが便利です。
私の経験では、これらのAIを組み合わせて使用することで、それぞれの長所を活かしながら、より質の高い成果物を作り出すことができます。ただし、現時点ではAIごとに得意分野が異なるため、目的に応じた適切な使い分けが必要です。将来的には一つのAIで全ての機能をカバーできるようになるかもしれませんが、当面は複数のAIを状況に応じて使い分けていく時代が続くと考えています。
4. 各AIの最新機能と活用法
4.1. ChatGPT-4のプログラミング能力
橋本氏:ChatGPT-4は文系の言語モデルでありながら、その背後にPython実行環境を持っているという特徴があります。私から見ると、これは文系と理系が融合したAIだと言えます。ユーザーがデータの分析やグラフの作成が必要な質問や要求を入力すると、ChatGPTはPythonのプログラムを書いて実行し、その結果を文章にして返してくれます。
例えば、sin波とcos波のグラフのアニメーションを作ってほしいと依頼すると、すぐにアニメーションを出力してくれます。また、プログラミング言語の人気度に関するオープンデータを分析する際には、2004年から2023年までの推移をグラフ化してくれます。
当初、グラフは同系統の色で読みにくかったのですが、「同系統の色で識別しにくい」と指摘すると、グラフを自動的に書き直してくれました。このグラフから、Pythonが2004年にはマイナーな言語だったものの、徐々に人気を上げて現在は最も人気のある言語になっていることや、Javaが2004年には非常に人気があったものの現在は少し落ちてきていること、JavaScriptは安定した人気を保っていることなどが分かります。
さらに興味深いのは、グラフを作るだけでなく、詳細な説明も提供してくれる点です。例えば「現在最も人気のプログラミング言語を5つ説明して」と依頼すると、Pythonについて「データサイエンス、機械学習、ウェブ開発、自動化など幅広い用途で使われる汎用性の高いプログラミング言語です。そのシンプルで読みやすい構文は初心者にも学びやすく、幅広いコミュニティと豊富なライブラリーに支えられています」といった具合に、詳細な解説を提供してくれます。
このように、ChatGPT-4は単なるコード生成やデータ分析だけでなく、その結果を人間にとって理解しやすい形で説明できる点が大きな特徴です。これはPythonという理系の実行環境と、言語モデルという文系の能力が組み合わさっているからこそできる芸当だと考えています。
4.2. Claudeの新機能(Artifacts, Visual PDFs, Projects, Computer Use)
橋本氏:Claudeが最近リリースした新機能の中でも特に注目すべきなのが、Artifacts、Visual PDFs、Projects、Computer Useという4つの機能です。
Visual PDFs機能は、これまでのAIが苦手としていたPDFの解析を可能にしました。例えば、私がクールジャパン戦略関連基礎資料という内閣府が作成した長い資料をアップロードし、「イギリスの国民1人当たりの年間コンテンツ消費額(2021年)は?」と質問したところ、何百ページもある資料の中から該当するグラフを見つけ出し、「2021年時点で9.9万円です。資料の9ページにあるグラフから、イギリスは日本(10.3万円)に次いで3番目に高い消費額となっていることが分かります」と正確に回答してくれました。
Projectsという機能では、私が書いた200本の書評をアップロードし、それを基にした推薦システムを作成することができました。「橋本大也が英語で書いた書評を精査してユーザーの質問に合致する本を選んでお勧めしてください。調子は情熱的に本の内容を面白く感じさせるスタイルで。必要に応じてお勧め度も5段階で表示する」という指示を与えると、私が書いた書評の内容を理解した上で、質問に応じて適切な本を推薦してくれます。
Computer Use機能は最も革新的で、AIがユーザーのコンピュータを操作して作業を行うことができます。ただし、セキュリティ上の懸念から、私は安全のためにUbuntuという仮想環境で実験を行いました。「今日のトップニュースをWebで3つ調べて、エディタを立ち上げて今日の出来事という軽妙なエッセイを書いて」と指示すると、AIが自動的にFirefoxを起動し、ニュースを確認し、テキストエディタで文章を作成して保存までしてくれました。
これらの機能は、まだ発展途上ではありますが、AIによる業務支援の新しい可能性を示していると考えています。ただし、特にComputer Use機能については、セキュリティ面での慎重な対応が必要です。
4.3. Geminiの検索連携とファクトチェック機能
橋本氏:Geminiには、Googleの検索機能との緊密な連携という大きな特徴があります。例えば、「六本木に近い美味しいラーメン店を5件熱くリコメンドして」と質問すると、店舗の紹介だけでなく、Googleマップと連動して場所も表示してくれます。その情報をクリックすれば、すぐにGoogleマップの詳細情報にアクセスすることができます。
Geminiのもう一つの革新的な機能は、ファクトチェック機能です。回答の下部にある「ダブルチェックレスポンス」というボタンをクリックすると、生成した情報の信頼性をGoogle検索を使って自動的に確認してくれます。たとえば、「地球の自転が止まるとどうなるか」という質問に対して、「地球は時速1,700kmで自転しているから強ブレーキがかかったようになって全て吹き飛ぶ」「巨大津波が起きて海水が東へ移動する」といった回答が生成されたとします。この回答に対してファクトチェックを実行すると、ウェブ上で裏付けが取れない情報は赤色でマークされ、信頼性に疑問があることを示してくれます。
また、Gmail連携機能も非常に便利です。私が実際に試してみたところ、「六本木会議についてメールのやり取りを要約して」と依頼すると、私のGmailにアクセスして関連するメールを分析し、「12月4日開催の六本木会議オンライン#89に関して、11月11日までに講演テーマと概要を提出するよう小林さんから依頼があり、私は11月1日に提出しました」というように、時系列に沿って要約してくれました。
このような機能は他のAIにはない特徴で、特にGoogleのサービスを日常的に使用している人にとっては非常に便利です。ただし、Geminiは安全性を重視するあまり、回答が保守的になる傾向があり、クリエイティブな表現や大胆な提案は期待できません。
4.4. Copilotとパワーポイント連携
橋本氏:Copilotのパワーポイント連携機能は、Microsoft 365を使用している場合に利用できます。最近になってようやく使えるレベルまで進化してきました。例えば私が試してみたところ、「AI翻訳の時代に人間が英語を学ぶ意義について」というテーマでプレゼンテーションを作成するよう依頼すると、まず構成を提案し、その後でスライドを自動生成してくれました。
また、「完璧なお米の炊き方」というテーマでプレゼンテーションを作成させてみると、お米の種類やブランド、米の準備から炊き方まで、体系的にまとめたスライドを作成してくれました。画像やアニメーションも含まれており、ある程度の完成度を備えていました。
ただし、パワーポイント生成専用AIのGammaと比較すると、まだ見劣りする部分があります。同じテーマをGammaで作成すると、より洗練されたデザインと充実した内容のプレゼンテーションが生成されます。
このように、Copilotのパワーポイント連携機能は、まだ発展途上の段階ではありますが、Microsoft製品との統合が進んでいるため、既存のOffice環境での作業効率を高めるツールとして活用することができます。将来的には、よりクオリティの高いプレゼンテーション作成が可能になることが期待されます。
5. 生成AIの合わせ技活用
5.1. 異なるAIの組み合わせ手法
橋本氏:私の実験では、生成AIを組み合わせることで、単独のAIでは実現できない創造的な成果を生み出すことができました。例えば、テッドネルソンについての映像制作では、ChatGPTで文章を生成し、Midjourneyで画像を作成し、音声フォントでナレーションを生成し、Suno AIで音楽を作り、最後にクリップチャンプで全てを統合するという手法を用いました。
また、データ分析においても、複数のAIを組み合わせることで、より深い洞察を得ることができます。ChatGPT、Claude、Geminiという3つのAIに同じ分析を依頼し、その結果を比較することで、より客観的で多角的な視点を得ることができました。例えば、世界の主要20カ国のリーダー分析では、各AIの特性の違いが明確に表れ、それぞれの視点を組み合わせることで、より包括的な分析が可能になりました。
音楽と映像の制作においては、テキスト生成AI、画像生成AI、音楽生成AI、動画編集AIを組み合わせることで、わずか数十分で完成度の高いコンテンツを作り出すことができました。これは、各AIの得意分野を活かしながら、それぞれの出力を効果的に組み合わせる「合わせ技」の好例です。
現時点では、それぞれのAIが独立して進化を遂げている段階ですが、将来的にはこれらの機能が一つのAIに統合される可能性もあります。しかし、当面は複数のAIを目的に応じて使い分け、組み合わせていく時代が続くと考えています。そのため、各AIの特性を理解し、効果的な組み合わせ方を知ることが、生成AI活用の重要なスキルとなっています。
5.2. テキスト・画像・音声AIの連携事例
橋本氏:実際の制作事例として、私は音楽・動画AIとの合わせ技を試してみました。例えば、Rumaという動画のAIで静止画を作り、それを動かすAI、音楽を作るSuno AIなどを、ChatGPTやClaude、GeminiのようなテキストベースのAIと組み合わせることで、興味深い成果を得ることができました。
特に印象的だったのは、過去87回分の六本木会議オンラインの開催データを使った実験です。このデータをClaudeに読み込ませ、分析させたところ、会議のキャッチコピーには「〜を探る」「〜を考える」「最前線」「同行」「これから」「緊急開催」という言い方や、「〜とは何か」という本質を問う表現が特徴的だと指摘してくれました。この分析結果を基に、六本木会議オンライン盆踊りの歌詞を作成してもらい、それをSuno AIに入力して音楽を生成しました。
また、ロモグラフィーというレトロフィルムカメラの特徴を活かした実験も行いました。AIに「日本の街角写真をロモグラフィー風に生成して」と指示し、同じプロンプトで10回生成した画像を取得しました。これらの画像をLeiapixで動画化し、Suno AIで生成した音楽と組み合わせました。音楽のスタイルを「エイリアン」「ダンシングクイーン」「80年代」など様々に変えることで、全く異なる雰囲気の作品を作ることができました。
これらの実験を通じて、異なるメディア形式のAIを組み合わせることで、単独のAIでは生み出せないような創造的な作品が可能になることが分かりました。特に、テキスト生成AIで作品のコンセプトを固め、それを画像生成AIや音楽生成AIに渡して具体化し、最後に動画編集AIで統合するという工程が効果的でした。
現時点では、これらの作業は個別のAIを手動で連携させる必要がありますが、数年後には複数のAIが自動的に連携して作品を作り上げることも可能になるのではないかと考えています。
5.3. プレゼンテーション作成での活用方法
橋本氏:プレゼンテーション作成においては、複数のAIを組み合わせることで、より質の高い資料を効率的に作成することができます。私の実験では、例えば「完璧なお米の炊き方」というテーマで、異なるAIを使って比較してみました。
まずCopilotのパワーポイント機能を使用すると、お米の種類やブランド、米の準備から炊き方まで、体系的にまとめたスライドを作成してくれます。しかし、同じテーマをパワーポイント生成専用AIのGammaで作成すると、より洗練されたデザインと充実した内容のプレゼンテーションが得られました。
また、「AI翻訳の時代に人間が英語を学ぶ意義」というテーマでも同様の比較を行いました。Copilotは基本的な構成と内容を提案し、それに基づいてスライドを生成してくれます。一方、Gammaはより体系的で視覚的な訴求力の高いプレゼンテーションを作成してくれました。
このような比較実験を通じて、プレゼンテーション作成では、まずCopilotで基本的な構成を作り、その後Gammaで洗練させるという組み合わせが効果的だと分かりました。特に、Microsoft 365環境で作業する場合は、Copilotの統合機能を活用しつつ、より高度なデザインや構成についてはGammaを併用するという方法が有効です。
プレゼンテーションの質を更に高めるために、必要に応じてChattGPTやClaudeにコンテンツの推敲を依頼したり、Geminiで最新の情報を確認したりすることも効果的です。このように、各AIの特徴を理解し、適切に組み合わせることで、より効率的で質の高いプレゼンテーション作成が可能になります。
5.4. データ分析での活用方法
橋本氏:データ分析者にとって、生成AIは非常に有用なツールとなっています。私の経験では、特にデータのクレンジング、プログラミングコードの生成、グラフ作成、分析結果の説明、そして分析の検証・検算・検定といった作業において、生成AIは大きな力を発揮します。
ChatGPTは特にデータ分析に強みを持っています。なぜなら、背後にPython実行環境を持っているため、ユーザーがデータの分析やグラフ作成が必要な質問をすると、ChatGPTがPythonのプログラムを書いて実行し、その結果を自然な文章で説明してくれるためです。これは文系の言語モデルと理系のプログラミング環境が融合した、まさに文理融合型のAIと言えます。
例えば、プログラミング言語の人気度データを分析する際、ChatGPTは20年間の推移をグラフ化するだけでなく、「Pythonはデータサイエンス、機械学習、ウェブ開発、自動化など幅広い用途で使われる汎用性の高いプログラミング言語です」といったように、データの背景にある文脈まで説明してくれます。
さらに、複数のAIを組み合わせることで、より深い分析が可能になります。例えば、ChatGPT、Claude、Geminiの3つのAIに同じデータ分析を依頼し、結果を比較することで、より客観的で多角的な視点を得ることができます。世界の主要20カ国のリーダー分析では、各AIの特性の違いが明確に表れ、それぞれの視点を組み合わせることで、より包括的な分析が可能になりました。
データの可視化においても、AIは進化を続けています。グラフが見にくい場合は「同系統の色で識別しにくい」と指摘するだけで、AIが自動的にデザインを改善してくれます。また、Claudeの新機能であるArtifactsを使用すると、複雑なデータでもフローチャートやインフォグラフィックスとして分かりやすく視覚化してくれます。
このように、データ分析においては、各AIの特徴を理解し、目的に応じて適切に組み合わせることで、より効率的で質の高い分析が可能になります。特に、分析結果を人間が理解しやすい形で説明できる点が、生成AIの大きな強みだと考えています。
6. 今後の展望と課題
6.1. 2025年に向けた生成AI活用の方向性
橋本氏:2025年に向けて、生成AIはメディアごとに別々の進化を遂げていくと予測しています。現在は、テキスト、画像、音声、動画など、それぞれの領域で専門的なAIが発展している段階です。最近では、セコイアキャピタルが作成した最新の生成AIスタートアップのマップを見ても、各領域で多くの新しいAIが登場していることが分かります。
私は今後、生成AI活用の方向性として、これらの異なるAIを使い分けたり組み合わせたりする時代が当面続くと考えています。いずれは1つのAIで全ての機能をカバーできるようになるかもしれませんが、現時点では各AIがそれぞれの得意分野で進化を続けている段階です。
例えば、映像制作の実験でも示したように、テキスト生成、画像生成、音声生成、動画編集といった異なる機能のAIを組み合わせることで、単独のAIでは実現できないような創造的な成果を生み出すことができます。この「合わせ技」による相乗効果は、今後ますます重要になってくるでしょう。
また、人にできない差別化という観点からも、複数のAIを適切に組み合わせて使いこなす能力が重要になってきます。2025年に向けて、AIツールの選択肢はさらに増えていくと予想され、それぞれのAIの特性を理解し、目的に応じて最適な組み合わせを選択できる能力が、ユーザーに求められるようになるでしょう。
この変化に対応するためには、個々のAIの進化を追いかけるだけでなく、それらを効果的に組み合わせて活用するための創造的な思考力も必要になってきます。2025年は、生成AIの活用において、ツールの選択と組み合わせのスキルが、これまで以上に重要な価値を持つ時代になると予測しています。
6.2. 複数AI活用の重要性
橋本氏:私は、当面は複数のAIを状況に応じて使い分けていく時代が続くと考えています。例えば、私の実験では文章を書かせる時はClaudeが非常に優れた結果を出し、特に日本語の文章は滑らかで質が高いものでした。一方で、データ分析やプログラミングにはChatGPTが適しており、検索や情報の信頼性確認にはGeminiが効果的でした。
また、メディア制作においても、複数のAIを組み合わせることで大きな相乗効果が得られることが分かっています。テキスト生成AI、画像生成AI、音楽生成AI、動画編集AIをそれぞれ得意分野で活用することで、単独のAIでは作れないような質の高いコンテンツを生み出すことができます。
重要なのは、各AIの特性をよく理解し、適切に組み合わせることです。ChatGPTは真ん中よりの回答を出す傾向があり、Claudeは想像力豊かで面白い発想を提供し、Geminiは保守的で安全な回答を心がけます。このような特性の違いを理解した上で、目的に応じて使い分けることで、より効果的な結果を得ることができます。
将来的には一つのAIですべての機能をカバーできるようになるかもしれませんが、現時点では各AIがそれぞれの分野で独自の進化を遂げています。そのため、複数のAIを適切に組み合わせて活用できる能力が、これからますます重要になってくると考えています。
6.3. 産業への影響と変化
橋本氏:生成AIの産業への影響は、既に様々な分野で顕在化してきています。私が特に注目しているのは、コンテンツ制作分野における変化です。例えば、ゲームや映画といった従来型のコンテンツ制作では、数十億円規模の投資と1年以上の制作期間が必要でしたが、生成AIの活用により、この期間とコストを大幅に削減できる可能性が出てきています。
ただし、これは業界全体が単純にコストダウンの方向に向かうということではありません。AIでできることが増えれば増えるほど、いわば「クリエイティビティのインフレ」が起こり、誰でも簡単に作れるようなコンテンツには誰もお金を払わなくなっていく可能性があります。そのため、プロのクリエイターには、AIで作れる水準を超えた、より高度な価値を提供することが求められるようになってくるでしょう。
例えば、映像制作の分野では、AIを活用することで背景描写などの補助的な作業を効率化できます。ジブリのような大手制作会社でも、こういった部分でAIを活用しながら、本質的な創造性が必要な部分に人的リソースを集中させていくことが考えられます。
同時に、YouTubeのように、個人でも高品質なコンテンツを制作・配信できるような新しいマーケットが拡大していくでしょう。AIの登場により、世界中で何億人もの映画監督が生まれ、誰もが自分の映画を発表できる時代が来るかもしれません。そういった中から、また新しいタイプのクリエイターが登場してくる可能性もあります。
つまり、生成AIは産業構造を二極化させる可能性があります。一方では従来型の大規模プロジェクトが、AIを補助的に活用しながらより高度な価値創造を目指し、他方では個人や小規模組織がAIを駆使して、新しい表現や市場を開拓していくという構図です。この変化に対応できるかどうかが、今後の産業界における重要な課題になってくると考えています。
6.4. 人間の役割の変化
橋本氏:生成AI時代において、私たち人間の役割は大きく変化していくと考えています。特に重要なのは、AIが賢くなればなるほど、それを使いこなすユーザー側もより賢くなければならないという点です。これは一見、逆説的に見えるかもしれませんが、実際にAIを使いこなすために必要不可欠な変化です。
例えば、私の実際の業務でも、講演や企業コンサルティング、提案書作成などにおいて、一部をAIが作成したものを活用することがあります。しかし、その際に重要なのは、AIが生成した内容が使えるかどうかを判断し、必要に応じて修正や改善を加えられる能力です。つまり、自分でも作ろうと思えば作れるけれども、時間がかかるから作ってもらうという範囲での活用が望ましいのです。
また、クリエイティブな分野では、AIで誰でも簡単にできることを超えた、より高度な価値を生み出すことが求められるようになります。例えば、映像制作において、背景描写などの補助的な作業をAIに任せることで、より本質的な創造性が必要な部分に人的リソースを集中させることができます。
さらに、複数のAIを適切に組み合わせて使いこなす能力も重要になってきます。それぞれのAIの特性を理解し、目的に応じて最適な組み合わせを選択できる判断力が必要です。これは単なるツールの使い方を覚えるということではなく、各AIの特性や限界を理解した上で、創造的に活用していく能力を意味します。
このように、AI時代における人間の役割は、AIの単なる操作者や利用者ではなく、AIを創造的に活用し、より高度な価値を生み出すクリエイターやプロデューサーとしての役割へと変化していくと考えています。
7. 質疑応答
7.1. ゲーム開発への影響
橋本氏:ゲーム開発においては、AIの活用が大きな影響を与えると考えています。現在、ファイナルファンタジーやエルデンリング、龍が如くといった大作ゲームの開発には、1年以上の期間と軽く2桁億円を超える投資が必要とされていますが、この期間と投資額は生成AI等の合わせ技によって、今後3年以内に半減する可能性があります。
ただし、私が勤務する大学もクリエイターを育成する教育機関として、この変化を注視しています。AIによってコストが下がり、誰でも簡単にコンテンツを作れるようになると、クリエイティビティのインフレーションが起きる可能性があります。つまり、AIで簡単に作れるようなコンテンツには、誰もお金を払わなくなる可能性があるのです。
そのため、プロのクリエイターには、AIで作れるレベルを超えた、より高度なコンテンツを作ることが求められるようになるでしょう。ファイナルファンタジーのような大手タイトルの制作費はあまり変わらないかもしれません。なぜなら、彼らはAIを補助的に使用しながら、より高度な価値を持つコンテンツを作り続けていく必要があるからです。
一方で、AIの登場により、これまでにない巨大な新しいマーケットが生まれる可能性もあります。YouTubeのように、個人でも高品質なコンテンツを作り出せる環境が整備され、その中から新しいタイプのクリエイターが登場してくるかもしれません。このように、AIはゲーム開発の民主化を促進すると同時に、プロフェッショナルにはより高度な創造性を求めることになるでしょう。
7.2. ハルシネーション対策
橋本氏:私の経験から、ハルシネーションへの対策として最も重要なのは、自分で作ろうと思えば作れることをAIに任せるという原則です。面倒だから作ってもらうという範囲で活用するのが正しい使い方だと考えています。それ以上のことをAIに任せようとすると、重大な誤りを見過ごしてしまうリスクが高まります。
実際の例として、AIが生成した立派な内容を信じ込んで発表してしまい、著作権違反や重大な間違いが含まれていたというケースがあります。企業がチャットボットとしてAIを使用した際のトラブルも発生しています。例えば、エアカナダでは、存在しない料金規定についてAIが誤った回答をし、それが裁判沙汰になりました。また、GMのシボレーのチャットボットが、ライバル社のフォードの車を推奨してしまうという事態も起きています。
このような問題を防ぐためには、長時間AIを使用していると、ハルシネーションが出やすい質問のパターンが事前に把握できるようになってきます。そういった経験を積むことで、危険な質問を避けられるようになります。
また、最近のAIには独自の対策機能も備わってきています。例えば、Geminiは保守的な回答を心がけており、あまり危険な発言をしないよう設計されています。ただし、これは同時に面白い提案も期待できないというトレードオフがあります。エンターテインメント分野でも同様の課題があり、安全性と創造性のバランスをどう取るかが重要になってきます。
結論として、AIの出力は必ず人間が確認し、内容の妥当性を判断する必要があります。特にお客様向けの情報発信では、AIの回答を直接使用せず、必ずチェックを入れてから流すようにすべきです。AIはあくまでも補助ツールとして活用し、最終的な判断は人間が行うという原則を守ることが、ハルシネーション対策の基本だと考えています。
7.3. 日本の生成AI事業者の展望
橋本氏:日本の生成AI事業者の現状は厳しいものがありますが、私は将来に向けて希望を持っています。米国企業と比較すると、日本の生成AI事業者はまだオープンなサブスクリプション形式のサービスを提供できていません。現状では、個別に窓口に問い合わせをして、有料で一緒に開発するという形態が主流となっています。
ただし、注目すべき点として、日本はアニメやゲームといった強力なコンテンツを持っています。生成AIの学習データとして、これらの日本独自のコンテンツを活用できれば、その分野では世界に勝てるAIを開発できる可能性があります。
また、アメリカの企業ユーザーの中には、セキュリティや機密情報の管理の観点から、外部のAIサービスではなく、自社内で完結するプライベートなAIシステムを求めるケースが増えています。このような需要に対して、比較的小規模な日本企業の方が柔軟に対応できる可能性があります。
さらに、コンピューターの性能が日々進化していることで、大規模なモデルも各社で扱えるようになってきています。これにより、日本企業でも十分な性能のAIを開発・運用できる環境が整いつつあります。
日本企業には、頑張ってほしいという思いはありますが、現時点ではまだ道のりは長いと言わざるを得ません。ただし、日本固有のコンテンツを活かした独自の展開や、企業向けのカスタマイズされたソリューションの提供など、特定の分野での競争力を高めていく余地は十分にあると考えています。
7.4. 各種技術的質問への回答
橋本氏:参加者から寄せられた技術的な質問について、まず利用料金に関する質問がありました。私が現在使用している生成AIは全て有料版で、毎月の支払いは数十万円程度になります。これは私の場合、これらのツールが仕事の一部となっているため、経費として計上しています。
また、AIの出力の再現性についての質問もありました。同じプロンプトを入力しても、生成される結果は毎回異なります。そのため、重要な結果は必ず保存しておく必要があります。AIの履歴機能は残りますが、大量のデータが蓄積されていくため、重要な結果は別途保存しておくことをお勧めします。
さらに、無料版でどこまでできるかという質問については、最近は無料でも色々なことができるようになってきていると説明しました。ただし、多くのAIは一定回数使用すると有料版への移行を促されます。業務で使用する場合は、安定性と機能の充実度を考慮して有料版を選択することを推奨しています。
検索時代の初期には様々な検索エンジンがありましたが、最終的にはGoogleに集約されていったように、生成AIも将来的にはどこかのサービスに集約される可能性があります。ただし、現時点では2〜3つの主要な勢力による競争状態が続くと予測しています。特に、Microsoft-OpenAI連合、Claude、Google-Geminiといった大手企業による開発競争が続くと考えられます。