この記事は2025年4月9日に原宿 の Wework Iceburg にて開催されたManus 東京 イベントを記事化したものです。
はじめに
2023年末から2024年にかけて、AI業界は「エージェント」という新たなパラダイムへと急速に移行しつつある。これまでのチャットベースのAIが「質問に答える」という受動的な役割にとどまっていたのに対し、AIエージェントは「タスクを遂行する」という能力を持つ。このパラダイムシフトの波に乗って急速に注目を集めているのが「Manus AI」だ。
Manusは2024年3月のローンチ以来、わずか1ヶ月で300万人以上のウェイティングリストを形成し、AIエージェント市場の最前線に躍り出た。その特徴は、ブラウザ操作、ファイル処理、コード実行など、従来のAIではできなかった「行動」を取れることにある。ユーザーはタスクを指示するだけで、Manusがクラウド上のサンドボックス環境でそれを実行し、結果を提供してくれる。
そんなManusが2024年4月、日本で初のオフラインイベントを開催した。このイベントはManusのアジア市場展開における重要な一歩であり、特に日本市場に対する強い関心を示すものとなった。イベントには限られた70名ほどが招待されたにもかかわらず、事前に200件以上の申し込みがあったという。その熱量は、日本におけるAIエージェントへの期待の高さを物語っている。
本レポートでは、Manusの創業者であるタオ・チャン氏による基調講演と、日本のAI業界インフルエンサーである茶圓将裕氏との対談の内容を中心に、Manusの技術的特徴、開発の背景にある哲学、そして日本市場におけるビジネス戦略を紐解いていく。さらに、実際のユーザーによる活用事例も紹介し、AIエージェントが私たちの働き方や創造活動にもたらす可能性を探る。
ChatGPTの登場からわずか1年半。AIは「会話する」から「行動する」へと進化を遂げつつある。その最前線に立つManusの挑戦から、AIエージェント時代の実像と可能性を読み解いていきたい。
第1部:Manus創業者 タオ・チャン氏 基調講演 - AIエージェント開発の軌跡と設計思想
1. 「Manus」に込められた意味:なぜLLMには「手」が必要なのか
Manusの創業者であり、プロダクト責任者を務めるタオ・チャン氏は、自社のプロダクト名について興味深い説明から講演を始めた。「Manus」という名前は、実はMIT(マサチューセッツ工科大学)のモットーに由来する「Mens et Manus(精神と手)」から採られたラテン語だという。
「多くのアメリカのユーザーでさえ、この単語の意味を知りません。Manusは古いラテン語で『手』を意味します。私たちがこの名前を選んだのは、過去2年間のLLMは『脳』のようなものだったからです。考えることはできても、行動することができない。私たちはLLMに『手』を与えたいと考えたのです」とチャン氏は説明する。
この「手」の重要性は、チャン氏自身の幼少期の経験に根ざしている。彼は38歳という年齢を明かしながら(「見た目は若いですが、実は私は38歳で、会社では最年長です」と冗談交じりに語った)、1996年の中国で9歳か10歳からコーディングを始めた経験を振り返った。
「当時の中国では、各家庭にコンピュータがあるほど豊かではありませんでした。小学校のコンピュータ室に行けるのは週に2回だけでした。クラスでは一番できる生徒だったのに、コンピュータを使えるのは週に2日だけ。残りの日はペンと紙でコードを書く練習しかできなかったのです」
この経験がチャン氏に教えたことは、実際の問題解決には「試す」ことと「フィードバックを得る」ことが不可欠だということだった。ペンと紙だけでは、一度で正しいコードを書くことはできない。コンピュータ室に行き、コードをテストし、デバッグする必要がある。
「現実世界で複雑な問題を解決するには、試行錯誤し、実世界からフィードバックを得ることが必要です。だからこそ、私たちはLLMに『手』を与えたいと考えたのです」
この洞察は、現代のAIが直面している根本的な限界を指摘するものだ。ChatGPTやClaudeのような大規模言語モデル(LLM)は、驚異的な思考能力を示すようになったが、それらは基本的に「考える」ことしかできない。理論的に問題を分析することはできても、実際に何かを「行う」ことはできない。それは、紙とペンだけで完璧なコードを書こうとする子供のようなものだ。
チャン氏の講演は、AI技術の進化の本質を問う問いかけとなっている。「知能」とは単に「考える」ことなのか、それとも「考え」と「行動」の組み合わせなのか。Manusは後者の視点に立ち、LLMに「行動する能力」「実世界とインタラクションする能力」を与えることで、真に役立つAIを目指している。
これは単なる技術的な改良ではなく、AIの本質に対する哲学的なアプローチの変化を示唆している。「精神と手」という古代からの知恵が、最先端のAI開発の指針となっているのだ。
2. 客観的評価:性能ベンチマークとコスト効率
Manusは単なる概念実証ではなく、実際の性能でも優位性を示している。チャン氏は講演の中で、客観的な評価基準に基づいたManusの性能を示すデータを提示した。
Gaiaベンチマークにおける競合との比較
チャン氏が最初に示したのは、OpenAIのDeepLearn Researchを含む競合サービスとの比較だ。彼はGaiaベンチマークという評価基準を用いて、Manusの性能を示した。このベンチマークはOpenAIが公開している評価基準で、AIエージェントの能力を測定するための複雑なタスクセットが含まれている。
「特にレベル1とレベル3の困難なプログラムにおいて、Manusは従来のソリューションと比較して約10%のパフォーマンス向上を達成しています」とチャン氏は強調した。AI業界では1〜2%の性能向上でさえ大きな進歩とされる中、10%という数字は驚異的である。
具体的な例として、チャン氏はYouTube動画の分析タスクを挙げた。このタスクでは、3分間のナショナルジオグラフィックのビデオを視聴し、「単一フレームで最大何種類の生物が映っているか」を答える必要がある。
「当初、私たちのモデルはCloud Sonnet 3.5で、これは画像は処理できますが、ビデオは処理できません。このタスクは解けないだろうと思いました」と彼は回想する。しかし、驚くべきことに、Manusはこの問題を解決した。
Manusが取った行動は興味深い。まず、YouTube URLを訪問し、「K」キーを押して動画を一時停止。スクリーンショットを撮り、再び再生し、また一時停止してスクリーンショットを撮る——このプロセスを繰り返して様々なフレームを分析したのだ。さらに、Manusは結果をレビューするために「3」キーを押した(これは動画の進行バーを30%の位置に移動させるショートカット)。
「YouTubeを13年使っていますが、こんなショートカットがあるとは知りませんでした」とチャン氏は驚きを表明した。この例は、最先端のファウンデーションモデルがインターネットに関する幅広い知識を持っており、AIエージェントがブラウザを効果的に使用できることを示している。
タスク解決におけるコスト優位性
性能だけでなく、コスト効率においてもManusは優位性を持つという。チャン氏は、同様のプログラム解決タスクにおいて、Manusは「OpenAIのDeep Researchと比較して約10倍のコスト効率、以前のSOTAモデルと比較して約5倍のコスト効率」を実現していると説明した。
これは単に技術的な優位性を示すだけでなく、ビジネスモデルとしての持続可能性も示唆している。AI産業では計算コストが大きな課題となっており、そのコストを下げることができれば、より多くのユーザーにサービスを提供することが可能になる。
Manusがこのようなコスト効率を実現できている理由について、チャン氏は詳細を明かさなかったが、後の講演で説明された「効率的なエージェント設計」と「予め定義されたワークフローに依存しない柔軟なアーキテクチャ」が関連していると考えられる。
この高い性能とコスト効率は、Manusが単なる技術デモンストレーションではなく、実用的なツールとして機能することの証左である。競合他社と比較したこれらのベンチマーク結果は、Manusが「汎用エージェント」としての地位を確立するための重要な根拠となっている。
3. 「汎用エージェント」というコンセプト
AIエージェント市場が急速に拡大する中、Manusが自らを「世界初の汎用エージェント(general agent)」と位置づけていることは注目に値する。チャン氏はこの「汎用性」について、単なるマーケティング用語ではなく、具体的なデータと比較に基づいた特徴であると説明した。
特定用途(Vertical)エージェントとの違い
現在のAIエージェント市場は、主に「垂直型(vertical)」と呼ばれる特定領域に特化したエージェントが主流だ。マーケティング専用エージェント、営業支援エージェント、コードレビューエージェントなど、それぞれが特定の業務に特化している。
チャン氏はこうした「垂直型」アプローチの限界を指摘する。「垂直型エージェントは特定の領域では優れた性能を発揮しますが、その専門外のことになると対応できません。現実の仕事は単一の領域に留まらないことが多く、ユーザーは複数のエージェントを使い分ける必要が生じます」
対照的に、Manusは単一のエージェントで多様な業務に対応することを目指している。ウェブリサーチ、データ分析、コーディング、ファイル処理、文書作成など、業種や業務の壁を越えた「汎用性」を追求しているのだ。
「従来のアプローチでは、エージェントごとに異なるUIを学び、異なるプロンプトを書き、異なる制約と向き合う必要があります。Manusは『一つのエージェントで多様なタスクを処理する』というシンプルなコンセプトを実現しています」
Y Combinator採択企業との比較:76%のユースケースをカバー
この「汎用性」を客観的に示すため、チャン氏はY Combinator(有名スタートアップアクセラレーター)が採択した垂直型AIエージェント企業との比較データを示した。Y Combinatorの「W25」バッチに含まれる21のエージェント系スタートアップが掲げるユースケースを分析した結果、Manusは全体の約76%のユースケースをカバーできることが判明したという。
「我々は、これらの垂直型エージェントが提示するユースケースを調査しました。デモが公開されている企業については実際に試し、デモがない場合はウェブサイトやアーカイバルに記載されたユースケースを分析しました」とチャン氏は説明する。
特に興味深いのは、その76%のケースのほとんどにおいて、Manusが垂直型エージェントよりも優れたパフォーマンスを示したという点だ。「これは個人的な評価ですが、多くの場合、Manusは垂直型エージェントよりも優れた結果を出すことができました」
この高いカバレッジが、Manusを「汎用エージェント」と呼ぶ根拠になっている。単一のインターフェースとシンプルな指示で、多様なタスクに対応できる能力は、AIエージェントの新たな可能性を示唆している。
ただし、チャン氏はすべてのユースケースをカバーしているわけではないことも認めている。特に、高度に専門化された領域では、専用に設計された垂直型エージェントに優位性がある場合もある。しかし、一般的なビジネスユースや個人的なタスクの大半をカバーできるという点が、Manusの最大の強みだと強調した。
「我々が目指しているのは、ユーザーが『これはAIにやらせよう』と思ったときに、タスクの種類を問わず、すぐにManusに頼れるような存在になることです。特定のタスクごとに異なるツールを使い分ける必要がない世界を作りたいのです」
この「汎用性」というコンセプトは、Manusの技術的アプローチだけでなく、ビジョンやビジネスモデルにも大きな影響を与えている。特定の業界や用途に限定せず、幅広いユーザーに価値を提供できるプラットフォームを目指す姿勢が、Manusの急速な成長を支える要因となっているのだ。
4. 回り道と学び:Manus以前のプロダクト開発
イノベーションの道のりは決して直線的ではない。Manusが世に出るまでに、チャン氏率いるチームは複数の製品開発を経験し、その過程で得た洞察がManusの誕生につながった。講演の中でチャン氏は、Manusが「偶然に生まれたものではなく、一連の製品開発と失敗から得た学びの集大成である」と強調した。
4.1. Monica.im:成功と限界
Manusを手がける「Butterfly Effect」社の最初の製品は、「Monica.im」というChrome拡張機能だった。チャン氏によれば、この製品はChatGPTが登場するほんの1週間前に開発がスタートしたという絶妙のタイミングだった。
「ChatGPTがリリースされる1週間前、私たちのCEOであるRed(講演中に紹介された共同創業者)がOpenAIのGPT-3のホワイトペーパーを読んでいました。GPT-3は素晴らしいと感じ、何か製品を作ろうとしていたその矢先にChatGPTが登場したのです」とチャン氏は振り返る。
ChatGPTの登場により、彼らのプロダクト戦略は大きく変更を余儀なくされた。しかし、ChatGPTを実際に使ってみると、一つの大きな問題点が見えてきた。それは「コンテキストスイッチ」の煩わしさだ。
「ChatGPTを使う際、ブラウザと会話ウィンドウを行ったり来たりする必要があります。ブラウザから情報をコピーしてChatGPTに貼り付け、回答を得たらまたブラウザに戻る…この切り替えは本当に面倒でした」
この課題を解決するため、彼らはブラウザの中でAIを活用できるChrome拡張機能「Monica.im」を開発した。これにより、ユーザーはコンテキストの中でAIの力を活用できるようになった。
Monica.imの機能は多岐にわたった。チャン氏が挙げた例には以下のようなものがある:
- 長い記事を要約する「Simplify Article」機能
- Gmailでメールを下書きする機能(Googleが同様の機能を組み込む1年前に実装)
- YouTubeの動画を時間付きで要約する機能
- 動画からポッドキャストを生成し、モバイルで聴ける機能
「私たちはブラウザ内で何百もの機能を提供しました。今でもこのカテゴリでは最高の製品だと自負しています」とチャン氏は述べる。
実際、Monica.imは大きな成功を収めた。現在のアクティブユーザーは2000万人に達し、月間で1800万ドルの収益を生み出しているという。2024年末には3000万ドルの収益を見込んでいるとのことだ。
しかし、このような成功にも関わらず、チームはより大きな可能性を追求したいと考えていた。彼らはMonica.imの限界も認識していた。
「『Chrome』『ブラウザ』『拡張機能』という3つの言葉は、それぞれが私たちの製品の可能性を制限していました。すべての人がChromeを使っているわけではなく、すべての作業がブラウザで行われるわけでもなく、『拡張機能』という言葉自体が技術的で一般ユーザーには分かりにくいものです」
そこで彼らは「次の大きなブレークスルー」を求めて模索を始めた。ChatGPTがLLMとの対話の新しいパラダイムを定義したように、彼らもAIとの新しい関わり方を模索したのだ。
「ChatGPTは会話を通じてLLMと対話するパラダイムを定義しました。しかし、私たちはこの会話形式が最終的なものではないと考えていました。なぜなら、良い質問をする能力や動機自体が多くのユーザーにとって難しいからです」
この洞察は重要だ。ChatGPTのような会話型AIは、質問できる人、適切に質問できる人にしか価値を提供できない。これはユーザーの能力に依存する根本的な制約だとチャン氏は指摘する。
「AIプロダクトの価値がユーザーの質問能力に依存しているなら、スケールすることはできません。製品の価値はユーザーの能力ではなく、製品自体の能力によって決まるべきです」
この認識が、「次の波」を探求する動機となり、彼らをAIブラウザプロジェクトへと導いた。そしてその後にManusが誕生することになる。
Monica.imは今でも成功を続けている製品だが、この経験から彼らは「ユーザーの能力に依存しない」AIプロダクトの重要性を学んだ。この学びは、Manusの設計思想に大きな影響を与えることになる。
4.2. AIブラウザプロジェクト:野心的な挑戦と挫折
Monica.doの成功を背景に、チャン氏のチームは2023年3月、より野心的なプロジェクトへと踏み出した。拡張機能の枠を超えて、完全なAIブラウザを構築するという挑戦だ。
「Chrome拡張機能で成功していたので、『拡張機能をインストールする必要がない、AI機能を最初から組み込んだブラウザを作ればいいのでは?』という発想は自然でした」とチャン氏は当時の思考を説明する。
プロジェクトのビジョンと主な機能(ローカルLLM、アプリ連携)
この新しいAIブラウザプロジェクトには、当時40名程度だった会社の限られたリソースの多くが投入された。特に20名いたエンジニアのうち12名がこのプロジェクトに配属されたという。「スタートアップとしては大きな賭けでした」とチャン氏は振り返る。
2023年3月から9月までの6ヶ月間、彼らはAIブラウザの開発に没頭した。その結果、いくつかの先進的な機能が実装された:
- 「AI Everywhere」機能 - ブラウザ内のあらゆる場所でAIを利用できる
- ローカルLLMの統合 - プライバシーを確保するため、小規模なモデルをブラウザ内で直接実行(「LLama CPPをWebAssemblyにコンパイルするという、技術的に非常に困難な作業でした」とチャン氏は説明)
- 他アプリとの連携 - ウェブページから非構造化データを抽出し、Excelなどのアプリに構造化データとしてエクスポート
- タブの自動整理 - 開いているタブを内容に基づいて自動的に整理し、カード形式で表示
- メディア拡張 - 画像やビデオの自動アップスケール、プレビュー機能
- 自然言語検索 - 自然言語でページ内検索が可能
「私たちはブラウザ内にAIの多くの素晴らしい機能を実装しました」とチャン氏は誇らしげに語る。しかし、その一方で、彼は続けてこのプロジェクトが最終的に陽の目を見なかったことを明かした。
開発中止の決断:ユーザー体験上の根本的な問題
驚くべきことに、このAIブラウザプロジェクトは完成間近の段階で中止された。チャン氏は「リリースのわずか1週間前にこのプロジェクトを終了させました」と語る。これほどのリソースを投入したプロジェクトを、なぜ最後の段階で止めたのか?
彼らが特定した根本的な問題は、ユーザー体験に関するものだった。
「AIがブラウザを操作する動画を見ている分には素晴らしく見えます。『すごい、AIが私のコンピュータを操作している!』と思うでしょう。しかし、実際に自分がコンピュータの前に座って、AIにブラウザを操作させる立場になると、非常にフラストレーションが溜まるのです」
なぜフラストレーションが生じるのか?チャン氏は2つの理由を挙げた:
- ハンズオフの強制 - AIがブラウザを操作している間、ユーザーはキーボードとマウスから手を離さなければならない。少しでも動かすとAIのプロセスが中断されてしまう。
- 注視の必要性 - AIがいつ作業を完了するか分からないため、ユーザーは画面から目を離すことができない。
「結局のところ、私たちがやっていたことは、手を使わずに画面を見つめるという、非常に奇妙な体験だったのです」とチャン氏は笑いを誘いながら説明した。
重要な学び(1):AIはブラウザ操作が得意だが、ユーザーのブラウザを使うべきではない
このプロジェクトからの最初の重要な学びは、AIはブラウザ操作が非常に得意だが、それはユーザーが使っているブラウザを操作すべきではないという点だった。
先に説明したGaiaベンチマークでのYouTube動画分析タスクの例は、この洞察の良い例証となっている。AIはYouTubeのショートカットキーを使いこなすなど、ブラウザでの操作に長けている。しかし、それはユーザーの作業を妨げない形で行われるべきなのだ。
「従来の発想では、AIがユーザーのブラウザを操作することを考えていましたが、それは実用的ではありません。AIはブラウザを使うべきですが、それはユーザーのブラウザではなく、AIの専用ブラウザであるべきなのです」
重要な学び(2):AIには独立したクラウド上の実行環境が必要
二つ目の重要な学びは、AIのタスク実行はクラウド上で非同期的に行われるべきだという点だった。
「タスクはクラウドで実行され、ユーザーはラップトップを閉じたり、スマートフォンをポケットに入れたりして、自分の活動を続けられるべきです。会議に参加したり、子供と遊んだり、ランニングしたりしながら、タスクはバックグラウンドで実行され、完了したら結果だけを通知で受け取る——これが理想的な体験なのです」
この洞察が、後のManusの重要な設計原則になる。ユーザーのデバイス上ではなく、クラウド上に独立した実行環境を用意し、そこでAIが作業を完了する。ユーザーが結果だけを受け取れるような非同期モデルを実現するのだ。
チャン氏はこの決断について、「これはスタートアップにとって非常に難しい決断でした。6ヶ月の労力と限られたリソースの大部分を投入したものを諦めるのは辛いことです」と述べる。しかし同時に、「このプロジェクトから得た学びは無駄ではなく、後のManusの設計に不可欠だった」とも語った。
実際、AIブラウザプロジェクトの中止決定の日、チャン氏が北京に飛行機で戻り、着陸後にX(旧Twitter)を開いたところ、最初に目にしたのはBrowser Companyの創業者Josh MillerによるArch Browserプロジェクト中止の発表だったという偶然のエピソードも紹介された。
「彼も同じような結論に達していました。数年間のブラウザ開発の後、家族や親しい友人でさえ、ChromeからArchに切り替えることを説得できなかったのです。ブラウザを乗り換えるよう人々を説得するのは、想像以上に困難なことなのです」
この同時期に起きた偶然の出来事は、チャン氏のチームの決断が正しかったことを確信させた。そして、彼らはこの経験から得た洞察をManusの開発に活かしていくことになる。
4.3. Cursorからの示唆:非技術者の利用から見えた本質
AIブラウザプロジェクトを中止した後、チャン氏のチームは次のステップを模索していた。そんな中、2023年7月にリリースされたCursorというAIコーディングエディタが、彼らに大きなインスピレーションを与えることになる。
Cursorは、AIを活用してコードを生成・編集・デバッグできるコーディングエディタだ。ユーザーはプログラミング言語で指示を出さなくても、自然言語で機能を説明するだけでコードを生成できる。
「Cursorが登場したとき、私たちの3人の共同創業者は全員コードを書ける人間でした。Cursorを試して、これは素晴らしいと感じました」とチャン氏は振り返る。「私自身、Cursor以前にはGoプログラミング言語を書いたことがなかったのですが、Cursorのおかげで当社のバックエンドサービスにGoを使えるようになりました」
非コーダーによるCursor活用事例の観察
しかし、より衝撃的だったのは、同社の非技術系社員たちがCursorを積極的に使い始めたことだった。マーケティング部門や人事部門の社員など、プログラミングの経験がなかった人々が、日常業務にCursorを活用し始めたのだ。
「最も興味深かったのは、彼らがCursorを日常業務に使っている様子を観察することでした。データの可視化、動画ファイルを音声ファイルに変換する方法、ファイル処理など、様々なタスクにCursorを活用していました」
チャン氏のチームは、これらの非技術者がCursorをどのように使っているのかを詳しく観察した。そして、ある重要な発見をした。
「彼らがCursorを使っているとき、左側のコードエディタ部分にはほとんど注目していないことに気づいたのです」とチャン氏は説明する。「彼らはコードを理解できないので、Cursorが生成したコードの品質を評価できません。彼らがやっていたのは、『承認、承認、承認...』とボタンを押して、最終的な結果を取得することだけでした」
気づき:「コーディングは中間言語」「UIとしてのチャットパネルの可能性」
この観察から、チャン氏のチームは重要な洞察を得た。非プログラマーにとって、コードそのものは重要ではなく、タスクを解決するための「中間言語」に過ぎないということだ。
「実際には、多くの一般ユーザーにとって『コーディング』は最終目標ではなく、問題解決のための中間ステップに過ぎません。彼らが本当に求めているのは結果なのです」
この洞察は、AIとのインターフェースについての考え方を変えるものだった。従来のChatGPT的な会話モデルでは、ユーザーが質問し、AIが答えるという形式だった。Cursorはそれを一歩進め、ユーザーの指示をコードに変換し、そのコードを実行して結果を提供する。しかし、非技術者にとっては、中間段階のコードは不要な情報だった。
チャン氏はここで、Cursorのインターフェースに着目した。Cursorは左側にコードエディタ、右側にチャットパネルという構成になっている。非プログラマーは主に右側のチャットパネルだけを使っていた。
「彼らは右パネルだけを見ています。左側のコードがどうなっているかは気にしていないのです。これを見て、『もしかしたら、多くのユーザーにとって必要なのは右パネルだけなのではないか』と考えました」
Manusの着想:クラウド上で動作する「Cursorの右パネル」
この観察と、AIブラウザプロジェクトから得た学びを組み合わせたとき、Manusの基本的なコンセプトが形作られた。
「私たちは『Cursorの右パネルのようなもの、ただしクラウド上で動作するもの』を作ることにしました。これが、昨年10月にManusのプロジェクトを始めた最初の瞬間です」とチャン氏は語る。
この概念は、以前のプロジェクトから得た二つの重要な洞察と完全に整合していた:
- AIには独自の実行環境(コンピュータ)が必要である
- その実行環境はクラウド上に置き、非同期でタスクを処理すべきである
そして、Cursorからの洞察を加えることで、ユーザーインターフェース面でも明確な方向性が定まった:
- ユーザーは実装の詳細(コード)よりも、指示と結果に集中すべきである
こうして、Manusの基本コンセプトが確立された。ユーザーがタスクを指示し、AIがクラウド上の独自環境でそれを実行し、結果を返すというシンプルなモデルだ。ユーザーは「どのように」ではなく「何を」に集中できるようになる。
「私たちは5ヶ月間でManusを開発し、今年3月5日にリリースしました」とチャン氏は語る。「このように、Manusは偶然ではなく、私たちが過去に経験した複数のプロジェクトからの学びと洞察の集大成なのです」
この発展の過程は、テクノロジー開発において「失敗」が必ずしも無駄ではなく、むしろ次の革新のための重要な学びとなり得ることを示している。Monica.doというヒット製品から、中止されたAIブラウザプロジェクト、そして競合製品の観察まで、すべての経験がManusというユニークな製品の誕生につながったのだ。
5. Manusの構築要素:「知能」を最大限に引き出すために
これまでの経験から得た教訓と洞察を基に、チャン氏のチームはManusの開発に取り組んだ。彼らのアプローチは、「人間が新入社員を迎え入れるときの考え方」に喩えられる。優秀な人材を雇ったとしても、適切な環境、ツール、情報へのアクセスがなければ、その能力を十分に発揮することはできない。LLMも同様だとチャン氏は考えた。
「現在、私たちはすでにPhDレベルの知能を持つLLMを手にしています。それは、博士号を持つインターンを雇うようなものです。しかし、そのインターンにコンピュータも与えず、ペンと紙だけで問題を解決するよう求めるとしたら?それは現代の仕事環境では不可能です」とチャン氏は説明する。
Manusの設計哲学は、LLMの潜在能力を最大限に引き出すために必要な環境とツールを提供することだ。それは主に以下の要素から構成されている。
5.1. 実行環境:AIに「コンピュータ」を与える
Manusの最も基本的な構成要素は、AIに「実際のコンピュータ」を提供することだ。チャン氏によれば、これはAIエージェントを構築する上で根本的に重要な要素だという。
「各タスクに対して、サンドボックス環境を割り当てています。これは単なる仮想環境ではなく、完全な仮想マシンです」とチャン氏は強調する。「AIはファイルシステム、ターミナル、VSCode、そして本物のChromiumブラウザを使うことができます。単なるヘッドレスブラウザではなく、完全な機能を持つブラウザです」
このサンドボックス環境は、仮想化技術を活用して作られている。チャン氏は、オープンソースプロジェクト「g2p」を活用して仮想化を実現していると説明した。各タスクが独立した環境で実行されることで、セキュリティとプライバシーも確保される。
この「コンピュータを与える」というアプローチは、チャン氏の幼少期の経験からも理解できる。彼がペンと紙だけではコードを正しく書けなかったように、AIも実行環境がなければその能力を十分に発揮できない。実行とフィードバックのループが、より高度な問題解決を可能にするのだ。
実際、Manusが提供するサンドボックス環境には以下のようなコンポーネントが含まれている:
- ファイルシステム:データを保存し、操作するための仮想ストレージ
- ターミナル:コマンドラインインターフェースを通じてシステムとやり取り
- VSCode:コード編集、フォーマット、構文ハイライトなどの機能を持つエディタ
- Chromiumブラウザ:ウェブサイトの閲覧や操作が可能な完全なブラウザ
このサンドボックス環境は「タスクごと」に割り当てられる点も重要だ。ユーザーが新しいタスクを依頼するたびに、新しいサンドボックスが作成される。これにより、タスク間の干渉を防ぎ、一貫性のある実行環境を保証している。
同時に、このサンドボックスはクラウド上に存在するため、ユーザーのローカルマシンのリソースを消費せず、またユーザーの作業を妨げない。AIブラウザプロジェクトから得た教訓を活かし、AIの作業とユーザーの作業を完全に分離することで、ストレスのないユーザー体験を実現している。
5.2. 情報アクセス:AIに「知識」を与える
コンピュータを持っていても、必要な情報にアクセスできなければ、問題を解決することはできない。企業の新入社員も、内部システムへのアクセス権がなければ仕事を進められないのと同様だ。
「現代では、すべての情報がパブリックなインターネット上にあるわけではありません。多くの情報はファイアウォールの向こう側、プライベートなデータベースの中にあります」とチャン氏は説明する。「特定の業界、例えば金融や法律などの分野では、専門的なデータへのアクセスが必要です」
この課題に対処するため、Manusは多様なデータソースへのアクセスを提供している:
- パブリックなウェブへのアクセス:Chromiumブラウザを通じて、インターネット上の公開情報にアクセスできる
- プライベートデータベースへのAPI接続:専門的なデータベースへのアクセスを事前に設定
特に興味深いのは、Manusがすでに多くのプライベートデータベースのAPIへの支払いを済ませており、ユーザーが「二重に支払う」必要がないようにしている点だ。これにより、ユーザーは追加コストなしで専門的な情報にアクセスできる。
チャン氏は具体的なデータソースの名前を挙げなかったが、「Yahoo Finance、Bloomberg、Peter Search、Indian Search」などのデータソースへの読み取り専用APIを統合していると述べた。これらは現在「読み取り専用」だが、将来的には「書き込み」機能も追加する計画があるという(後の質疑応答セクションで触れられた)。
この情報アクセスの層は、Manusが単純なウェブスクレイピングを超えて、より深い専門知識を活用できることを意味している。一般的なLLMの知識カットオフ日の制限を超えて、最新かつ専門的な情報にアクセスできることが、特に専門分野での問題解決においてManusの強みとなっている。
さらに、サンドボックス環境の存在により、Manusはこれらの情報を保存、処理、変換することができる。例えば、ウェブから収集したデータをCSVに変換したり、複数のソースから情報を統合して分析したりといった複雑な作業も可能だ。こうした「情報の収集と処理」の能力は、単なるチャットボットとManusのような本格的なエージェントを区別する重要な特徴となっている。
5.3. 学習能力:AIに「個性」を与える
コンピュータと情報へのアクセスを提供する以外に、Manusの第三の重要な構成要素は「学習能力」だ。チャン氏は、実際の職場における新入社員の比喩を続けて説明する。
「新しいインターンが会社に入ったとき、最初の週は彼の仕事に完全に満足することはないでしょう。なぜなら、彼はまだあなたの好みを知らないからです。タスクを割り当てて、彼が返してきた結果を見ると、問題点が見つかるかもしれません。そこで『次回このような文書を作るときは、このフォーマットで作ってください』というように教えますよね」
Manusも同様に「教えられる」ように設計されている。ユーザーは単に指示を出すだけでなく、Manusに自分の好みや期待を教え込むことができる。これは一般的なチャットボットとは根本的に異なるアプローチだ。
「Manusを使っていると、本当に人間と働いているような感覚になります。実際のインターンと仕事をするように、あなたの好みを教えることができるのです」とチャン氏は説明する。
具体例として、チャン氏はOpenAIのDeep Researchに関するユーザーフィードバックを挙げた。一部のベータテスターは、Deep Researchがタスクの詳細を確認するために5〜6個の質問を返してくる機能を気に入っていた。しかしチャン氏自身は「私は質問に対して答えが欲しいのであって、さらに6つの質問をされたいわけではない」と感じていた。
重要なのは、このような機能をプロダクトレベルで実装するのではなく、ユーザーがManusに直接「次回リサーチをする前に、詳細を確認してから行動してください」と指示できることだ。Manusはこの指示を「知識」として保存し、次回から同様のタスクを実行する際に適用する。
この学習メカニズムは「Suggested Knowledge」と呼ばれるポップアップを通じて実装されている。ユーザーはこれを承認することで、個人的な知識データベースに追加できる。これにより、Manusは時間とともにユーザーの好みや期待に適応していく。
これはAIとの付き合い方に新しいパラダイムをもたらす。従来のモデルでは、AIは汎用的な応答を提供し、ユーザーが個々の応答を調整する必要があった。Manusのモデルでは、AIがユーザーの好みを学習し、将来の応答を自動的に調整する。
「これはチャットボットとの体験とは根本的に異なります。実際の人間と仕事をしているかのようです。彼らに好みを教え、彼らはそれを学習します」とチャン氏は強調する。
5.4. 設計哲学:「Less structure, more intelligence」
上記の3つの要素(実行環境、情報アクセス、学習能力)に加えて、チャン氏はManusの根底にある設計哲学について説明した。それは「Less structure, more intelligence(構造を減らし、知能を増やす)」というシンプルだが強力な原則だ。
「これは私たちが発明した言葉ではなく、AI業界では有名な言葉です」とチャン氏は謙虚に述べる。しかし、この原則をどのようにManusのアーキテクチャに適用したかは、同社の独自のアプローチを示している。
「私たちのアーキテクチャはとてもシンプルですが、非常に堅牢です。シンプルということは簡単だということではありません。時にシンプルなものを作ることが最も難しいことかもしれません」
なぜワークフローや役割分担(Multi-role)を避けるのか?
従来のAIエージェントフレームワークの多くは、事前定義されたワークフローに基づいている。「最初に何をし、次に何をし、最後に何をして、このフォーマットで結果を返す」というように、エージェントの行動パターンが設計者によって厳密に定義されている。
しかしManusにはそのような事前定義されたワークフローが一切存在しない。チャン氏は「ワークフローは一種の構造であり、一種のコントロールです。ワークフローを定義することで、問題の解決方法を指定することになります」と説明する。
「しかし多くの場合、LLMはあなたよりも問題の解き方をよく知っています。問題解決のプロセスを定義する必要はありません。ワークフローを定義すると、LLMの可能性を制限することになるのです」
同様に、多くのエージェントフレームワークで採用されている「マルチロールエージェント」(コーディングエージェント、検索エージェント、ブラウザエージェントなど、役割ごとに異なるエージェントを用意するアプローチ)についても、チャン氏は批判的な見解を示した。
「それも一種の構造、一種のコントロールです。この概念は『LLMは人間のように行動すべきだ』という前提に基づいています。人間の働き方に基づいて役割を分けているのです。彼はデザイナー、彼はPM、彼はエンジニア、というように」
「しかし、LLMが優れている理由の一つは、人間よりも多くの知識を持ち、コンテキストウィンドウが人間よりも大きいことです。LLMを異なる役割に限定し、異なるシステムプロンプトで制約し、各エージェントが実行できるタスクを制限すると、LLMの真の可能性を制限してしまうのです」
LLMの能力を制限しない、創発的なアーキテクチャ
チャン氏が提唱する代替アプローチは、LLMにより多くのコンテキストを提供し、行動を制限しないことだ。
「私たちが焦点を当てているのは、より多くのコンテキストを提供することです。エージェントフレームワークは次のアクションを予測し、そのアクションが実際の世界(サンドボックス)で実行されます。アクションが実行された後、観測結果が返され、その観測結果に基づいて次のアクションが予測されます」
このシンプルなループが、Manusの核心だ。事前定義されたワークフローはなく、シンプルな「行動→観察→行動」のサイクルを通じて、複雑な問題解決能力が創発的に生まれる。
そしてこの設計哲学が、Manusの幅広い能力を可能にしている。ディープリサーチ機能、ウェブサイト構築能力、Excel・Word処理機能、ビデオ・オーディオ生成能力などは、すべて事前に定義されたものではなく、このシンプルなアーキテクチャから「創発」しているのだ。
「これらの機能は私たちが事前に定義したものではありません。エージェントフレームワークから自然に生まれてきたものなのです」とチャン氏は誇らしげに語る。
このアプローチは、AIの研究で長年議論されてきた「知能は構造から生まれるのか、それとも構造を減らすことで知能が現れるのか」という問いに一つの答えを示している。Manusの成功は、シンプルな基盤の上に、より複雑な行動パターンが創発する可能性を示唆している。
チャン氏は「これが、多くのエージェントフレームワークやエージェント製品よりも、シンプルでありながらより優れた働きをする理由です」と結論づけた。
6. ローンチ後の現実と未来へのビジョン
Manusは2024年3月5日に一般公開された。技術的特徴や設計思想の説明を終えた後、チャン氏は講演の最後のセクションで、ローンチ後の1ヶ月間で得られた知見と、将来に向けたビジョンを共有した。
ユーザーコミュニティの熱量、特に日本市場の反応
「ユーザーからの愛を感じています。特に日本のユーザーからは」とチャン氏は笑顔で語った。
ローンチ直後、Manusは処理能力の制約から限られたユーザーしか受け入れられず、300万人以上がウェイティングリストに登録することになった。この状況が一部のユーザーから「本当に実在するのか?詐欺ではないのか?」という疑いを生んだという。
「しかし、一度実際に使ってみると、ユーザーの態度は一変します。すべての懐疑的な声は、熱烈な支持に変わるのです」
特に熱心なのが日本のユーザーコミュニティだという。チャン氏によれば、Manusの公式Discordサーバーで最もアクティブなチャンネルは英語チャンネルではなく、日本語チャンネルだ。これがManusのアジア市場、特に日本市場への強い関心につながり、今回の東京イベント開催を決定づけた要因でもある。
「アメリカでの過去20日間で、私自身が支払った食事はたった2回だけです」とチャン氏は冗談めかして語った。「他のすべての食事は、熱心なユーザーが『ランチの時間ありますか?ディナーはどうですか?コーヒーを一緒にどうですか?』と言って支払ってくれたのです」
このようなユーザーの熱量は、チームにとって大きな励みとなっている。「ローンチ後の最初の3週間、チーム全体が1日2〜3時間しか寝ていませんでした。本当に疲れていましたが、Discordサーバーでユーザーからの感動的なストーリーを見るたびに、新たなエネルギーをもらえたのです」
驚異的なリテンション率とその背景
成功したプロダクトでも、一般的にはユーザーの継続率(リテンション率)は時間とともに低下していく。「よくあるリテンション率カーブは、初日が100%、2日目が50%、そして30日後には10%程度になります」とチャン氏は説明する。
しかしManusのリテンション率は異常なほど高いという。
「Manusのリテンション率カーブは驚異的です。初日が100%、2日目が60%、3日目も60%、4日目も60%...ほぼフラットな状態を維持しています。15年のキャリアの中で、こんな光景を見たことがありません」
特筆すべきは、この高いリテンション率が、ユーザーが1日1タスクしか実行できないという初期の制限下でも達成されたことだ。これは、Manusがユーザーの日常生活や仕事に本当に価値を提供していることを示している。
チャン氏は、当初ウェブサイトで提示していた42のユースケースが、実際のユーザーの創造性によってはるかに拡張されたことを嬉しそうに語った。
「私たちが想定していなかった方法でManusを活用するユーザーからのフィードバックを毎日受け取っています。例えば、アメリカ東海岸のがんと老化の研究者は、Manusを研究に活用し、その結果はOpenAIのDeep Researchよりも優れていると言ってくれました。私はその分野について何も知りませんので、専門家の評価を信じるしかありませんが、私たちはそのような専門的な用途でManusが役立つとは予想していませんでした」
また、別の例として、サンフランシスコで働く3人の子供を持つ母親のストーリーも紹介した。彼女は月曜日に上司に提出するプレゼンのために週末に7〜8時間かかる作業を抱えていたが、Manusを使うことでわずか30分で済み、子供たちともっと時間を過ごせるようになったという。
「このような感動的なストーリーが、私たちを前進させ続けています」
エージェント特有の課題:トークン消費とインフラのボトルネック
Manusのような「エージェント」型AIサービスは、従来のチャットボット型サービスとは根本的に異なる課題に直面している。最も顕著なのはトークン消費量の違いだ。
「チャットボット製品とエージェント製品を比較すると、エージェント製品のトークン消費量はチャットボットの約1000倍です」とチャン氏は説明する。
これは単なる比喩ではなく、実際のデータに基づいた数字だという。この膨大なトークン消費が、サービス提供能力の制約となっている。
「これは、エージェント製品で10,000人のユーザーを持つことは、チャットボット製品で1000万人のユーザーを持つことと同等だということです。世界中に1000万ユーザーを抱えるチャットボット製品はそれほど多くなく、そのレベルの需要に対応できるインフラは業界全体でまだ準備ができていないのです」
チャン氏はこの問題が解決するまでに「半年から1年」かかるかもしれないと述べ、業界全体のインフラがエージェント型AIの需要に追いつくまで時間が必要だと指摘した。
新たな指標「AHPU(Agentic Hours Per User)」の提唱
チャン氏は講演の中で、AIエージェント時代の新たな評価指標としてAHPU(Agentic Hours Per User、ユーザーあたりのエージェント稼働時間)を提案した。
「これは私からではなく、初期の投資家であるZen Fundのマネージングパートナーから来たアイデアです」と前置きしつつ、チャン氏はこう説明する:
「エージェント時代においては、注目すべきはユーザーの利用時間ではありません。これは過去10年間のモバイルインターネット時代やウェブ2.0時代とは大きく異なります。例えばTikTokのようなアプリでは、ユーザーが1日に2時間消費するかどうかが重要でした。TikTokと競合したいなら、投資家はあなたのアプリでのユーザーの消費時間を気にするでしょう」
しかし、AIエージェントのパラダイムでは、ユーザーが製品と直接対話する時間は最小限であるべきだという。
「エージェントが本当に役立つなら、人々は様々なタスクを解決するためにそれを使うでしょう。しかし、ユーザーはアプリとは1日5分程度しか対話せず、エージェントはバックグラウンドで2〜3時間動作することになります」
このため、従来のエンゲージメント指標ではなく、「エージェントがユーザーのために働いた時間」を測定する新しい指標が必要だとチャン氏は主張する。これが「AHPU」だ。
「これが私たちが実際に行っていることです。労働力のスケーリングです」
ミッション:「労働力のスケーリング」と「人類の生産性拡大」
講演の終盤、チャン氏はManusの究極的な使命について語った。それは単に便利なツールを作ることではなく、「人類全体の生産性を拡大すること」だという。
「これは車を発明して以来、初めて人類の生産性を本当に拡大できる可能性があると思います。車によって人はより遠くまで行けるようになり、新しい領域を発見できるようになりました。同様に、AIエージェントによって、人類全体の生産性が拡大する可能性があるのです」
ここでのキーワードは「スケーリング」だ。人間のインターンや従業員は、いかに優秀でも一度に一つのタスクしか実行できない。しかしAIエージェントは、計算能力さえあれば、同時に複数のタスクを処理できる。
さらに、タスク完了にかかる時間も短縮できる。チャン氏によれば、現在Manusのタスク平均処理時間は10〜15分だが、今後6ヶ月で5〜10倍高速化できる見込みだという。
「分子(同時処理できるタスク数)が大きくなり、分母(タスク処理時間)が小さくなると、労働力のスケーリングが実現します」
ユーザーへの問いかけ:「ボス」になるための学び
講演の最後に、チャン氏はユーザーに対して興味深い問いかけを行った。
「ほとんどのユーザーにとって、これは『ボス』になるための最良の時代です。過去には、世界の構造上、ごく一部の人々だけがボスになる機会を持っていました。しかし今や、誰もがデジタルの従業員を持つことができます」
しかし、ボスであることは簡単なことではないと彼は指摘する。
「私たちの多くは良い従業員になる方法を学んできました。上司がタスクを割り当てれば、それをこなすことができます。しかし、あなたがボスになると、どのようなタスクを従業員に割り当てるべきかを決める必要があります。これは学ぶべきスキルなのです」
このメタファーは、AIエージェントを使いこなすためには、単に技術的な操作を学ぶだけでなく、「どのようなタスクを委託すべきか」「どのように指示すべきか」というマネジメントスキルが重要になることを示唆している。
「今はボスになるための学びを始める最高の時代です。誰もがデジタルの従業員を持つことができるのですから」
チャン氏の講演はここで締めくくられたが、この問いかけは、AIとの新しい関係性の構築に向けた重要な示唆を含んでいる。AIを道具としてではなく、一種の「デジタル従業員」として捉え、それを効果的に指揮する能力が、これからのAI時代の重要なスキルとなるだろう。
第2部:対談 タオ・チャン氏 × 茶圓 将裕氏 - 技術と市場の対話
1. 登壇者紹介:創業者と市場インフルエンサーの視点
チャン氏の基調講演に続いて行われたのは、日本のAI市場に精通したインフルエンサーとの対談セッションだ。ここでは、技術的な視点だけでなく、日本市場におけるAIエージェントの可能性と課題について、より実践的な対話が展開された。
対談のゲストとして招かれたのは、デジライフ株式会社CEOであり、GMOグループの顧問も務める茶圓将裕氏。日本のAI分野で注目される起業家であり、ソーシャルメディアでは15万人以上のフォロワーを持つ影響力のある意見リーダーだ。テレビ出演も多く、2015年からAI技術の開発、トレーニング、デジタルトランスフォーメーションなどの分野で幅広く活動している。
茶圓氏は対談の冒頭で、「中国人に見えるかもしれないが、私は日本人です」と冗談を飛ばしつつ、Manusについて「特に何もないですから、すごい応援しているプロダクトなんで」と、このプロダクトへの高い評価を語った。彼は「唯一メディアでManusを話した日本人だと思う」とも述べ、すでに多くのユースケースで活用している経験者でもあることを明かした。
両者の対談は、多くの面で補完的だった。チャン氏が技術的な視点と開発者としての洞察を提供する一方、茶圓氏は日本市場に関する深い知見とユーザー視点からの期待や懸念を表明した。
茶圓氏はまず、AIエージェント市場の現状について分析を共有。特に競合環境と収益性について独自の見解を示した。「業界早くてジェネスワークとかも出てきた」としつつも、「AIツールが安すぎる問題」に言及。「OpenAIが安すぎたというChatGPTを20ドル出したって、あれをスタンダードに出てくる」と指摘し、巨大企業が「スーパー資本プレイ」でスタートアップの立場を危うくする懸念を表明した。
さらに茶圓氏は、日本市場独自の文脈にも触れた。「僕は法人向けに仕事してるんで」と前置きしつつ、「法人向けチャットGPT」が日本で流行している現状を説明。そして現在「またブラウザ操作型のAIエージェント」という新トレンドが生まれつつあり、「超大手さんからの開発依頼いただいてる」状況を紹介した。
この発言は、日本の企業ユーザーがAIエージェントに求めるものが、個人ユーザーとは異なる可能性を示唆している。特に日本のGDPを支える大企業が「いかにAIを使えるか」という視点から、Manusのようなツールに関心を持っているという指摘は、マーケット戦略において重要な示唆を含んでいる。
チャン氏と茶圓氏の対談は、単なる技術紹介ではなく、実際のビジネス課題や市場動向との接点を探るものとなった。技術革新を生み出す側と、それを実際のビジネスに活用する側の視点が交わることで、AIエージェントがもたらす可能性と克服すべき課題が、より立体的に浮かび上がってきた。
このように異なるバックグラウンドを持つ二人の対談は、Manusという製品を多角的に理解する上で貴重な機会となった。以降のQ&Aセッションでは、事前アンケートから選ばれた質問に対して、両者がそれぞれの視点から回答していく形で議論が展開されていく。
2. 茶圓氏による市場分析と期待
対談の中で、茶圓氏はAIエージェント市場の現状と展望について独自の分析を展開した。単なる技術愛好家としてではなく、実際のビジネス現場でAIを活用する専門家としての視点は、チャン氏の技術的な説明を補完する形となった。
AIエージェント市場の現状認識(競合、収益性、エンタープライズ需要)
茶圓氏はまず、急速に変化するAIエージェント市場の競争環境について言及した。「業界早くてジェネスワークとかも出てきた」と指摘し、Anthropicなど新たな競合の台頭を踏まえた上で、業界全体が直面する「収益性の課題」に焦点を当てた。
「この領域は『やりすぎる問題』で、やっぱり利益出ないと。OpenAIが安すぎたというサトジビキを20ドル出したって、あれをスタンダードに出てくる」と茶圓氏は指摘した。彼の見解では、大手プレイヤーが非常に低価格のサービスを提供していることが、新興企業にとっての大きな挑戦になっているという。
特に資金力の差が決定的な要因になる可能性についても警鐘を鳴らした。「彼らが何できるかというと、圧倒的にはこのファンディング力なんですね。何兆6兆円ぐらいまできてから始めて、基本価格40兆円ぐらいでした。ああいうスーパー資本プレイするとスタートアップが立ち行きづらくなる」
これは、技術的優位性だけではなく、ビジネスとしての持続可能性にも目を向ける必要があるという重要な指摘だ。実際にManusのような汎用エージェントは計算コストが非常に高く(チャン氏が言及した「チャットボットの1000倍のトークン消費」)、収益モデルの設計が極めて重要になる。
一方で、日本市場のエンタープライズ需要については具体的な状況も紹介した。「ChatGPTが出てきたのは三年前で、僕はもう法人向けに仕事してるんで、それだけ話すと日本で『チャンとGPT作りたいです』と。めちゃくちゃ社内チャットGPTとか、まあ、うちも作ってますし、ギブリさんとかFWさんもやってますけど、法人向けチャンとGPTが流行ってきて」
そして現在、「またライントレードとして今エージェントが出たんで、このブラウザ操作型」が次の波として注目されているという。「僕の一番注目してるのはブラウザ操作型、各汎用的な話みたいなものなんですけど、あれはやっぱ社内で作りたいっていう、まあ超大手さんからの開発依頼いただいてるんですけど、それが流行るかなと思ってるんで」
この発言からは、日本の大企業が単なる実験ではなく、実際のビジネスツールとしてAIエージェントに関心を寄せていることが窺える。特に「社内で作りたい」という要望は、セキュリティやデータプライバシーに敏感な日本企業特有のニーズを示している。
Manusへの期待(汎用性、API連携)
茶圓氏は自身のManusの活用経験も踏まえつつ、このプロダクトに対する期待を述べた。「僕もオペレーターとアイユーズライオペレーターをめっちゃ。GBT。と二つよく使っているんですけれども、オペレーターはログインが強い。楽です」と比較しつつ、Manusについては「その分その行動というか、例えばマニュアル作ったりとか、資料を作ったりとか、動画編集っぽいのもできるんで、そのアクション力が強い」点を高く評価した。
また、サードパーティのLLMを活用できる柔軟性も強みとして挙げた。「やっぱりその原子パークとか強いのもいろんなLL使っているからじゃないですか。やっぱりその第三者サードパーティーの方があのマウスもいろんなLM使ってるんで」と指摘し、「まあオープンエーってさすがにちゃんとgptのモデルしか使えないんです。さすがにクロードモデル使うところはね、あのもらったので、その辺やっぱりサーバーっていうのは可能性を感じてるんで」と、モデル選択の柔軟性がもたらす優位性を強調した。
特に企業向け展開を視野に入れた場合、茶圓氏はAPI連携の重要性についても言及した。「マハムス様にはそのAPI会合とかそういうのを聞いていただきました」と述べ、「やっぱり日本のGDPの仕様、紙面の企業なので、まあその企業がいかにAIに使えるかみたいなところを注目していて」と、企業統合の可能性に期待を寄せた。
さらに、汎用性を保ちつつも「日本企業に浸透していく」という観点から、「こういったアマネスみたいな新興スタートアップは本当に300万ベートル数すごいと思うんですよ。まあ、そういうふうに席巻した集いツールがいかに日本企業に浸透していくかっていうのは、今日皆さんと利用したなと思っております」と、日本市場におけるManusの将来性について前向きな見方を示した。
茶圓氏の分析は、技術的な観点だけでなく、実際のビジネスユースケースやエンタープライズ市場の動向を踏まえたものであり、Manusが日本市場で成功するための実務的な視点を提供するものとなった。
3. 主要テーマ別 Q&Aダイジェスト
3.1. 競争戦略:技術的優位性の源泉、巨大企業との戦い方
対談のQ&Aセッションでは、画面に映し出されたスライドに沿って、Manusの競争戦略に関する質問が詳しく議論された。議題には「ManusとほかのAIエージェントとの本質的な違い・核心的競争力は何か」「Manusのコア技術における優位性は何か」「OpenAIなどの大手企業やオープンソースの『コピー版』に対して、Manusはどのように優れた優位性を維持できるか」といった根本的な問いが含まれていた。
チャン氏はまず、Manusの技術的優位性の本質について説明した。「私たちの最大の強みは、エージェントフレームワークにあります。当初このフレームワークが製品全体に占める割合を30%程度と想定していましたが、開発が進むにつれて70%にまで拡大しました。これにより、基盤モデル(LLM)そのものの重要性は相対的に小さくなっています」と述べた。
この点は非常に重要だ。Manusは単に既存のLLMの上に構築された「ラッパー」ではなく、独自のエージェントアーキテクチャがその核心にある。これにより、将来的に基盤モデルが進化したり、別のものに置き換わったりしても、Manusの価値提案は影響を受けにくい。
また、チャン氏は「Less structure, more intelligence(構造を減らし、知能を増やす)」という設計哲学が、技術的差別化の鍵であると強調した。「多くの競合は予め定義されたワークフローや役割分担に依存していますが、私たちはLLMの潜在能力を最大化するために、そうした制約を最小限にしています」と説明した。
茶圓氏は、ユーザー視点からの比較分析を提供した。「私はOperatorとManusの両方を使っていますが、それぞれに強みがあります。Operatorはリサーチが強く、Manusはアクション力に優れています。マニュアル作成や資料作成、動画編集的な作業が可能です」と述べ、特にManusのマルチモーダル処理能力を評価した。また、「サードパーティのLLMを活用できる点も重要な差別化要因」と指摘した。
OpenAIなどの巨大企業との競争に関する質問に対して、チャン氏は率直に「スタートアップとして、競合がいないという前提で戦略を立てることはできません。競合は必ず現れます。実際、2年経っても競合がいないとしたら、それは間違った市場にいる証拠かもしれません」と応じた。
チャン氏が示した戦略は明確だった。「現在、私たちは競合より3ヶ月先を走っています。この先行優位を維持することが重要です。イノベーションのペースを速め、常に3ヶ月のリードを保つことがスタートアップとしての生存戦略です」
また、茶圓氏は日本市場特有の視点を提供した。「巨大な資金力を持つ企業が『スーパー資本プレイ』をすれば、スタートアップの立場は厳しくなります。しかし、特定の市場や用途に特化した価値提案ができれば、共存の余地はあります」と述べた。
さらに興味深いのは、チャン氏が地域間の競争より協力を重視する姿勢を示したことだ。「日本メディアでは『日本企業がどうやって勝つか』という質問をよく受けますが、私はそれは間違った問いだと思います。重要なのは、世界全体としてどう進歩するかです」と語った。そして「日本のユーザーからのフィードバックは非常に質が高く、製品改善に貴重な貢献をしています。だからこそ日本市場を重視し、東京オフィスの開設を決めたのです」と付け加えた。
このように、Manusの競争戦略は「技術的差別化」「イノベーションの速度」「地域を超えた協力関係の構築」という3つの柱に支えられている。チャン氏の回答からは、単に競合に勝つというよりも、AIエージェント市場全体の成長と発展に貢献しようとする姿勢が伺えた。
3.2. 日本市場:ユーザー特性、ローカライズ戦略(東京オフィス、国内サーバー)、プライバシー・セキュリティへの対応
対談の中で特に注目を集めたのが、「日本市場」に関する議論だった。イベント自体が東京で開催されたという事実も、Manusが日本市場に寄せる期待の大きさを物語っている。
チャン氏はまず、日本のユーザー特性について興味深い観察を共有した。「私たちのDiscordサーバーで最もアクティブなのは日本語チャンネルです。英語チャンネルよりも活発なのは驚きでした」と述べ、日本ユーザーの熱量と関与度の高さを強調した。
さらに具体的な傾向についても言及した。「日本のユーザーは、他の国のユーザーと比較して、ウェブサイト構築の用途でManusを活用する傾向が強いことに気づきました。個人ポートフォリオ、ギャラリー、コンセプトサイト、インタラクティブな学習コースなど、多様なウェブサイトを作成しています。これは非常に興味深い現象です」
茶圓氏は日本市場特有の視点から補足した。「日本のユーザーはAIツールにもかかわらず、セキュリティとプライバシーに対する関心が非常に高いです。『情報が中国企業に漏れるのではないか』という懸念を抱く人もいます」と指摘した。
この指摘に対し、チャン氏は明確な対応策を提示した。「我々は日本市場を非常に重視しています。実際、明日から東京オフィスの候補地を見て回る予定です。4月中には東京オフィスをオープンし、現地のエンジニアやデザイナーを採用する計画です」と語った。
特に注目すべきは、データプライバシーとセキュリティへの対応策だ。「AWSやGCPと協力して、日本国内にサーバーを設置します。これにより、日本のプライバシー規制とデータに関する法律に完全に準拠できます」とチャン氏は説明した。これは、データの国外移転に敏感な日本の企業ユーザーにとって重要なポイントとなる。
茶圓氏は、日本企業の特殊性についても言及した。「日本のGDPを支える大企業は、AIの活用に非常に関心がありますが、セキュリティ面での懸念から導入をためらうケースも多い。『まず安全性が確保されているか、プライバシーが守られているか』を確認し、それが満たされなければ使わないという慎重な姿勢があります」
この点について、チャン氏は「エンタープライズ用途のセキュリティ強化は最優先事項の一つ」と応じた。「現在、無料ユーザーのサンドボックス環境は3日間保存されますが、有料ユーザー向けにはより長期間の保存オプションも検討しています。また、企業向けには専用インスタンスの提供も計画しています」
興味深いのは、ローカライズに関する話題だ。チャン氏は「日本語版のインターフェースは、英語版や中国語版よりも美しいレイアウトになっています。これはフォントの違いもあるかもしれませんが、日本語版を見たとき、『これは英語版より良い』と感じました」と笑顔で語った。ただし「まだまだ改善の余地があり、現地のデザイナーと協力して日本市場に最適化していく」とも付け加えた。
最後に、茶圓氏は日本市場で成功するための鍵として「プライバシーの誤解を解く努力」の重要性を指摘した。「日本人は自分の情報に敏感ですが、同時に過剰に反応する傾向もあります。『あなたの情報に中国側は価値を見出していない』と冗談めかして言いましたが、本質的には『適切に使えば問題ない』ということを理解してもらう必要があります」
チャン氏もこれに同意し、「透明性の確保」と「ユーザー自身によるコントロール」がManusの基本姿勢であると述べた。「ユーザーのデータはユーザーのものであり、いかなる場合も学習データとして使用されることはありません。これは技術的にも組織的にも保証できます」と強調した。
この対談から浮かび上がるのは、Manusが日本市場をきわめて戦略的に位置づけており、単なる「ローカライズ」を超えて、文化的・制度的な側面も含めた包括的な市場参入戦略を持っているという点だ。東京オフィス設立の決断は、その本気度を示すものといえるだろう。
3.2. 日本市場:ユーザー特性、ローカライズ戦略(東京オフィス、国内サーバー)、プライバシー・セキュリティへの対応
対談の中で特に注目を集めたのが、「日本市場」に関する議論だった。イベント自体が東京で開催されたという事実も、Manusが日本市場に寄せる期待の大きさを物語っている。
チャン氏はまず、日本のユーザー特性について興味深い観察を共有した。「私たちのDiscordサーバーで最もアクティブなのは日本語チャンネルです。英語チャンネルよりも活発なのは驚きでした」と述べ、日本ユーザーの熱量と関与度の高さを強調した。
さらに具体的な傾向についても言及した。「日本のユーザーは、他の国のユーザーと比較して、ウェブサイト構築の用途でManusを活用する傾向が強いことに気づきました。個人ポートフォリオ、ギャラリー、コンセプトサイト、インタラクティブな学習コースなど、多様なウェブサイトを作成しています。これは非常に興味深い現象です」
茶圓氏は日本市場特有の視点から補足した。「日本のユーザーはAIツールにもかかわらず、セキュリティとプライバシーに対する関心が非常に高いです。『情報が中国企業に漏れるのではないか』という懸念を抱く人もいます」と指摘した。
この指摘に対し、チャン氏は明確な対応策を提示した。「我々は日本市場を非常に重視しています。実際、明日から東京オフィスの候補地を見て回る予定です。4月中には東京オフィスをオープンし、現地のエンジニアやデザイナーを採用する計画です」と語った。
特に注目すべきは、データプライバシーとセキュリティへの対応策だ。「AWSやGCPと協力して、日本国内にサーバーを設置します。これにより、日本のプライバシー規制とデータに関する法律に完全に準拠できます」とチャン氏は説明した。これは、データの国外移転に敏感な日本の企業ユーザーにとって重要なポイントとなる。
茶圓氏は、日本企業の特殊性についても言及した。「日本のGDPを支える大企業は、AIの活用に非常に関心がありますが、セキュリティ面での懸念から導入をためらうケースも多い。『まず安全性が確保されているか、プライバシーが守られているか』を確認し、それが満たされなければ使わないという慎重な姿勢があります」
この点について、チャン氏は「エンタープライズ用途のセキュリティ強化は最優先事項の一つ」と応じた。「現在、無料ユーザーのサンドボックス環境は3日間保存されますが、有料ユーザー向けにはより長期間の保存オプションも検討しています。また、企業向けには専用インスタンスの提供も計画しています」
興味深いのは、ローカライズに関する話題だ。チャン氏は「日本語版のインターフェースは、英語版や中国語版よりも美しいレイアウトになっています。これはフォントの違いもあるかもしれませんが、日本語版を見たとき、『これは英語版より良い』と感じました」と笑顔で語った。ただし「まだまだ改善の余地があり、現地のデザイナーと協力して日本市場に最適化していく」とも付け加えた。
最後に、茶圓氏は日本市場で成功するための鍵として「プライバシーの誤解を解く努力」の重要性を指摘した。「日本人は自分の情報に敏感ですが、同時に過剰に反応する傾向もあります。『あなたの情報に中国側は価値を見出していない』と冗談めかして言いましたが、本質的には『適切に使えば問題ない』ということを理解してもらう必要があります」
チャン氏もこれに同意し、「透明性の確保」と「ユーザー自身によるコントロール」がManusの基本姿勢であると述べた。「ユーザーのデータはユーザーのものであり、いかなる場合も学習データとして使用されることはありません。これは技術的にも組織的にも保証できます」と強調した。
この対談から浮かび上がるのは、Manusが日本市場をきわめて戦略的に位置づけており、単なる「ローカライズ」を超えて、文化的・制度的な側面も含めた包括的な市場参入戦略を持っているという点だ。東京オフィス設立の決断は、その本気度を示すものといえるだろう。
3.4. AIの未来:エージェントの普及形態、仕事への影響、人間とAIの関係性
イベントの第3セクションでは、より広い視野でAIの未来について議論が展開された。スライドには「AIエージェント技術はどのように発展するか?社会と仕事にどのような影響を与えるか?」という大きなテーマが掲げられていた。
チャン氏はまず、AIエージェントの普及形態について興味深い予測を示した。「将来的には、AIエージェントはスマートフォンのように誰もが持つものになると考えています」と述べた上で、ゲームのアナロジーを用いて説明を続けた。
「私はもともとゲーマーでした。コーディングを始める前からゲームに熱中していました。未来は、RPGゲームのようになると思います。ゲームでは『バフ』(能力強化)なしでは強力な敵を倒せないように、将来は各自が複数のエージェントを活用する世界になるでしょう」
この見方に茶圓氏も同意し、「現在のManusはすべての処理過程を表示していますが、これは新しい体験だからです。2〜3年後にはエージェントの仕組みがより理解され、プロセスを隠して結果だけを表示するようになるでしょう。スマートフォンでも運転中にエージェントに指示し、プロセスを気にせず結果だけを受け取ることができるようになります」と補足した。
仕事への影響については、チャン氏は変化の本質について深い洞察を示した。「将来的には、知識労働の中でも特に単純で反復的な作業はエージェントに取って代わられるでしょう。しかし、これは人間の仕事が消えることを意味するのではありません」
彼は人類の歴史を振り返りながら説明を続けた。「人間の生産性が向上するたびに、新しい種類の仕事が生まれてきました。自動車が発明される前は、ガソリンスタンドやセルフドライブ旅行のような概念は存在しませんでした。同様に、AIエージェントによって新たな要求や仕事が生まれるでしょう」
茶圓氏はこの議論を日本の文脈に置き換え、「日本は生産性向上が大きな課題です。ズームの普及により仕事時間は実際に減っているのに、それが認識されていません。AIエージェントでさらに効率化が進めば、仕事時間は5時間程度になる可能性もあります」と述べた。さらに「その時、人々は何をするのか?おそらくエンターテイメントの価値が高まり、Netflixのような娯楽産業が成長するでしょう」と予測した。
人間とAIの関係性については、最も深い議論が交わされた。チャン氏は「人間とAIの理想的な関係は何か」という質問に対し、慎重に回答した。
「私たちはAIを強化する立場ですが、同時に人間の主体性も維持する必要があります。重要な決断は常に人間が行うべきです。例えば、決済や資金移動のような重要なアクションは、必ず人間の承認を経るべきでしょう」
茶圓氏はこれに対し、より哲学的な視点を提供した。「現在のAIが主体性を持っているかは疑問ですが、将来的にはその可能性もあります。唯一の制約は、AIに物理的な身体がないことです。もし身体を持ったら、人間がAIに媚びるような世界になるかもしれません」と半ば冗談めかして語った。
そして、より現実的な対策として「ヒューマンループ」の重要性を指摘した。「承認ボタンを押すような仕組みを組み込んでおけば安全です。しかし、どこかの企業がそれを外した製品を作る可能性は常にあります。オンライン攻撃だけでなく、身体を持ったロボットによるオフライン攻撃の可能性も考慮すべきです」
チャン氏はこの議論を「パーソナライゼーション」の観点から総括した。「エージェントと人間のバランスは、個人の好みに応じて調整可能であるべきです。プライバシーやエージェントの影響に敏感なユーザーには、各アクションを確認する設定を。そうでないユーザーには、より自律的な設定を提供することが理想的です」
このセクションの議論は、単なる技術予測を超えて、社会哲学や倫理にまで踏み込むものとなった。両者とも、技術の進化だけでなく、人間社会との共存をいかに実現するかという本質的な問いに向き合っている姿勢が印象的だった。特に、「強化」と「置き換え」の違いを明確に意識し、人間の創造性や意思決定を尊重する立場を示した点は、AIエージェント開発者としての責任感を感じさせるものだった。
3.5. Manusのロードマップ:短期的な機能強化計画(スケジュール実行、Write API、機能追加)
Q&Aセッションの最終部分では、「将来の発展とビジョン」としてManusの今後の計画が議論された。スライドには「Manusの長期的なビジョンは何か?今後どのように発展していくか?」「Manusチームのプロダクトに対する長期的なビジョンは何か?5-10年後のManusはどのような姿になるか?」といった質問が表示されていた。
チャン氏はまず、Manusの短期的なロードマップについて具体的な計画を共有した。「私たちはスタートアップとして非常に小さな会社なので、実際には6ヶ月先までの計画しか持っていません。それ以上先については柔軟に対応していく必要があります」と前置きしつつ、今後3〜4ヶ月の間に実装予定の機能強化について説明した。
最も注目すべき機能の一つが「スケジュール実行(Scheduling Tasks)」だ。「現在のManusでは、タスクを一度実行し、結果を一度だけ受け取ります。前回と同じ要件で再度タスクを実行したい場合は、新しくタスクを起動する必要があります」とチャン氏は説明する。これを改善するため、「毎日、毎週、毎月実行できるタスクを設定できる機能を追加します。これにより、定期的なタスクの実行がより安価で高速になります」
茶圓氏はこの機能に高い関心を示し、「これは日本の企業ユーザーが特に求めている機能です。定型業務の自動化は大きな価値を生み出します」と述べた。
もう一つの重要な強化計画が「Write API」の統合だ。チャン氏は「現在、Yahoo Finance、Bloomberg、Peter Search、Indian Searchなどの読み取り専用APIを統合していますが、今後は書き込み可能なAPIも統合していく予定です」と説明した。
具体例として、「メール送信」のAPIをあげた。「Manusがメールを送信できるようになれば、実世界に対して実際のアクションを起こすことができます。これはエージェントの能力を大きく拡張します」
これらの基本機能に加えて、チャン氏はサンドボックス環境のさらなる拡張についても言及した。「現在のサンドボックスにはファイルシステム、ターミナル、VSCode、Chromiumブラウザが含まれていますが、今後はさらに多くのアプリケーションをインストールできるようにします」と述べ、この拡張により「Manusの機能性がさらに広がる」と説明した。
AIの能力強化についても具体的な計画が示された。「今後2週間程度で、Manusに画像生成機能を追加する予定です」とチャン氏は述べた。「その後、テキスト読み上げ(Text-to-Speech)などのAI機能も順次追加していきます」
茶圓氏はこれらの機能拡張計画を「垂直統合と水平統合の両方を同時に進めている」と分析し、「これがManusの競争力を高める」と評価した。
長期的なビジョンについては、チャン氏は慎重な姿勢を見せた。「5〜10年先のことを予測するのは難しく、特にAI業界では変化が非常に速いです」としつつも、「人間の生産性を拡大するという根本的なミッションは変わらない」と強調した。
「最終的には、AIエージェントがスマートフォンのように普及し、誰もが複数のエージェントを活用する世界になると考えています。そのとき、Manusがその中心的な存在になることを目指しています」
茶圓氏も「AI業界の予測は難しい」という点に同意しながらも、「エンタープライズ市場でのManusの可能性は非常に大きい」と述べた。「特に日本企業は、安全性が確保されたAIツールを求めています。Manusが東京オフィスを開設し、日本のセキュリティ要件に対応することで、大企業への導入が加速するでしょう」
最後にチャン氏は、ユーザーコミュニティとの共創の重要性を強調した。「私たちが当初想定していた42のユースケースは、すでにコミュニティによって何倍にも拡張されています。今後もユーザーの声に耳を傾け、実際のニーズに基づいて製品を発展させていきます」
茶圓氏もこれに同意し、「日本市場特有のニーズをManusに反映させるために、ユーザーからのフィードバックを積極的に共有していきたい」と述べ、日本ユーザーコミュニティの代表としての役割に意欲を示した。
この議論を通じて明らかになったのは、Manusが短期的には具体的な機能強化計画を持ちながらも、長期的にはユーザーとの共創を通じた進化を重視している点だ。「計画された革新」と「創発的な進化」のバランスを取りながら、AIエージェント市場の急速な変化に適応していく姿勢が感じられた。
第3部:ユーザー事例紹介 - コミュニティが生み出す価値
多様な活用事例に見るManusの可能性
イベントの最後を飾ったのは、日本のManusユーザーによる実践事例の紹介だった。チャン氏の基調講演や茶圓氏との対談が「可能性」や「ビジョン」を語るものだったとすれば、このセクションは「現実」を示すものだった。様々な業種、立場のユーザーが登壇し、Manusをどのように活用しているかを具体的に紹介した。
モデレーターは「特別に才能あふれるコミュニティユーザー5名様をお招きしております。彼らがManusを活用し、どのような素晴らしい作品を生み出したのかを紹介していただきます」と述べ、多様な背景を持つユーザーを紹介した。いずれも一般ユーザーであり、開発者側からの「公式事例」ではなく、純粋にユーザー視点からの活用法が語られる点が注目を集めた。
各ユーザーの発表は5分程度の短いものだったが、そこには汎用エージェントならではの幅広い用途が示されていた。ビジネス利用から創作活動まで、分野を横断する多様な事例は、Manusが目指す「汎用性」が現実のものとなっていることを如実に物語っていた。
事例1:清水 望 氏(経営者)
最初に登壇したのは、経営者の清水望氏。自己紹介では「元々ラストマイルという会社を上場させ、最短でやめて、ポーカーに人生を賭けていましたが、最近AIが流行っているので、これにAIに人生を賭けないとまずいと思って」とユーモアを交えて語った。
清水氏は主に経営判断のサポートツールとしてManusを活用している。具体的には二つの用途を紹介した:
- 事業戦略リサーチ:「ねね」という秘書代行サービスを展開するWise社の戦略分析を例に挙げた。「社長がねね、どうやったら伸びるかな」と聞いてきたため、Manusに調査を依頼。さらに「プレゼン形式にして」と指示すると、分析結果をスライド形式で整理したウェブサイトを作成した。「社長ってこうやって長文見てもめんどくさいんで、プレゼン形式にしてって言って」と、経営者ならではの視点を共有した。
- 助成金探索:「最新の助成金情報をとにかくいち早くピックアップする」「4月1日に出た助成金を新しく使ったビジネスが何ができるだろう」といった形で、助成金の調査とそれを活用したビジネスアイデアの創出にManusを活用していると説明した。
清水氏は「AIで何もサイト何も使えなかったんですけれども、とにかく人生AIにオールインすべきだ」と締めくくり、経営判断のスピードと質の向上にManusが大きく貢献していることを示した。
事例2:佐藤 すぐる 氏(AI研修企業)
次に登壇した佐藤すぐる氏は、AI研修を法人向けに提供する企業「グラベーション」の代表。Manusの招待コードをメトリー氏から受け取り活用を始めたという。
佐藤氏が紹介したのは、自社の事業分析と戦略立案におけるManusの活用法だ:
「弊社がAIの研修とかやってる会社なので、まずは弊社の情報をManusに調べてもらい、その上で競合だったり日本のAI市場の状況だったりを全体的に調査してもらって、弊社に対するコンサルのような資料を作ってもらいました」
スクリーンに映し出された成果物は、競合分析、市場調査、ポジショニングマップなどを含む本格的なコンサル資料だった。佐藤氏は「割となんですか、例えば競合だったりで、樋口さんがこういったことを展開しますと言った内容がしっかりと記載されています」と、情報収集の精度の高さに言及した。
「最終的には出てくるのはしっかりとPwCだったりとか、そういったところのコンサルだったりとか、まとめたPDFだったりとか、中身しっかり読んだレポートだったりとか。それだけじゃなくて、15社ぐらいの類似企業にもあたっている」と成果物の質の高さを評価した。
この事例は、専門業務における効率化と質向上の可能性を示すものだった。特に注目すべきは、AI研修を提供する立場であるにもかかわらず、自らがAIツールのユーザーとなることで、より深い知見を得ている点だろう。
事例3:あやみ 氏(マーケター)
三人目はマーケターのあやみ氏。「マーケティングの仕事をスタートアップでしているが、雑用GPT研究所を手伝っていて、そこから招待コードをもらった」と説明した。
あやみ氏は主に二つのユースケースを紹介した:
- 操作画面からのマニュアル自動生成:「PCの操作画面の動画を渡してマニュアル作成してくれ」と指示すると、Manusは2分程度のChatGPT操作方法の動画から、操作手順を文章化し、適切な場所でのスクリーンショットを自動的に挿入してPDFマニュアルを作成した。「ボタンを押しますみたいなキャプチャーがこのPDFの中にちゃんと入っているものができた」と、特にビジュアル要素の自動挿入に感心した様子だった。
- 高品質PDF生成:「よくあるホワイトペーパーみたいなやつが作れたらすごくいいな」という思いから、「雑誌風のPDF作成」をManusに依頼。結果として「こういうふうに綺麗に作ってくれた」と、レイアウトやデザインも含めた高品質なPDFドキュメントの自動生成に成功した。
あやみ氏は特にPDFの品質について「PDFを作るのは結構なんか汎用AIだと汚かったりするんで、すごいなと思いました」と評価した。一方で、「AIエージェントが普及した世界においてマニュアルがいるのかって話があって、あんまりいいユースケースじゃないかな」と自己評価するなど、技術の進化によってユースケース自体も変わっていく可能性についても示唆した。
事例4:香水 紀勢 氏(クリエイター)
四人目の香水紀勢氏(ペンネーム、本名は中山氏)は、クリエイティブな領域でのManusの活用事例を紹介した。
「チャット型TRPG(テーブルトークロールプレイングゲーム)」のためのプロンプト生成が彼のユースケースだ。香水氏はManusに「ゲームマスターをAIに務めてもらうためのプロンプトを作って」と依頼した。
その結果、「最初にどんなゲームかっていうのと、最初にどんなVR世界に入るのかっていうのをデザインにしてもらって、そのデザインした世界で遊べるというゲーム」のためのプロンプトが生成された。
このプロンプトはただの文字列ではなく、「こんな感じでパワーのゲームを忘れて、ブロックが使えるという、ユーザーのワークスの範囲で」機能するように設計されている。これはManusがただ指示を与えられたタスクを実行するだけでなく、その先の使われ方まで考慮して設計できることを示す例だ。
エンターテイメントやクリエイティブ領域でのこうした活用は、AIエージェントが単なる業務効率化ツールではなく、創作支援ツールとしても価値を持つことを示している。
事例5:安藤 洋平 氏(AI開発企業)
最後に登壇したのは安藤洋平氏。「株式会社リンク、AIという会社で、AIのアプリケーションの受託開発であったりとか、AIを使った開発の研修をやっていたり、エンジニアコミュニティのAI推進を担当している」と自己紹介した。
安藤氏のユースケースは、コンテンツ制作の効率化に関するものだった:
「四ヶ月前から『AIは絶対自分よりもいい記事を書くだろう』と思って、全部AIに書かせるという実験を毎日やっています」と語り、Manusによるブログ記事作成の事例を紹介した。
以前は「自分でテロであったりとかでリサーチをして、大袋にプロットを入力して、書かせていた」が、最近では「もうManusに闇雲にプロンプトを投げる。テーマだけを自分が考えてやるだけで、難しいところは全部やってくれる」と説明した。
その結果生まれた記事は「サムネイルであったりとか、YouTubeのリンクを貼ってたりとか、キャプチャーをとってたりとか、図解していたりとか」といった要素が自動的に組み込まれたものになるという。これらの要素を「バランスが勝手にいい感じに切り貼りしてくれた」と評価した。
さらに安藤氏は、突発的なタスクにも対応できる点を高く評価した。「展示会に出すことになって、急遽ポートフォリオを作らないといけないとなった時に、ポートフォリオ求めて、モーションのURLを渡したら、いい感じにサイトにしてくれた」という具体例を紹介。
「定期業務となんか突発的な業務を両方とも任せられるというのは、すごいインパクトだなと思って。スタートアップとかに非常にインパクトのあるプロダクト」と締めくくった。
おわりに
Manusの挑戦とAIエージェントの発展への期待
「AIエージェント」という言葉が一般化しつつある2024年、Manusはその最前線に立つプロダクトとして注目を集めている。本レポートで紹介したManusの誕生秘話と日本市場での展開は、AIエージェント市場全体の動向を映し出す鏡のようでもある。
チャン氏の創業ストーリーから見えてくるのは、イノベーションの本質的な姿だ。モニカ.doという成功した製品から敢えて次の挑戦に向かう勇気。AIブラウザの開発中止という「失敗」を貴重な学びに変える柔軟さ。そして、Cursorの観察から得た洞察に基づいてManusを生み出す創造力。こうした試行錯誤のプロセスこそが、真に革新的なプロダクトを生み出す源泉となっている。
特に印象的なのは、「Less structure, more intelligence」という設計哲学だ。LLMの能力を最大限に引き出すためには、人間の側が過度な制約を課すべきではないという考え方は、AI開発全体に対する一つの重要な示唆を含んでいる。私たちはAIを「設計」するのではなく、AIが能力を最大限に発揮できる「環境」を整えるべきなのかもしれない。
Manusが日本で目覚ましい反響を得ていることも、重要なポイントだ。日本のユーザーコミュニティが示す熱量と創造性は、AIエージェントの潜在的な価値をリアルに示している。経営判断の迅速化、専門的リサーチの効率化、クリエイティブな創作活動の支援など、様々な分野での活用事例は、AIエージェントが単なるバズワードではなく、実際の価値を生み出すツールになりつつあることを証明している。
一方で、課題もある。プライバシーやセキュリティへの懸念、トークン消費量の膨大さ、インフラのボトルネックなど、AIエージェントの普及にはまだ乗り越えるべきハードルが存在する。しかし、Manusチームの東京オフィス開設の決断やロードマップに見られるように、これらの課題に対する具体的な解決策も模索されている。
「労働力のスケーリング」と「人類の生産性拡大」というManusのミッションは、AIエージェント全体の方向性を示すものでもある。自動車の発明が人類の移動能力を拡張したように、AIエージェントは私たちの知的生産性を劇的に向上させる可能性を秘めている。それは単に「効率化」だけでなく、新たな創造の可能性を開くものだ。
AIエージェント市場はまだ黎明期にあり、これからどのように進化していくかは誰にも正確には予測できない。しかし、Manusの事例が示すように、試行錯誤を恐れず挑戦し続けることが、この分野での成功の鍵となるだろう。
終わりに
AIエージェントの時代は、すでに始まっている。これは単なる「次のAIトレンド」ではなく、私たちと技術の関係性を根本から変える可能性を持つパラダイムシフトだ。チャン氏が指摘するように、この変化の本質は「ボスになる」ことにある。AIに指示を出し、成果を評価し、フィードバックを与える—これまで多くの人にとって遠い存在だった「マネジメント」の経験が、AIエージェントを通じて身近なものになるのだ。
この変化に対応するためには、新しいスキルセットが必要になる。「何を」依頼するか、「どのように」指示するか、「どう評価するか」—これらは単なるプロンプトエンジニアリングを超えた、AIとの新しい協働の形を模索する試みとなる。
AIエージェントのパワーを最大限に活用するには、チャン氏や茶圓氏が繰り返し強調するように「まずは試してみる」という姿勢が重要だ。あまりに精緻なプロンプトを考えるよりも、まずは具体的なタスクを投げかけて、フィードバックを元に調整していく方がはるかに効果的だ。AIエージェントは本質的に「学習」するものであり、あなたとの対話を通じて進化していく。
また、AIエージェントの普及がもたらす社会的な変化についても、私たち一人ひとりが考える必要がある。労働のあり方、創造性の定義、人間とAIの関係性—これらはすべて再定義される可能性がある。しかし、この変化は恐れるべきものではなく、むしろ私たちが主体的に形作っていくべきものだ。
Manusの事例が示すように、AIエージェントの発展は「人間vs AI」という対立構図ではなく、人間とAIが互いに強化し合う共創の物語となる可能性を秘めている。その物語をどのように紡いでいくかは、最終的には私たち自身の選択にかかっている。
AIエージェントの時代を、ただ傍観するのではなく、積極的に参加し、形作っていく—そんな姿勢で新しい技術との関係を築いていただけたら幸いだ。