※本記事は、Y Combinatorが提供する「The Lightcone」にて配信された、CaseText共同創業者兼CEOのJake Heller氏へのインタビュー内容を基に作成されています。元動画は「Why Vertical LLM Agents Are The New $1 Billion SaaS Opportunities」というタイトルで、Y CombinatorのYouTubeチャンネルにて公開されています。 本記事では、垂直統合AIエージェントを活用したSaaS企業の構築について、2023年にThomson Reutersに6.5億ドルでの買収を実現したCaseTextの事例を中心に、インタビューの内容を要約しております。なお、本記事の内容は原著作者の見解を正確に反映するよう努めていますが、要約や解釈による誤りがある可能性もありますので、正確な情報や文脈については、オリジナルの動画をご視聴いただくことをお勧めいたします。 Y Combinatorについての詳細情報は、公式ウェブサイト(ycombinator.com)でご確認いただけます。
1. Case Textの創業と初期の取り組み
1.1 法律業界における技術的課題の発見
Jake Heller(Case Text創業者): 私は2012年に法律事務所で働いていた時、法律業界における技術的な非効率性に強い問題意識を持ちました。当時、私は新しいiPhoneを使って、映画の上映時間や近くのベジタリアン向けタイ料理店を簡単に見つけることができました。しかし、依頼人の無罪を証明する証拠を見つけたり、10億ドルの訴訟を勝ち取るための重要な判例を探したりする場合、5日間連続で朝5時まで作業しなければならないような状況でした。
法律事務所での実務経験から、特に文書検索のプロセスに大きな非効率性があることを実感しました。オンラインシステムが導入される前は、弁護士たちは文字通り地下室で段ボール箱いっぱいの文書を1枚1枚読んでいかなければなりませんでした。例えば、ファイザーやGoogleのような企業の潜在的な不正を調査するために、すべての社内メールを確認する必要がありました。判例法を調べる場合も、図書館に行って本を開いて読んでいく必要があり、新しいWeb検索ツールが登場し始めていましたが、それらは非常に扱いづらいものでした。
コンピュータサイエンスのバックグラウンドを持っていた私は、この状況を改善するために、使用していたツールの上にブラウザプラグインを自作して業務の効率化を図りました。しかし、法律事務所の法務部長は、私がテクノロジーの開発に時間を費やすことに懸念を示し、さらに当時作成した技術はすべて法律事務所の所有物であると明確にしました。この経験が、私が法律事務所を去りYCombinatorに応募し、新しい会社を立ち上げる決断をする大きなきっかけとなりました。
Gary(インタビュアー): Jakeは法律とコンピュータサイエンスの両方のトレーニングを受けていた珍しいタイプの人材でした。法律事務所での非効率的な作業プロセスは、彼のような技術的な背景を持つ人間にとっては特に耐えがたいものだったに違いありません。
1.2 最初のビジネスモデル - UGC(ユーザー生成コンテンツ)の失敗
Jake Heller: 会社を立ち上げた当初、私たちは問題の正しい方向性は見えていましたが、その解決策を見つけるまでにかなりの時間を要しました。法律分野における技術的な問題と、弁護士が法律研究や理解のためにコンテンツを必要としている現状を見て、私たちは技術とコンテンツの両面からアプローチすることを考えました。
当時、私たちのヒーローはStack Overflow、Wikipedia、GitHubのような、ユーザー生成コンテンツ(UGC)やオープンソースのウェブサイトでした。そこで、より良い技術と、より良いコンテンツを組み合わせる戦略として、弁護士たちに判例法の注釈付けや情報提供を行ってもらうUGCサイトの構築に数年を費やしました。
しかし、これは完全な失敗に終わりました。私たちは弁護士に時間を割いて貢献してもらうことができなかったのです。典型的なWikipediaの編集者は時間を持て余していて、利他的に無料でコンテンツを追加する傾向にありますが、弁護士は時間単位で請求する職業であり、時間は非常に貴重です。常に時間が不足している彼らに、UGCサイトへの貢献を期待することは現実的ではありませんでした。
この経験から、私たちはビジネスモデルの転換を余儀なくされ、自然言語処理や機械学習への投資を開始することになりました。当時はAIとは呼ばれていませんでしたが、この転換が後の発展につながる重要な一歩となりました。
Gary: スタートアップの創業者がアイデアの迷路に入って行き、壁を感じながら左右どちらに進むべきかを探る過程は珍しくありません。多くの場合、創業者は行き止まりに突き当たり、ピボットを余儀なくされます。Jakeの場合も、UGCモデルの失敗から新しい方向性を見出すことになりました。
1.3 NLPとML技術への投資と漸進的な改善
Jake Heller: UGCモデルの失敗後、私たちは自然言語処理と機械学習への深い投資を開始しました。当時はこれらの技術はAIとは呼ばれていませんでしたが、競合他社が持つ巨大なコンテンツデータベースの価値を、自動化された方法で再現できないかと考えたのです。
私たちは、PandoraやSpotifyで使用されている音楽推薦アルゴリズムのような関連性技術を法律分野に応用することを試みました。音楽の場合、ある曲と別の曲の関係性を分析し、「これを聴いた人はこれも聴いている」という推薦を行います。同様に、私たちは判例法における引用関係に着目し、判例間のネットワークを構築しました。例えば、弁護士が作成した文書をアップロードすると、「この判例に言及する人は、必ずこの判例も参照している」というような示唆を提供できるようになりました。
このような取り組みの結果、年間70-80%の成長率を達成し、年間収益も1,500万から2,000万ドルの規模まで成長しました。しかし、これらの改善は法律業務のワークフローに対する漸進的な改善に過ぎませんでした。実際、多くの顧客は「私は年間500万ドルを稼いでいるのに、なぜ何かを変える必要があるのか」という態度を示していました。このような状況は、ChatGPTが登場するまで続きました。
Gary: CaseTextは10年間で0から1億ドルの評価額まで成長しましたが、この時期の改善は確かに漸進的なものでした。しかし、この10年間の経験と投資が、後のGPT-4時代における急速な成長の基盤となったことは注目に値します。
2. GPT-4との出会いと大転換
2.1 GPT-4の初期アクセスと48時間での全社的方針転換
Jake Heller: 私たちの10年にわたる道のりの中で、運という要素も確かにありました。早い段階からAIと自然言語処理に深く投資していたことで、OpenAIを含む様々な研究機関との密接な関係を築いていました。そして、OpenAIが初期のGPT-4(当時はGPT-4とは知らなかった)のテストを開始した際、私たちは非常に早い段階でアクセスを得ることができました。
この技術を初めて目にしてから、わずか48時間で会社の全方針を転換する決断を下しました。当時約120名いた社員全員のプロジェクトを、それまで取り組んでいた内容から、GPT-4技術に基づく新製品「Co-Counsel」の開発に100%シフトすることを決定したのです。これは大きな賭けでしたが、技術の革新性を目の当たりにして、躊躇する理由はありませんでした。
Gary: Jakeは、今回のインタビューで月面着陸の最初の人物に例えられましたが、それは彼がYコンビネーターの友人たちの中でも、これが単なる変化ではなく、革命的な転換点であることをいち早く認識し、会社の全てを賭けることを決断した最初の人物の一人だったからです。実際、直近のYコンビネーターのS24バッチには、垂直特化型AIエージェントを構築する企業が文字通り数十社含まれており、その先駆者としてのJakeの洞察は正しかったことが証明されています。
Jared(インタビュアー): このような急激な方針転換は、特に10年間順調に成長してきた企業にとっては極めて異例です。年間70-80%の成長率を達成し、1500万から2000万ドルのARRを実現していた企業が、48時間という短期間で全てを変えるという決断は、並々ならぬ確信があったことを示しています。
2.2 創業者自身による最初のプロトタイプ開発
Jake Heller: GPT-4への初期アクセスは、当初は私と共同創業者のみに制限されていました。これは一見制約のように思えましたが、結果的には完璧なタイミングでした。私は自分自身でプロトタイプの開発を始めることを決意しました。120人規模の会社で、多くのエンジニアや法律の専門家がいたにもかかわらず、自ら最初のバージョンを構築したのです。
GPT-4を見た金曜日から週末をかけて作業を行い、月曜日には経営陣のオフサイトミーティングが予定されていました。通常であれば、次四半期の売上目標達成方法などを議論する予定でしたが、私は「今日は全く異なる話をしなければならない」と切り出し、自分のラップトップで作ったプロトタイプを見せました。
リーダーシップとして模範を示すことで、この急激な方針転換への理解を得ることができました。特にこれは、10年間の道のりで何度も「この方向に行くべきだ」と主張してきた私にとって、おそらく従業員に対する最後のチャンスだったかもしれません。従業員たちは以前から「またJakeが新しい crazy な技術とアイデアを持ってきた」と思っていたでしょう。しかし、実際に動くプロトタイプを示すことで、説得力のある提案となりました。
その後、NDaの範囲を少しずつ拡大していき、最初の1週間半は小規模なチームで開発を継続しました。この期間に私たちは最初の実用的なバージョンのプロトタイプを完成させることができました。
Gary: Jakeの行動は、深い確信に基づくものでした。120人規模の会社の創業者が自らIDEを開いてコーディングを始めるというのは極めて異例です。しかし、この行動が従業員や経営陣の信頼を得る上で重要な役割を果たしたことは明らかです。
2.3 顧客の劇的な反応と実証実験
Jake Heller: OpenAIとの契約により、当初は製品を公開することはできませんでしたが、一部の顧客とNDA(秘密保持契約)を結ぶことは許可されていました。これにより、GPT-4の公開リリースの数ヶ月前から、選ばれた顧客との実証実験を開始することができました。
興味深いことに、これらの顧客はGPT-4を使用していることを知らされていませんでしたが、彼らは何か特別なものを目にしていることを直感的に理解していました。これは、ChatGPTが登場する前の時期であり、顧客たちにとって、この「神のような」AIと対話する最初の経験となりました。私が弁護士として働いていた時には1日がかりでやっていた作業が、突然90秒で完了するようになったのです。
顧客の反応は劇的でした。Zoomコール越しに、彼らが実存的な危機を経験している様子を観察することができました。上級弁護士たちの表情が変わり、「ああ、私はすぐに引退しないといけないな」といった反応を示すのを目の当たりにしました。
このような顧客の反応は、社内の懐疑的なセールスやマーケティング、エンジニアリングのスタッフを説得する上でも非常に効果的でした。Zoomコールで顧客が製品にリアルタイムで反応する様子を見せることで、スタッフの意識は急速に変化していきました。
Gary: この時期はまだChatGPTも存在せず、多くの人々にとって、高度なAIとの対話は全く新しい経験でした。特に、保守的な傾向のある法律業界において、このような劇的な反応を引き出せたことは、技術の革新性を示す重要な証拠となりました。
Jake Heller: はい、その通りです。実際、ChatGPTが公開された後、すべての弁護士が「これが自分の仕事をどのように変えるかはわからないが、大きな変化が起こることは確実だ」と感じ始めました。それまで「私は年間500万ドルを稼いでいるのに、なぜ何かを変える必要があるのか」と言っていた同じ人々が、「年間500万ドル稼いでいるからこそ、この変化に先んじる必要がある」と考え始めたのです。ChatGPTの登場前から、私たちはすでにGPT-4を使用した製品の開発を進めていたため、市場が大きく動き始めた時には準備ができていました。
3. Co-Counselの開発プロセス
3.1 GPT-3/3.5から4への性能向上の実証
Jake Heller: 私たちは長年、様々な研究機関と密接な関係を築き、彼らが開発中の技術を法律分野に応用できないか検討してきました。GPT-3やGPT-3.5の時代には、OpenAIは定期的に新しいバージョンを見せてくれましたが、その都度「これで法律分野に何か作れないか」と問われ、私たちは「これは使えない」と答えざるを得ませんでした。
GPT-3.5の時点では、モデルは法律家らしい英語を話すことはできましたが、事実を完全に作り上げてしまうことが多く、法律分野での実用は困難でした。特に法律では事実の正確性が極めて重要で、誤った仮定や推測は許されません。
この進歩を定量的に示す興味深い例として、司法試験の成績があります。GPT-3.5が司法試験を受けた際、下位10パーセンタイルの成績でした。つまり、ランダムに回答した人よりは若干良い程度でした。しかし、私たちがOpenAIと協力して、トレーニングセットに含まれていない全く新しいテストでGPT-4を評価したところ、上位10パーセンタイルの成績を達成したのです。
この劇的な性能向上は、文書要約や法的分析においても明確でした。例えば、4〜5件の判例を読み、その内容を使って特定の法的質問に対するメモを作成するようなタスクでも、GPT-4は正確な引用と適切な文脈理解を示すようになりました。私たちは多くのプロンプトエンジニアリングを行い、与えられた文脈内の実際の情報のみを使用し、事実を作り上げないようにモデルを調整することができました。
Gary: この司法試験での成績向上は、GPT-4の能力が単なる漸進的な改善ではなく、質的な飛躍を遂げたことを示す象徴的な例となりました。特に法律分野では、正確性と信頼性が絶対的に重要であり、この進歩は実用化への大きな一歩となったと言えます。
3.2 テスト駆動開発アプローチの採用
Jake Heller: 私たちは、プロンプトエンジニアリングにテスト駆動開発(TDD)のアプローチを採用しました。実は、私は以前のソフトウェア開発においてTDDをそれほど重視していませんでした。「コードが動くかどうかは実行してみれば分かる」という考えでした。しかし、プロンプトエンジニアリングにおいては、TDDが10倍以上重要になることが分かりました。
その理由は、LLMの予測不可能な性質にあります。LLMは予期せぬ方向に突然逸れることがあり、あるテストケースの問題を解決するための指示を追加すると、別のテストケースが突然失敗するということが頻繁に起こります。そのため、私たちは最初に数十のテストケースを作成し、その後数百、最終的には数千のテストケースまで拡大していきました。
各テストケースには「ゴールドスタンダード」、つまり理想的な回答を用意しました。例えば、英語での質問を検索クエリに変換するタスクであれば、1,200回試行して1,199回は正しい結果を得られるようにプロンプトを調整していきました。プロンプトエンジニアは、私を含めて全員が、まずテストを書き、次にそのテストをパスするための英語のプロンプトを作成するというアプローチを取りました。
Gary: このTDDアプローチは、通常のソフトウェア開発以上にプロンプトエンジニアリングで重要になるという指摘は興味深いですね。特に法律分野では高い精度が要求されるため、このような厳密なテストの積み重ねが不可欠だったと理解できます。
Jake Heller: はい、その通りです。エッジケースへの対応も重要でした。例えば、法律文書ではスキャンの歪みや手書きのメモ、1ページに4ページ分の情報を印刷する特殊なレイアウトなど、様々な特殊なケースが存在します。これらすべてのケースに対応できるよう、テストケースを徹底的に作成し、プロンプトを調整していきました。
3.3 法律業務の細分化とプロンプト設計
Jake Heller: Co-Counselの開発において、私たちは「世界最高の弁護士ならばこの問題にどうアプローチするか」という視点から、法律業務のプロセスを細分化しました。例えば、法律調査のケースでは、パートナーから依頼を受けた最優秀の弁護士は、まず依頼内容を具体的な検索クエリに分解します。
これらの検索クエリは時にSQLのような特殊な検索構文を必要とし、英語での依頼内容から10個以上の異なる検索クエリを生成する必要があります。その後、各クエリを法律データベースで実行し、それぞれ100件程度の結果を得ます。最も勤勉な弁護士であれば、これらの結果すべてを丹念に読み、判例法や法令、規制について注釈を取り、段落ごとに応答の概要を作成していきます。最終的に、このプロセスで得られた洞察と引用を組み合わせて、完成した調査メモを作成します。
私たちは、このような複雑なプロセスの各ステップを個別のプロンプトとして実装しました。最終的な結果を得るまでに、12から24の異なるプロンプトを連鎖的に実行する必要があり、各プロンプトは「ステップ・バイ・ステップ」で考えるよう設計されています。
さらに、各ステップにおいて「良い結果とは何か」を明確に定義し、それぞれのプロンプトに対して大量のテストケースを用意しました。例えば、研究プロセスの最初の段階である英語の質問から検索クエリへの変換では、何が適切な検索クエリなのかの「ゴールドスタンダード」を定義し、それに基づいてプロンプトを調整していきました。
Gary: この細分化アプローチは、複雑な法律業務を管理可能な小さなタスクに分解し、各タスクの精度を個別に向上させることを可能にしました。特に、ベテラン弁護士の思考プロセスをモデル化したことで、単なる自動化を超えた、専門家レベルの判断を実現できたことは注目に値します。
Jake Heller: はい、その通りです。各ステップでの高い精度を確保することで、最終的な結果の信頼性も大きく向上しました。このアプローチは、後のClaude 1のような新しいモデルへの対応でも有効であることが分かっています。
4. 垂直統合AIエージェントの価値
4.1 単なるGPTラッパーを超えた統合の重要性
Jake Heller: よく「多くの企業は単にGPTのラッパーを作っているだけだ」という批判を耳にしますが、実際に顧客の問題を解決し、若手アソシエイトの仕事を本当に代替しようとすると、そこには多くの層が存在することがわかります。これらの層を全て組み合わせると、もはや単なるGPTラッパーではなく、完全なアプリケーションとなります。
まず、私たちの場合、法律そのものと、それに対する自動的な注釈付けを含む独自のデータセットを持っています。また、法律業界特有の文書管理システムとの連携も重要です。法律事務所は非常に特殊な文書管理システムを使用しており、これらとの接続は不可欠です。
さらに、OCRの品質や設定方法といった一見些細に見える技術も重要です。Co-Counselが大量の文書をレビューする際、手書きのメモが書き込まれていたり、スキャンが傾いていたり、1ページに4ページ分の情報を印刷する法律業界特有の方式(4-upレイアウト)があったりと、様々な課題があります。この場合、文書は左から右ではなく、1-2-3-4の順で読む必要があります。
実際、大規模言語モデルに到達する前の段階で、これらすべての課題に対応するために数十もの機能をアプリケーションに組み込む必要があります。そして、プロンプティングの部分でも、テストとプロンプトの作成、大きな問題をステップバイステップで分解する戦略、情報の適切な形式での入力方法など、すべてが私たちのIPとなり、再現が非常に困難なものとなっています。
Gary: これは実際、成功したSaaSビジネスすべてに共通する特徴かもしれませんね。多くのSaaSは特定のドメインに対して非常に特殊で難解な統合を必要とします。
Jake Heller: そうですね。長年、SaaSは基本的に「SQLラッパー」のようなものでした。Salesforceのような非常に成功した企業でさえ、本質的にはデータベース間のテーブルの接続に関するビジネスロジックを構築していたのです。重要なのは、技術的に熟練した人だけができることを、より多くの人々がアクセス可能にすること、あるいはデモでは70%しか機能しないものを100%機能するようにすることです。ユースケースによっては、70%の機能に月額20ドルを支払う人もいれば、100%の機能に500ドルや1,000ドルを支払う人もいるでしょう。
4.2 70%から100%の精度向上への取り組み
Jake Heller: 法律分野では、精度が70%では全く不十分です。10年以上にわたり法律家を顧客としてきた経験から、私たちは些細なミスでさえ即座に指摘されることを学びました。この完璧さへの要求は、AIシステムの開発において重要な指針となりました。
特に重要なのは、ユーザーの初期使用体験です。これらのシステムに対する信頼は非常に脆く、特に最初の体験が悪ければ、「AIについては1年後にまた確認してみよう」という態度になってしまいます。特に、技術者ではなく忙しい法律家の場合、このリスクは顕著です。そのため、私たちは法律家の最初の1週間の体験を完璧なものにすることに注力しました。
Gary: つまり、多くの人が言う「LLMは幻覚を見すぎる」「精度が足りない」といった批判は、適切な実装方法を見つけていないだけかもしれませんね。
Jake Heller: その通りです。私は、これらの批判に基づいて諦めないよう人々を励ましたいと思います。どんなケースでも、適切なパスは存在します。重要なのは、単なる自動化を超えて、戦略的で知的な判断ができるレベルまで高めることです。企業は現在、これらの業務に何百万ドルもの給与を支払っているわけですから、たとえその90%でも自動化できれば、そこには大きな価値があります。また、興味深いことに、これによって仕事がなくなるわけではなく、むしろより興味深いものになっていくと考えています。
4.3 ドメイン固有の統合とカスタマイズの重要性
Jake Heller: 私たちは、特定のドメインの専門家が技術的に実現可能なことと、一般のユーザーがアクセス可能なことの間のギャップを埋めることに注力してきました。法律分野では、特殊なデータベースとの連携が不可欠です。これらのデータベースは独自の検索構文を持ち、SQLに似た特殊なクエリ言語を必要とすることがあります。
また、法律事務所特有の文書管理システムとの統合も重要です。法律文書には独特のフォーマットや要件があり、例えば1ページに4ページ分の情報を印刷する特殊なレイアウト(4-up)や、手書きの注釈、歪んだスキャン画像など、様々な特殊ケースに対応する必要があります。これらの要件に対応するためには、OCRの適切な設定から、文書の読み取り順序の制御まで、細かなカスタマイズが必要です。
Gary: これは成功しているSaaSビジネスに共通する特徴ですね。Salesforceのような企業でさえ、本質的にはデータベース間のテーブルの接続に関するビジネスロジックを構築していたわけです。
Jake Heller: その通りです。実際のところ、チャットGPTでデモを作ると70%程度は機能するように見えますが、実務で100%機能するようにするには、このような深いドメイン統合が不可欠です。ユースケースによって、70%の機能性に月額20ドルを支払うユーザーもいれば、100%の機能性に500ドルや1,000ドルを支払うユーザーもいます。私たちの場合、法律分野での完璧な機能性を実現するために、これらの統合とカスタマイズに多大な投資を行っています。
実際、大規模言語モデルに到達する前の段階で、これらすべての課題に対応するために数十もの機能をアプリケーションに組み込む必要があります。このような垂直統合の深さが、単なるGPTラッパーとの決定的な違いを生み出し、真の価値を創出しているのです。
5. Claude 1との経験と将来展望
5.1 システム1からシステム2思考への進化
Jake Heller: GPT-4までの言語モデルは、ダニエル・カーネマンのノーベル経済学賞受賞理論でいうところの「システム1思考」、つまり直感的で素早い判断を得意としていました。しかし、より複雑な実行機能、つまり「システム2思考」は不得意でした。私たちは、これまでプロンプトを通じて、モデルに実行機能を与えるような工夫を重ねてきました。
Claude 1は、この「システム2思考」の能力において、大きな進歩を見せています。これは単なる進化というよりも、思考の質的な転換点に到達したと感じています。例えば、問題を提示すると、まるで人間のように「しばらく考えさせてください」というような時間をかけて、より論理的で深い思考プロセスを展開します。
Gary: これは非常に興味深い観察ですね。現在のLLMの研究者たちの多くが、このシステム2思考の実現をAGIへの重要なステップとして注目していると聞いています。
Jake Heller: その通りです。私たちはまだClaude 1の内部構造については詳しく知りませんが、もしOpenAIが人々の内部モノローグ、つまり段階的な思考プロセスの大規模なコーパスを持っていれば、01はさらに優れたものになるだろうと考えています。これは、私たちがCo-Counselの開発で採用した「ステップ・バイ・ステップ」のアプローチとも共鳴する部分があります。
しかし、ここで興味深いのは、このような思考プロセスの制御可能性です。将来的には、プロンプトを通じてモデルに「どのように考えるべきか」を指示できるようになるかもしれません。特に、私たちのように国内トップクラスの法律家を雇用している企業では、彼らの専門的な思考プロセスをモデルに組み込むことができる可能性があります。ただし、これについてはまだ確定的な証拠は得られていない段階です。
5.2 詳細な分析能力の向上
Jake Heller: Claude 1は、これまでの言語モデルでは難しかった精密な分析能力を示しています。私たちが実施した興味深いテストの一つに、実際の法律文書の微細な変更の検出があります。具体的には、40ページの法律文書の中で、弁護士が引用した判例の要約や引用を意図的に少し変更し、元の判例と比較してもらうというものでした。
これまでのLLMは「完璧です」と答えるだけでしたが、Claude 1は文書をじっくりと分析し、「andをorに変更している」「neither norの構文が原文とは異なる」といった微細な変更を正確に指摘することができました。まるで時間をかけて考えているかのように、「待ってください」という感覚で、長時間の思考プロセスを展開します。
このような精密な比較分析能力は、法律文書のレビューにおいて極めて重要です。なぜなら、一つの単語の違いが判決の解釈を完全に変えてしまう可能性があるからです。Claude 1は、このような精密な分析を必要とするタスクにおいて、驚くべき能力を示しています。
Gary: これは非常に印象的な進歩ですね。特に、法律分野での実用化を考えた場合、このような精密な分析能力は不可欠だと思います。
Jake Heller: そうですね。さらに興味深いのは、この能力が単なる文書比較を超えて、より複雑な分析タスクにも適用できる可能性があることです。私たちはまだ探索の初期段階ですが、このような精密な分析能力は、法律実務における多くの高度な判断タスクに応用できる可能性があると考えています。
5.3 プロンプト設計の新しい可能性
Jake Heller: 私たちは現在、Claude 1のような新しい世代のLLMと共に、プロンプト設計の新しい可能性を探索しています。特に興味深いのは、モデルの思考プロセスをより直接的に制御できる可能性です。私たちが調査しているのは、「何を考えるべきか」だけでなく、「どのように考えるべきか」をモデルに指示できるかという点です。
私たちは国内トップクラスの法律家を雇用しており、彼らの専門的な思考プロセスをプロンプトを通じてモデルに注入できないかと考えています。例えば、特定の法的問題に直面したとき、熟練した法律家がどのような思考の順序で問題を分析し、どのような観点に注目するのかといった専門知識を、モデルの思考プロセスに組み込むことができるかもしれません。
Gary: それは興味深い視点ですね。OpenAIが人々の内部モノローグ、つまり段階的な思考プロセスの大規模なコーパスを持っていれば、モデルの性能はさらに向上する可能性があるということですか?
Jake Heller: はい、その通りです。ただし、現時点ではこのアプローチの有効性について確定的な証拠はまだありません。私たちは探索の初期段階にあり、この方向性での改善可能性を調査している段階です。しかし、もしこれが実現すれば、法律分野に限らず、様々な専門分野でのAIの応用可能性が大きく広がると考えています。これは、単なる知識の転送ではなく、専門家の思考方法そのものをモデルに組み込むという、全く新しいアプローチとなる可能性を秘めています。
6. 垂直統合AIエージェントの市場機会
6.1 既存の高額人件費市場の変革可能性
Jake Heller: 法律業界に限らず、多くの産業で企業は現在、これらの業務に数百万ドルもの給与を支払っています。私たちの経験から、AIエージェントがこれらの業務の90%でも代替できれば、そこには大きな価値創出の機会があることが分かっています。
現在の市場構造を見ると、チャットGPTだけでデモを作成すると70%程度は機能するように見えますが、実際の業務で100%機能するようにするには深い統合が必要です。ここで興味深いのは、ユースケースによって価格設定の柔軟性が生まれることです。例えば、70%の機能性でも十分という顧客には月額20ドル程度で提供し、100%の完璧な機能性を求める顧客には500ドルや1,000ドルで提供するというような、価値に基づいた価格設定が可能になります。
Gary: これは実際、YコンビネーターのS24バッチでも見られる傾向ですね。垂直特化型AIエージェントを構築する企業が数十社含まれており、それぞれが特定の産業における高額な人件費構造に着目しています。
Jake Heller: そうですね。重要なのは、この変革が単なるコスト削減ではないという点です。例えば、ある作業が1日かかっていたものが90秒で完了するようになれば、それは単なる効率化を超えて、仕事の質的な転換をもたらします。この価値提案は、既存の高額人件費市場において、非常に説得力のあるものとなっています。特に、初期の段階で「これは使えない」と言っていた顧客が、実際の価値を目の当たりにして考えを変えていく過程は、市場の大きな可能性を示唆しています。
6.2 業務の質的転換の展望
Jake Heller: 私たちは、AI技術がもたらす変革は単なる仕事の自動化や効率化を超えた、より本質的な変化をもたらすと考えています。実際の経験から、これらの技術は職務内容そのものを進化させる可能性があることが分かってきました。例えば、1日かかっていた作業が90秒で完了するようになると、それは単なる時間短縮ではなく、法律家が時間を使う方法自体を根本的に変えることになります。
Gary: それは興味深い観点ですね。つまり、仕事がなくなるのではなく、より興味深いものになっていくということですか?
Jake Heller: その通りです。これまでの経験から、AIの導入によって仕事が消えるのではなく、むしろ法律家が本来取り組むべき、より戦略的で知的な判断に時間を費やせるようになることが分かってきました。定型的な文書のレビューや基本的な法的調査から解放されることで、より複雑な法的分析や戦略的な意思決定に集中できるようになります。
最も重要なのは、この変化が法律家の専門性を否定するものではなく、むしろ強化するものだということです。例えば、基本的な法的リサーチにかかる時間が大幅に短縮されることで、その結果の分析や、より深い法的推論に時間を使えるようになります。これは法律実務の質的な向上につながり、最終的にはクライアントへのサービスの向上にもつながっていくと考えています。
Gary: この質的転換の視点は、AI技術の導入に対する不安や抵抗を軽減する上でも重要そうですね。
6.3 新たな市場開拓への示唆
Jake Heller: 私たちの法律分野での経験は、他の産業における垂直統合AIエージェントの可能性を示唆しています。YコンビネーターのS24バッチを見ると、様々な産業で垂直特化型AIエージェントを構築する企業が数十社存在しており、これは私たちが法律分野で実証してきた価値が、他の分野でも再現できる可能性を示しています。
この移行のポイントは、既存の業界慣行や顧客の期待値を深く理解し、それに応える形でAIを統合していくことです。法律分野での私たちの経験から、重要なのは単なる効率化ではなく、業務の質的転換をもたらすような価値提案であることが分かっています。特に、既存の高額人件費市場では、70%の機能性でも価値がある場合と、100%の完璧さが要求される場合があり、これに応じた柔軟な価格設定と市場アプローチが可能です。
Gary: まさにCase Textは、垂直統合AIエージェントの成功モデルとして、多くのスタートアップの参考になりそうですね。
Jake Heller: はい。私たちが学んだ重要な教訓は、業界特有の要件に対する深い理解と、それに応える技術統合の重要性です。また、市場開拓において重要なのは、初期ユーザーの体験を完璧なものにすることです。私たちの場合、法律家という保守的なユーザーでさえ、実際の価値を目の当たりにすることで、急速に受け入れが進みました。このような経験は、他の産業でも同様のアプローチが有効である可能性を示唆しています。結果として、私たちは2ヶ月という短期間でThomson Reutersによる6億5000万ドルでの買収に至りましたが、これは垂直統合AIエージェントの市場価値の大きさを示す一例と言えるでしょう。