※本記事は、OpenAIが開催したDevDay 2025のOpening Keynoteの内容を基に作成されています。基調講演はSam Altman氏(OpenAI CEO)によって行われ、Apps SDK、AgentKit、Codexの正式版など、AI開発の未来を形作る主要な発表が含まれています。
動画の詳細情報は https://www.youtube.com/watch?v=hS1YqcewH0c でご覧いただけます。本記事では、基調講演の内容を詳細に記録しております。なお、本記事の内容は原著作者の見解を正確に反映するよう努めていますが、文字起こしからの要約や解釈による誤りがある可能性もありますので、正確な情報や文脈については、オリジナルの動画をご視聴いただくことをお勧めいたします。また、OpenAI(@OpenAI)および関連する公式情報もご参照ください。
1. イントロダクションと成長の軌跡
1.1 OpenAIの成長指標
Sam Altman: おはようございます。DevDayへようこそ。サンフランシスコ、OpenAIが創業し、AIの未来を構築することにコミットしているこの街で、皆さんをお迎えできることを嬉しく思います。私たちの最初のDevDayから、もう約2年が経ちました。この2年間で、私たちは、そして何より皆さんは、長い道のりを歩んできました。
2023年に遡ると、当時は200万人の開発者と1億人の週間ChatGPTユーザーがいました。そしてAPIでは毎分約3億トークンを処理していました。当時はこれが非常に多いように感じられました。しかし今日、400万人の開発者がOpenAIで構築を行っています。そして8億人以上が毎週ChatGPTを使用しています。APIでは毎分60億トークン以上を処理しています。
AIは人々が遊ぶものから、人々が毎日構築するものへと変化しました。この数字が示しているのは、単なる量的な成長だけではありません。AIとの関わり方そのものが根本的に変わったということです。
1.2 開発者コミュニティへの感謝
Sam Altman: さて、すべての発表に入る前に、何か楽しいことをしたいと思います。私の後ろのスクリーンには、今日この会場にいる開発者の名前が表示されています。彼らは私たちのプラットフォーム上で、信じられないようなマイルストーンを達成したアプリを構築してきました。100億トークン、1,000億トークン、そして1兆トークンもの処理を行ったアプリです。彼らに盛大な拍手を送りましょう。
OpenAIの全員を代表して、感謝を申し上げます。未来を前進させているのは、あなたたちなのです。この光景を見ることで、私は次に何が来るのかについて、非常に楽観的になります。
これまでどれだけ進んできたかを祝うことは確かに興奮することですが、私たちはまだこの旅の非常に初期段階にいます。そして今日、私たちは皆さんにとって最も重要なことに焦点を当てます。それは、私たちがどのようにAIでの構築をより簡単にしているかということです。
私たちは開発者の声に耳を傾けてきました。皆さんがどこで行き詰まっているのか、そして次にどこで構築したいと考えているのかを聞いてきました。今日は皆さんに4つのことをお届けします。まず、ChatGPT内でアプリを構築することをどのように可能にしているか、そして多くの配信をどのように支援できるかをお見せします。次に、エージェントの構築がどれほど速く、より良くなるかをお見せします。そして、ソフトウェアを書くことをどのように簡単にしているか、コーディングの反復的な部分を引き受けることで、皆さんがシステムと創造性に集中できるようにする方法をご覧いただきます。そしてこれらすべての基盤として、皆さんが構築しているものすべてをサポートするためのモデルとAPIのアップデートをお伝えします。
これは歴史上、ビルダーにとって最高の時代です。アイデアから製品へと移行するスピードは、かつてないほど速くなっています。皆さんはその加速を肌で感じることができるはずです。
2. ChatGPT内でのアプリ構築
2.1 Apps SDKの発表
Sam Altman: それでは、ChatGPT内でのアプリについて見ていきましょう。私たちはChatGPTを、人々が進歩を遂げるのを助けるために構築しています。より生産的に、より創造的に、そしてより速く学習できるようにするためです。
人々がChatGPTを使用している創造的な方法には、私たちは継続的に驚かされています。そして最初のDevDay以来、私たちはChatGPTを開発者に開放する取り組みを続けてきました。GPTsのような機能を立ち上げ、MCPのような標準を採用し、開発者がChatGPTを幅広いアプリケーションに接続できるようにしてきました。いくつかは機能しました。いくつかは機能しませんでした。しかし、私たちは多くのことを学びました。
そして今日、私たちはChatGPT内でアプリを構築できるように、開発者にChatGPTを開放します。これにより、インタラクティブで、適応的で、パーソナライズされた、チャットで対話できる新世代のアプリが可能になります。
これらを構築するために、私たちは新しいApps SDKを立ち上げます。プレビュー版として今日から利用可能です。Apps SDKを使用すると、フルスタックが手に入ります。データを接続し、アクションをトリガーし、完全にインタラクティブなUIをレンダリングできます。そしてさらに多くのことが可能です。
Apps SDKはMCP上に構築されています。バックエンドロジックとフロントエンドUIを完全にコントロールできます。私たちは標準を公開しているので、誰でもApps SDKを統合できます。Apps SDKで構築すると、あなたのアプリは数億人のChatGPTユーザーにリーチできます。これは、開発者が製品を急速にスケールする方法として、大きな意味を持つことになるでしょう。
ありがとうございます。どういたしまして。ユーザーがすでにあなたの既存製品にサブスクライブしている場合、会話から直接ログインできます。将来的には、収益化のための複数の方法をサポートします。これには、ChatGPT内で即座にチェックアウトを提供する新しいAgentic Commerce Protocolも含まれます。いくつかの例を見てみましょう。
2.2 アプリの発見可能性と配信
Sam Altman: ChatGPTを使用しているとき、ユーザーは名前で呼び出すことでアプリを見つけることができます。例えば、製品フローのスケッチをChatGPTにアップロードして、「Figma、このスケッチを実用的な図に変換して」と言うことができます。すると、FigmaアプリがそのリクエストとFigJamの起動を提案し、アクションを完了します。さらに反復したい場合は、ChatGPTからFigJamを直接起動できます。
私たちはまた、会話の中でアプリを発見可能にしています。ユーザーが何かを求めたとき、関連するアプリを提案として表示できます。例えば、ユーザーが週末のパーティー用のプレイリストが必要だと言ったとき、ChatGPTはSpotifyでの構築を推奨できます。これは、適切なタイミングで適切なアプリを見つける簡単な方法です。そして開発者には、発見されるための全く新しい方法を提供します。
2.3 収益化の仕組み
Sam Altman: 収益化について説明します。ユーザーがすでにあなたの既存製品にサブスクライブしている場合、会話から直接ログインできます。将来的には、収益化のための複数の方法をサポートする予定です。これには、ChatGPT内で即座にチェックアウトを提供する新しいAgentic Commerce Protocolも含まれています。
さらに、年内には開発者がアプリをレビューと公開のために提出できるようになります。ユーザーがブラウズできるディレクトリもリリースします。会話内での発見に加えて、このディレクトリも提供されます。
開発者ガイドラインで提供されている基準を満たすアプリはすべて、リストに掲載される資格があります。デザインと機能性においてより高い基準を満たすアプリは、より目立つように取り上げられます。これには、ディレクトリでの掲載や、今日お見せしたように、会話内での提案アプリとしての表示が含まれます。
私たちは、プレビュー版のApps SDKと共に、開発者ガイドラインのドラフトを今日公開しました。これにより、皆さんは何を期待すべきかを知ることができます。そして、アプリの収益化についても、近日中にさらに詳しく共有します。皆さんが何を望んでいるかについてのフィードバックをお待ちしています。
これは、開発者とChatGPTユーザーにとって、エキサイティングな新しい章になるでしょう。
2.4 ライブデモ:Coursera、Canva、Zillowアプリ
Sam Altman: それでは、いくつかの例を見てみましょう。ステージにAlexiを招待して、ライブデモをお見せしたいと思います。
Alexi: 私はAlexiです。ChatGPTのソフトウェアエンジニアで、これを構築するのを手伝いました。ユーザーが直接対話できる最初のアプリのいくつかを紹介できることに興奮しています。これらのアプリの魔法は、リッチでインタラクティブなビジュアルとChatGPTのパワーを組み合わせることです。
Courseraから始めましょう。UXデザインについて学びたいとしましょう。ChatGPTでCourseraアプリに、これについて学ぶのを手伝ってもらうよう頼むことができます。「Coursera、機械学習について何か教えて」と入力します。これがChatGPTでCourseraを使う初めての時なので、接続に同意する必要があります。次回使用するときは、すぐに始めることができます。
ChatGPTに直接Courseraアプリを求めましたが、ChatGPTは会話に関連する場合、アプリを提案することもできます。ChatGPT内のアプリは会話とインラインで表示され、ここに表示されているビデオのように、ウェブ上でレンダリングできるものなら何でもサポートできます。Apps SDKはピクチャーインピクチャーや、フルスクリーンのビデオレイアウトへの拡張もサポートしています。
コースが表示されたので、ビデオを再生してみましょう。ビデオを再生すると、すぐに画面の上部にピン留めされます。これは本当に便利です。なぜなら、ビデオを見ながら会話にアクセスできるからです。ビデオで言及されていることについて、もう少し深く知りたいとしましょう。ChatGPTに「彼らが今話していることについてもっと説明してもらえますか」と尋ねることができます。
Apps SDKは、アプリからChatGPTにコンテキストを公開するAPIを提供します。これにより、モデルは常にユーザーが何と対話しているかを正確に把握できます。私たちはこれを「Talking to Apps(アプリとの対話)」と呼んでおり、これがここでの魔法の一部です。ChatGPTでの学習、私たちのトップユースケースの1つが、どのように良くなり続けているかについて、私は非常に興奮しています。
AppsとApps SDKを使えば、世界中のユーザーのために、よりリッチな教育体験を解き放つことができます。これは、データ準備について、機械学習モデルをトレーニングする前のステップについて話している構造を説明しています。私が説明する必要はありません。ChatGPTはそれをすぐに理解します。Courseraアプリを接続して、ChatGPTの会話内でテキストを通じてビデオと直接対話できるようになります。かなりクールです。
ユーザーはChatGPTで創造的になることも大好きです。ここに、弟の犬の散歩ビジネスを手伝うためのアイデアをブレインストーミングしてきた会話があります。何度かやり取りをしてきました。いくつかについてはかなり満足していますが、この名前を使ってみましょう。「Canva、この名前でポートフォリオを作って。カラフルで、気まぐれで、明るくしたい。そして、サンセリフフォントを優先したタイピングコースをCourseraに依頼して」と入力します。
Canvaはこのようなアセットの作成が得意で、今はChatGPTから直接開始できます。OpenAIのマーケティングアセットを作成する場合でも、DevDayのための楽しいデモを作成する場合でも、Canvaは作業中の会話の中であなたと一緒にいます。Apps SDKはMCP、私たちがOpenAIで構築するのが大好きなオープンスタンダード上に構築されています。
既存のMCPがある場合、Apps SDKで拡張するのは本当に迅速です。HTMLテンプレートを返すリソースを追加するだけで、アプリはウェブやモバイルなど、ChatGPTが配信されているすべての場所で動作できるようになります。ご覧の通り、これはライブデモなので、少しレイテンシーを経験しています。ビデオと同じようにインラインで表示され、ChatGPTが何をしたかを説明しています。
Apps SDKの別のモダリティ、フルスクリーンを探索できます。特定のポスターを開いて、より詳細に見ることができます。そして、画像生成体験と同じように、ChatGPTでフォローアップして変更をリクエストすることもできます。しかし、私たちはサンフランシスコにいて、DevDayなので、Canvaにこれらをピッチデックに変換するよう依頼しましょう。「Canva、このポスターをピッチデックにして。犬の散歩のためにシードラウンドを調達しようとしています」と入力します。
これを送信すると、Canvaがスライドデッキを作成します。それが読み込まれている間に、もう1つのデモを見せるために進みます。犬の散歩ビジネスが本当にうまくいっていて、別の都市に拡大したいとしましょう。ChatGPTに、どこに拡大すべきか尋ねることができます。ChatGPTは私たちが何について話してきたかを知っています。
非常に熱心にピッツバーグと言います。Zillowを呼び出して、「そこで販売中の住宅を見せて」と言うことができます。今、Zillowと対話して最新のデータを取得し、ChatGPT内に埋め込まれたインタラクティブマップを取得しています。マップが表示されます。読み込み中です。さあ、ここに住宅のバックアップがあります。
スライドデッキも完成したようなので、すぐにそちらに戻ります。このマップはインラインビューでは少し見にくいので、住宅をクリックしてフルスクリーンで開くことができます。ChatGPT内にZillowの体験のほとんどが埋め込まれており、ツアーをリクエストしたり、Zillowから期待されるアクションを実行したりできます。多くのオプションがあり、解析が難しいので、ChatGPTに「庭のある3ベッドルームの住宅だけにフィルタリングして」と依頼します。
アプリがフルスクリーンになっているため、新しいインスタンスを作成する必要なく、提供されているデータを更新します。ChatGPTが戻ってきて、メッセージがオーバーレイされているのが見えます。Zillowアプリ上で会話を表示し、全高で開くことができます。素晴らしい。ズームインして、興味があるかもしれない特定の住宅を見つけましょう。
さて、ZillowアプリはChatGPTにコンテキストを公開しているため、私が何を見ているかを知っており、「これは犬公園からどれくらい近いですか」など、住宅についてより多くの情報を尋ねることができます。ChatGPTは、Zillowからのコンテキストを、検索などの自由に使える他のツールと組み合わせることができます。住宅についてより多くの情報を提供できます。ここから他のツールを呼び出して手頃さを調べることができますが、毎回最良の回答を提供します。
これは、Apps SDKでの体験がいかにダイナミックであるかの素晴らしい例です。インラインマップから始まり、アプリとの対話とChatGPTへの質問、またはZillow体験の使用を行ったり来たりできました。それでは、スライドデッキをチェックしてみましょう。
この会話に切り替えると、Canvaがここでいくつかのオプションを提供してくれたのが見えます。この青い色が気に入ったので、それを開くと、フルスクリーンでスライドが表示され、Canvaが生成してくれたすべての美しいスライドを見ることができます。準備ができたら、ポスターと同じように、フォローアップの編集を依頼でき、準備ができたらCanvasで開いてシードラウンドをクローズできます。
お気に入りの製品とのアプリの魔法が、本当に新しい体験をもたらします。皆さんと一緒にこれを構築し続けることに非常に興奮しています。皆さんがこれで何をするのか、待ちきれません。
Sam Altman: Alexiありがとう。大勢の人の前でタイピングと話すのを同時にやるのは難しいですよね。
私たちは、デモで見たアプリと、これらのローンチパートナーからのさらにいくつかのアプリを、皆さんに試していただけることを楽しみにしています。これらは今日からChatGPTで利用可能になります。そして、私たちはまだ始まったばかりです。今後数週間で、パートナーからさらに多くのアプリを展開していきます。
開発者の皆さんにとって、Apps SDKは今日から構築を始められるプレビュー版として利用可能です。私たちの目標は、これを早期に皆さんの手に渡し、フィードバックを聞き、皆さんと一緒に構築することです。年内には、開発者がレビューと公開のためにアプリを提出できるようになります。また、ユーザーがブラウズできるディレクトリもリリースします。会話内での発見に加えてです。
開発者ガイドラインで提供されている基準を満たすアプリはすべて、リストに掲載される資格があります。デザインと機能性においてより高い基準を満たすアプリは、ディレクトリを含め、より目立つように取り上げられます。そして、お見せしたように、会話内での提案アプリとしても表示されます。私たちは今日、プレビュー版のApps SDKと共に、開発者ガイドラインのドラフトを公開しましたので、何を期待すべきかがわかります。そして、アプリの収益化についても、近日中にさらに詳しく共有します。皆さんが何を望んでいるかについてのフィードバックをお待ちしています。
これは、開発者とChatGPTユーザーにとって、エキサイティングな新しい章になるでしょう。それがアプリでした。皆さんがこれを気に入ってくれることを願っています。
3. AgentKitの発表
3.1 エージェント構築の課題
Sam Altman: さて、次に、効果的なエージェントの構築をどれほどシンプルにしているかを見ていきましょう。AIは、あなたが尋ねるシステムから、あなたのために多くのことができるシステムへと移行してきました。
私たちはこれをエージェントを通じて見始めています。エージェントとは、コンテキスト、ツール、そして信頼を持ってタスクを引き受けることができるソフトウェアです。しかし、エージェントに対するすべての興奮にもかかわらず、実際にプロダクションに到達し、大規模に使用されるものは非常に少ないのが現実です。
どこから始めればいいのかわからないのです。どのフレームワークを信頼すればいいのか。そしてそれは多くの作業を伴います。オーケストレーション、評価ループ、ツールの接続、優れたUIの構築。これらの各レイヤーが、アイデアが機能するかどうかさえわからない前に複雑さを追加します。
それでも、膨大なエネルギーがあり、機会は非常に現実的です。私たちは、仕事がどのように行われるかを再構想するためにエージェントを構築している何千ものチームと話してきました。私たちは何ができるのでしょうか。エージェントをより簡単に構築できるようにするために。
そこで今日、私たちは何か新しいものを立ち上げます。アイデアからエージェントへ、はるかに速く移行したいすべてのビルダーのためのものです。AgentKitの導入を発表できることを嬉しく思います。
3.2 AgentKitの構成要素
Sam Altman: AgentKitは、OpenAIプラットフォームで利用可能な完全な構築ブロックのセットです。エージェントをプロトタイプからプロダクションへと移行させるのを支援するために設計されています。エージェントのワークフローを構築、デプロイ、最適化するために必要なすべてを提供します。より速く、そしてはるかに少ない摩擦で実現できます。
個人の開発者から大企業まで、すべての人がこれから大きな価値を得られるでしょう。それでは、機能についてお話しします。
まず、Agent Builderです。これは、ロジックステップを設計し、フローをテストし、アイデアを出荷するための、高速でビジュアルな方法です。これは、既に数十万人の開発者が使用しているResponses APIの上に構築されています。ですから、以前に私たちのプラットフォームを使用したことがある方は、その基盤に馴染みがあるはずです。
2つ目はChatKitです。私たちは、優れたチャット体験を自分のアプリに直接組み込むことを簡単にしています。シンプルで埋め込み可能なチャットインターフェースを手に入れることができ、それを自分のものにすることができます。自分のブランドを持ち込み、ワークフローを構築し、製品をユニークにするものに集中してください。このビデオで、各エージェントノード全体でチャットがどのように機能するか、ツールを呼び出してでも最適な応答を形成する様子をご覧いただけます。
そして最後に、Evals for Agentsです。エージェントのパフォーマンスを測定することに特化した新機能を提供しています。トレースグレーディングを取得して、エージェントの意思決定をステップごとに理解できます。データセットを取得して、個々のエージェントノードを評価できます。自動化されたプロンプト最適化も追加しました。そして、OpenAI Evalsプラットフォーム内で外部モデルに対して直接Evalsを実行することもできます。
これは、私たちが最初にエージェントを構築していたときに持っていたらよかったと思うすべてのものです。そしてもちろん、エージェントはデータへのアクセスが必要です。OpenAIのConnector Registryを使用すると、管理制御パネルを通じて、エージェントを内部ツールやサードパーティシステムに安全に接続できます。すべてを安全に、あなたのコントロール下に保ちながら実現できます。
3.3 実例:AlbertsonsとHubSpot
Sam Altman: いくつかの例を見てみましょう。Albertsonsは、全米で2,000以上の食料品店を運営しており、毎週3,700万人以上がそこで買い物をしています。各店舗は、それ自体が小さな経済のようなものです。マネージャーは常に意思決定を行わなければなりません。プロモーション、製品ミックス、ディスプレイ、ベンダー。これは大変な仕事です。
そこでAlbertsonsは、AgentKitを使用してエージェントを構築しました。アイスクリームの売上が予期せず32%減少している状況を想像してみてください。以前であれば、これは長いプロセスを開始していたでしょう。レポート作成、スプレッドシート、会議です。
今では、担当者は単にエージェントに何が起こっているのか尋ねるだけです。エージェントは完全なコンテキストを見ます。季節性、過去のトレンド、外部要因です。そして推奨事項を提供します。おそらく、ディスプレイを調整する時期か、地元の広告を実施する時期です。
別のエージェントを見てみましょう。HubSpotは、世界中の数十万の組織で使用されている顧客プラットフォームです。彼らはAgentKitを使用して、HubSpotのAIツールであるBreezeの応答を、カスタムレスポンスウィジェットを使って改善しました。
この例では、HubSpotの顧客であるLuma Plantsが、アリゾナで植物が育たない理由についての質問を受けます。Breezeアシスタントを使用して、自社の知識ベースを検索し、その州の低湿度に対する地域の処理方法を調べ、ポリシーの詳細を取り込み、すべてをまとめます。そして、推奨事項を含む複数のソリューションを提供します。
これは、異なるソースにわたるインテリジェンスが協働して、スマートで有用な回答を提供している様子です。これは、AgentKitで構築できる種類のものの素晴らしい例です。
私たちには、AgentKitを使用してすでにエージェントをスケールさせている素晴らしいローンチパートナーが多数います。そして、今日から誰でも利用可能です。それでは、どのように機能するかのデモを見てみましょう。Christinaに引き継ぎます。
3.4 ライブデモ:8分間でエージェント構築
Christina: Samありがとう。皆さんこんにちは、私はChristinaです。AgentKitを構築しているチームで働いています。今日は、AgentKitが開発者がこれまで以上に速くエージェントを作成するのをどのように支援するかをお見せしたいと思います。
皆さんはすでに私たちのDevDayウェブサイトをご覧になっているかもしれません。皆さん全員がアクセスできるサイトで、今日のスケジュールに関するすべてが表示されています。しかし今は、ただの静的なページです。これが実際に一日をナビゲートし、最も関連性の高いセッションを指し示すのを手伝ってくれたらどうでしょう。私たちはOpenAIです。DevDayサイトにAIが必要です。
そこで、私たちが一緒に構築するのは、AgentKitを搭載し、このサイト内に直接デプロイされたエージェントです。これを面白くするために、8分間という時間を自分に与えて、ここで皆さんの目の前でエージェントを構築して出荷します。
エージェントを構築するのがどれだけ難しいか聞いたばかりなので、これはチャレンジになります。そして、正直でいるために時計を起動します。時計が動いています。OpenAIプラットフォームのワークフロービルダーから始めています。コードから始めるのではなく、ノードを視覚的に配線できます。
Agent Builderは、エージェントを構築することから学んだ一般的なパターンを使用して、複雑なワークフローを簡単でビジュアルな方法でモデル化するのに役立ちます。ここの左側には、一般的な構築ブロックがすでに抽出されています。たとえば、ツール、ヒューマンインザループ、ガードレール、論理ノードです。
3.5 Agent Builderによる視覚的ワークフロー設計
Christina: 私は、専門的なセッションエージェントと、より一般的なDevDay情報エージェントを使用するワークフローを構築する予定です。まず、入ってくるメッセージのタイプを分類するエージェントから始めます。セッション情報について尋ねているのか、それともDevDayについてのより一般的な何かなのかを判断します。その分類子に基づいて動作をルーティングするために、IF/ELSEノードを追加しました。
次に、セッションエージェントを作成します。これをセッションエージェントと呼びます。セッションに関する情報を取得することについてのコンテキストを与えます。そして、さまざまなツールを追加できます。今日はすでにセッションに関する情報を含むドキュメントがあるので、それをドロップします。これをセッションと呼びます。そして、それをアタッチします。これには、私の質問に答えるために必要なすべての情報があります。
スケジュールの表示は、単なるプレーンテキストではなく、楽しくて視覚的に興味深いものにする必要があります。そこで、それらのためのウィジェットも作成します。ウィジェットビルダーに向かいます。ここで、すでにセッションウィジェットを設計しました。この場合はFroge 101クラス用です。ウィジェットをダウンロードして、エージェントに戻り、それを添付するだけです。戻ってボタンをクリックさせてください。
ダウンロードします。さあ、できました。戻って、作成したセッションエージェントの出力形式として添付します。それをドロップして、プレビューしてウィジェットを追加したことを確認します。これで完了です。
もう一度エージェントノードをドラッグして、これをDevDayエージェントと呼びます。それが何をしているかについてのコンテキストを与え、その日のブランドに合わせてFrogeのスタイルで話すようにします。ファイルを追加します。その日に関するすべての情報を含むファイルがあります。これをDevDayと呼びます。それをアタッチします。このエージェントは準備ができました。そして、それをここにアタッチします。
あと数分あるようなので、プリビルトのガードレールの1つで追加のセキュリティを追加しましょう。エージェントを構築する際の最も重要なことの1つは信頼です。ガードレールは、その自信を持つのに役立ちます。ハルシネーションからの保護、モデレーションの追加、PII(個人識別情報)のマスキングを行います。
いくつかのプリビルトガードレールがあります。PIIのために1つをオンにします。動作を簡単に確認できるように名前を含めます。そして、これをワークフローの最初にタップして、FrogeがPIIから保護されるようにします。そして、追加のケースに対応するために追加のエージェントを追加します。Frogeのスタイルで話すようにします。そして、コンテキストを削除します。
このワークフローは準備ができていると思います。エンドユーザーに何が表示されるかを決定するために出力を設定できます。この場合、ファイル検索ソースがより内部的なものであれば、それをオフにできます。そして、Agent Builderからプレビューできると思います。エージェントについてもっと学ぶために、どのセッションに参加すべきか尋ねることができます。
ガードレールをチェックし、追加したばかりのセッションファイルから情報を取得し、追加したウィジェットを使用して適切なセッションを見つけています。そして、11時15分の「Orchestrating Agents at Scale」が私にとって最適なセッションだと判断しています。いくつかのリビット(カエルの鳴き声)も投げ込んでいるのが見えます。
このエージェントは良さそうです。時間を見ています。私たちはちょうど、ツールを使用していくつかの専門的なエージェントを構築し、ガードレールを追加し、いくつかのウィジェットでカスタマイズし、プレビューでワークフローをテストしました。
今、まだ行っていない1つのことは、完全なEvalsのセットです。プラットフォーム内で直接それを行うこともでき、ライブに移行する前に期待通りに動作することを確認できます。しかし今、巨大な時計が私を追いかけていて、DevDayが待っています。
それでは、これを公開しましょう。これを「Ask Froge」と呼び、公開をヒットします。そして、直接実行できるワークフローIDを持つ、完全にデプロイされた公開されたプロダクションのエージェントができました。
3.6 ChatKitとEvals機能
Christina: 右側には、自分の環境とサーバーで実行したい場合のためのコードがあります。しかし、これはかなりの量のコードを書く必要があることがわかります。そこで、私は作成したワークフローIDを使用することにします。そして、サイトに向かいます。
DevDayサイトで、作成したばかりのワークフローを使用してセッションを作成します。それをドロップします。次に、ChatKit Reactコンポーネントをドロップし、セッションキーを渡し、Frogeのアクセントカラーでビジュアルカスタマイゼーションを追加します。これは「Ask Froge」と呼ばれ、プレースホルダーでリビットを続け、Froge固有の色とスタートアッププロンプトを持ちます。
このFrogeチャットを追加し、ページの下部から上がってくるようにします。そして最後に、ウェブサイトの最前面と中央になるように、サイトの上部に「Ask Froge」へのリンクを追加します。サイトに戻りましょう。そこにあります。試してみましょう。「エージェントの構築について学ぶために、どのセッションに参加すべきですか」と入力します。
これは、作成したばかりの同じワークフローを実行しています。ガードレールをチェックし、メッセージを分類し、ファイル検索からツールを取得し、設計したウィジェットを使用して、「Orchestrating Agents at Scale」が私が行くべき適切なセッションであると判断し、Frogeのスタイルでリビットを続けています。やりました!
エージェントは49秒を残して準備ができました。ビジュアルビルダーで直接反復を続け、コード変更を加えることなくサイトに変更をデプロイできます。これには、新しいツールの追加、他のユースケースのための新しいウィジェットとガードレールの追加が含まれます。そして、サイト内で直接アクションを実行するために、クライアントサイドツールに配線することさえできます。
わずか数分で、エージェントワークフローを視覚的に設計し、いくつかのツールとウィジェットを追加し、プレビューし、デプロイしました。そして今、皆さん全員が使用できます。実際に今、皆さんのDevDayサイトでライブになっています!皆さんはそれを見て使用でき、自分に最適なセッションを見つけることができます。皆さんがこれを使用し、AgentKitで構築する新しい体験を見られることを楽しみにしています。
ありがとうございます。Samに戻します。
Sam Altman: ありがとう、Christina!とてもクールです。皆さんがこれで何を構築するか待ちきれません。
4. Codexの正式リリース
4.1 GPT5-Codexモデルの性能
Sam Altman: AIアプリ、エージェントについて見てきましたが、今度は同じくらい重要な何かに移りましょう。ソフトウェアをどのように書くかについてです。
AIで起こっている最もエキサイティングなことの1つは、私たちがソフトウェアの書かれ方を変える新しい時代に入っているということです。アイデアを持つ人は誰でも、自分自身、家族、またはコミュニティのためにアプリを構築できます。いくつかの例をお見せしたいと思います。
日本では、89歳の退職者がChatGPTの助けを借りてコーディングを独学しました。彼は現在、高齢者ユーザー向けに11のiPhoneアプリを構築しています。彼は生涯の知恵を、他の人々がより自立して生活するのを助けるツールに変えています。
スペインでは、Pau GarciaとDomestic Data Streamersのメンバーが、ChatGPT、画像生成、Soraを使用して、人々が記憶と再びつながるのを助けています。
ASUでは、医学生が医師として行う難しい人間的な会話の種類を練習するより良い方法を必要としていました。そこで彼らは、私たちのモデルを使用して仮想患者アプリを構築しました。実際の診察室に入る前に、試行し、失敗し、より良くなることができます。
そしてフランスのヴェルサイユでは、訪問者が今や宮殿を歩きながら、それと話すことができます。彼らは、私たちのリアルタイムAPIを使用して、アートや彫刻とライブディスカッションができる体験を構築しました。歴史が会話になるのです。
人々が構築しているものを見るのは素晴らしいことです。だからこそ、私たちは開発者により多くのツールを提供して、より速く構築できるようにすることに興奮しています。
今年初め、私たちはCodexのリサーチプレビューを立ち上げました。OpenAIのソフトウェアエンジニアリングエージェントで、開発者と一緒に働き、ソフトウェアの作成方法をスピードアップするように構築されています。それ以来、Codexははるかに有能な協力者へと成長しました。
コードを書くあらゆる場所で機能します。IDE、ターミナル、GitHub、そしてクラウドです。ChatGPTアカウントがこれらすべてを接続するので、これらのツール間でシームレスに作業を移動できます。
私たちはCodexに多くの新機能をリリースしました。そして今、新しいGPT5-Codexモデルで動作しています。これは、Codexとエージェントコーディングのために意図的にトレーニングしたGPT5のバージョンです。このモデルは、コードリファクタリングやコードレビューなどのタスクでより優れており、タスクの複雑さに応じて考える時間を動的に調整できます。
開発者は新しいモデルを気に入っています。そしてCodexの使用量は本当に速く増加しています。これに関する私たちの主要な指標の1つは、デイリーメッセージ、つまり開発者が毎日Codexと行うタスクと会話の数です。8月初旬以来、Codex全体でデイリーメッセージは10倍に増加しています。
この急速な使用は、GPT5-Codexを私たちの最も速く成長しているモデルの1つにするのにも役立ちました。リリース以来、400兆トークン以上を提供してきました。
社内では、Codexは私たちが構築するあらゆる場所にあります。今日OpenAIで書かれるほぼすべての新しいコードは、Codexユーザーによるものです。Codexを使用する私たちのエンジニアは、毎週70%多くのプルリクエストを完了しています。そして、ほぼすべてのOpenAI PRがCodexレビューを通過しています。非常にシニアなエンジニアから期待されるよりも深い深度です。
4.2 Codexの利用統計と成果
Sam Altman: Codexの使用量の成長について、もう少し詳しくお話ししましょう。8月初旬以来、Codex全体でデイリーメッセージは10倍に増加しています。これは、開発者が毎日Codexと行うタスクと会話の数を示す、私たちの主要な指標です。
この急速な使用の増加は、GPT5-Codexを私たちの最も速く成長しているモデルの1つにするのにも役立ちました。リリース以来、私たちは400兆トークン以上を提供してきました。これは驚異的な数字です。
社内でも、Codexの影響は明白です。Codexは私たちが構築するあらゆる場所にあります。今日OpenAIで書かれるほぼすべての新しいコードは、Codexユーザーによるものです。これは、私たち自身のエンジニアリングプロセスが、このツールによって根本的に変革されたことを意味します。
Codexを使用する私たちのエンジニアは、毎週70%多くのプルリクエストを完了しています。これは生産性の劇的な向上です。そして、ほぼすべてのOpenAI PRがCodexレビューを通過しています。それも、非常にシニアなエンジニアから期待されるよりも深い深度でレビューされています。Codexは単にコードを書くだけでなく、コードの品質を向上させ、レビュープロセスをより徹底的にしているのです。
4.3 エンタープライズ向け新機能
Sam Altman: 本日より、Codexはリサーチプレビューを終了し、正式にGA(一般提供)となります。ありがとうございます。
Codexはすでに個人の開発者の間で多くの支持を得ていますが、私たちはエンジニアリングチームにとってCodexをさらに役立つものにするための新しい機能セットを導入しています。
まず、Slack統合です。これは非常に多くのリクエストがありました。Slackから直接、チームの会話から、Codexにコードを書くよう依頼したり、質問に答えてもらったりすることができます。
2つ目は、新しいCodex SDKです。これは、チーム独自のワークフローでCodexを拡張し、自動化するのに役立ちます。
3つ目は、新しい管理ツールとレポート機能です。環境制御、モニタリング、分析ダッシュボードなどが含まれます。さらに多くの機能があり、エンタープライズがCodexをより適切に管理できるようになります。
Codexの改善は、今後もさらに多く登場することを期待してください。本当に感動的だったことの1つは、Codexを使用している人々の幅の広さです。週末にサイドプロジェクトを構築している開発者から、高成長のスタートアップ、そして世界的な大企業まで、すべての人が使用しています。
4.4 実例:Ciscoでの導入効果
Sam Altman: Ciscoは、エンジニアリング組織全体にCodexを展開しました。彼らは現在、コードレビューを50%速く完了できるようになり、平均的なプロジェクトのタイムラインを数週間から数日に短縮しました。これは、大規模な組織でCodexがもたらす具体的な影響を示す素晴らしい例です。
4.5 ライブデモ:カメラ制御システムの構築
Sam Altman: それでは、次のデモでは、何か楽しいことをしたいと思います。Codexと私たちのAPIを使用して、周囲にあるものを何でも実用的なソフトウェアに変える方法をお見せしたいと思います。ステージにRomainを歓迎してください。
Romain: Samありがとう。皆さん、おはようございます。昨年、私たちはiPhoneアプリをゼロから構築し、このミニドローンをプログラムしました。ライブでステージ上で、O1を使用してです。私たちの最初の推論モデルでした。私たちが名前をつける前から、ある意味でバイブコーディングをしていました。
それ以来の進歩は信じられないものでした。Codexは今や、あなたのコンテキストを理解し、あなたと一緒に働き、チームのために確実に作業を引き受けるチームメイトです。Codexができるすべてのクールなことをどのように見せるのが最善か考えました。たくさんのアイデアがありました。
しかし、何度も戻ってきた1つのアイデアは、ここで、今、この部屋で、私たち全員が一緒に見て体験できる何かを構築することでした。それが私たちのチャレンジです。
上を見上げると、私たちの上にカメラが取り付けられているのに気づくかもしれません。そこから始められると思いました。以前、私はCodex CLIに、このクイックスケッチを基に、カメラフィードといくつかのコントロールを備えたシンプルなコントロールパネルインターフェースを作成するよう依頼しました。それから、Figmaブランディングを追加して、デザインに完全に一致するようにレンダリングしました。それが私たちの出発点です。その上で何ができるか見てみましょう。
それでは、ターミナルに切り替えます。GPT5-Codexを搭載し、ChatGPTアカウントにログインしているCodex CLIが見えます。おそらくコーディングエージェントに尋ねたことがないようなことから始めましょう。「Sony FR7カメラを制御するためのプランを迅速に立てられますか?」
正直なところ、どこから始めればいいのかわかりませんでした。カメラ用のC++ SDKがあることは確認しただけで、CodexがおそらくそれをJavaScriptに変換しようとするだろうと思いました。GPT5-Codexがこのような質問にどれほど速く応答できるかがわかります。
さて、時間を節約するために、CodexにVISCAプロトコルを実装し、コントロールパネルに配線するよう依頼しました。ちなみに、Codexはデモがますます難しくなっています。なぜなら、タスクに対して本当に疲れ知らずに取り組むことができるからです。大規模なリファクタリングで7時間以上連続して作業しているのを見たことがあります。そして、それを正しく実行します。
切り替えると、これが最終結果でした。その1つのタスクで13分以上作業し、私が望んでいたことすべてを実行しました。Codex統合もあるVS Codeにジャンプすると、Codex CLIが考え出したファイルがこれらです。Codexはノードサーバーを構築しました。
このプロトコル、30年以上前のものを学ぶのにかかったであろう時間を想像してみてください。Codexは、このカメラ用のいくつかの非常に特定のヘッダーを送信する必要があることを理解しました。それで、このUI componentが配線されているので、試してみましょう。
ここでカメラをオンにすると、そしてコントロールを試してみましょう。今、このインターフェースからカメラを制御できます。クールです。何かもっと良いことができると思います。IDE拡張機能内でライブで別のタスクを送信してみます。「ワイヤレスコントローラーを配線してカメラを制御して」と入力します。これを今送信します。
舞台裏で以前、このXboxコントローラーを見つけて、試してみるのに良いかもしれないと思いました。ご覧のとおり、Codexはプランを立て、今はファイルを探索し、このゲームパッドを配線する方法を理解しています。ここで興味深いのは、IDEでこのコンテキストの概念があることです。
プロンプトは短くできます。なぜなら、Codexはあなたの意図を理解し、最近使用したファイルを見て、それに応じて調整するからです。ご覧のとおり、タスク2はさらに1分かかるので、バックグラウンドで実行させておきます。他に何ができるでしょうか?
1つのエキサイティングなインターフェースは音声だと思いました。そこで、時間を節約するために、私はCodexに、リアルタイムAPIとエージェントSDKとの統合を依頼し、画面下部のこのドットのアプリに配線しました。素晴らしいのは、アプリに自然な音声から音声への対話をもたらすだけでなく、その会話のコンテキスト内で任意のサーバーに接続できることです。
それで、他に何を見せて、MCPサーバーに変えることができるか考えました。照明システムがあると思いました。ここで私のプロンプトが見えます。このモデルの照明システム用にこのMCPサーバーを配線するようCodexに依頼しました。参照ドキュメントと、UIが機能するために必要な正確なインターフェースを与えます。
それがCodexのエージェント的な動作の魔法です。チームメイトにこれを依頼することはできませんでしたが、タスクが非常に具体的だったので、Codexは私のチームメイトです。プロセスをどのように進めたかを見ると、ある時点で、前に進むためにCommand 8に関する新しい情報を見つける必要があると理解し、GitHubドキュメントを取得しに行き、途中でコードツールを本当に操作しました。それがGPT5-Codexの魔法です。
その後、もう1ターン行って、実行方法を理解できるように情報を含めるようCodexに依頼しました。そして、そこに私のMCPサーバーがあります。VS Codeに戻ると、興味深いことに、Xboxタスクは、すぐにそれを見ます。そしてここに戻ると、ここにすべてのローコードとクラウドタスクがVS Code拡張機能内にあることがわかります。
「Build MCP Server」をクリックすると、これはCodex Cloudで見せたばかりのタスクです。ここで、テストしたい場合は、すべての変更をローカルに適用できます。「Apply」をクリックすると、このMCPサーバーとのすべての変更が今ローカルにあります。すべての依存関係のインストールを開始しました。これを試してみましょう。
しかし、まず、ここのアプリに戻ると、このXboxコントローラーでこのカメラを制御できるか見てみましょう。機能します!かなり素晴らしいです。面白いのは、どのボタンが何をすべきかをCodexに指定できましたが、ジョイスティックが良いアイデアだと理解したことです。
それでは、今、本当のテストをしてみましょう。音声モードに入って、何が起こるか見てみます。Codexがこれを理解して、ライトを制御できるかどうか見てみます。
Romain: こんにちは。
AI音声: こんにちは。はっきりと聞こえています。何が必要か教えてください。
Romain: カメラには何が見えますか?
AI音声: あなたの前に大勢の観客が見えます。出席者が座って準備ができている列があります。部屋は明るく照らされており、群衆が空間を埋めています。
Romain: 観客に向けてライトを当ててもらえますか?
AI音声: 今、観客を明るいライトで照らしました。完璧にハイライトされています。
Romain: 今、ここの部屋にいる全員に挨拶してもらえますか?
AI音声: もちろんです。観客のライトがついています。この素晴らしい群衆を歓迎しましょう。こんにちは、Fort Masonの素晴らしい開発者の皆さん。信じられないほどの一日のために、皆さんをここにお迎えできて興奮しています。
Romain: 素晴らしい。ライトで何か楽しいことをして、ライブストリームで視聴している人々に挨拶してもらえますか?
AI音声: 楽しいライトを動かしています。ダイナミックでカラフルなエフェクトが動いています。そして、ライブストリームを見ている皆さん、参加してくれてありがとうございます。これは素晴らしい体験になるでしょう。
Romain: クールです。それでは、通常に戻しましょう。素晴らしい。
これを実現するためにコードを一行も書いていません。しかし、あと1つお見せしたいことがあります。最後に、Samが言及したように、Codex SDKを立ち上げています。ソフトウェアエンジニアリングの未来かもしれないものを垣間見て終わりたいと思います。
4.6 Codex SDKによるリアルタイムプログラミング
Romain: 音声モードに戻りましょう。
Romain: Codexに、映画の終わりのようなクレジットオーバーレイを表示するよう依頼してもらえますか。ただし、キャストは出席者です。
AI音声: 今、Codexでそれを実行しています。準備ができたらお知らせします。
Romain: 素晴らしい。その間に、カウントダウンを開始して、私たち全員の写真を撮ってもらえますか?
さあ、できました!
音声エージェントにタスクを送信したとき、Codex SDKもツールとして追加されました。これが意味するのは、今やオンザフライで、リアルタイムでこのアプリを再プログラミングし、ユーザーのニーズや彼らが持っているフィードバックに適応させることができるということです。この場合、クレジットオーバーレイを作成するよう依頼したとき、このReact内にコードを入力し、完了するために必要なものを見つけました。そして、クレジットが流れています。
私たちは音声を取り、スケッチを取り、周囲のデバイスを取り、これらすべてを実用的なソフトウェアに変えました。これらすべてが、手でコードを一行も書くことなく実現しました。
Codexに最も野心的なアイデアを、最も複雑なコーディングの問題を与えてください。何が起こるか見てください。私たちが毎日そうであるように、皆さんも驚かれると思います。限界はあなたの想像力だけです。
ありがとうございます!Samに戻します。
Sam Altman: ありがとう、Romain。これはソフトウェアの作成方法における最大の変化です。これまで見てきた中で最大の変化です。
5. モデルとAPIのアップデート
5.1 GPT5とGPT5 Proの性能
Sam Altman: 今日は多くのことをカバーしてきましたが、明らかにモデルも非常に重要です。そこで、いくつかのモデルアップデートを共有したいと思います。
8月に、私たちはGPT5を立ち上げました。エージェントの操縦とエンドツーエンドのコーディングに本当に優れているようにトレーニングしました。そして、GPT5は成果を上げています。Cursor、Windsurf、Vercelのような主要なコーディングスタートアップが、GPT5を使用して、自分たちのアプリでソフトウェアがどのように書かれ、出荷されるかを変えています。
最近、私たちはGPT5 Proをリリースしました。これは、私たちがこれまでに出荷した中で最も知的なモデルです。今日、私たちはGPT5 ProをAPIで立ち上げています。すべての開発者が利用可能になりました。楽しんでいただけることを願っています。
GPT5 Proは、ファイナンス、法律、ヘルスケアのような領域で、本当に難しいタスクで開発者を支援するのに最適です。高い精度と深い推論が必要な場合に適しています。
5.2 GPT-Realtime-Miniの発表
Sam Altman: 私たちはまた、GPT-Realtime-Miniという、より小さな音声モデルをAPIでリリースしています。これは、2ヶ月前に出荷したAdvanced Voice Modelの、より小さく、より安価なバージョンです。同じ音声品質と表現力を持ちながら、70%安価です。
個人的に、私は音声がAIと人々が対話する主要な方法の1つになると考えています。そして、GPT-Realtimeは、その現実に向けた大きな飛躍です。
5.3 音声インタラクションの重要性
Sam Altman: 音声について、もう少し詳しくお話ししたいと思います。個人的に、私は音声がAIと人々が対話する主要な方法の1つになると考えています。これは単なる付加的な機能ではなく、根本的なインタラクションの変化です。
GPT-Realtimeは、その現実に向けた大きな飛躍です。Romainのデモで見たように、音声インタラクションは、カメラの制御、照明システムの操作、さらにはリアルタイムでのコーディングまで、自然でシームレスな方法を提供します。これは、テキストベースのインターフェースだけでは実現できなかった体験です。
GPT-Realtime-Miniを70%安価にすることで、開発者がこの強力なインタラクション方法をより広く利用できるようにしています。これにより、より多くのアプリケーションで音声機能を統合できるようになり、AIとの対話方法がさらに自然で直感的になるでしょう。
6. Sora 2 APIプレビュー
6.1 制御可能性の向上
Sam Altman: では、ギアを切り替えて、クリエイター向けの新機能についてお話ししたいと思います。これは非常に要望が多かったものです。
映画制作者、デザイナー、ゲーム開発者、教育者がクリエイティブプロセスの一部としてAIを使用している、信じられないほどの作品を私たちは目にしています。今日、私たちはSora 2のプレビューをAPIでリリースしています。
皆さんは今、Sora 2の見事なビデオ出力を支える同じモデルに、自分のアプリ内で直接アクセスできます。このモデルで私たちが行った最大の飛躍の1つは、制御可能性です。詳細な指示を与えることができ、モデルはスタイル化され、正確で、構成された結果を提供しながら、状態を保持します。
例えば、iPhoneビューを取り、Soraにプロンプトを与えて、それを広がりのある映画的なワイドショットに拡張することができます。モデルは元の意図を理解し、それを維持しながら、視点とスケールを劇的に変換できます。これは、クリエイターが単一のショットから複数のバリエーションやアングルを生成できることを意味し、制作プロセスにおいて信じられないほどの柔軟性を提供します。
6.2 サウンドと映像の同期
Sam Altman: 私たちが取り組んできた最もエキサイティングなことの1つは、モデルが視覚とサウンドをどれだけうまくペアリングできるかということです。これは単なる音声だけではありません。リッチなサウンドスケープ、環境音、そして見ているものに根ざしていると感じられる同期されたエフェクトです。
このカヤックのビデオでそれを聞くことができます。水の音、パドルの音、環境の音響、これらすべてが視覚と完璧に同期しています。これは単に音を追加しているだけではありません。モデルは、シーンを理解し、適切なサウンドを生成し、それを視覚的に起こっていることと正確に同期させています。
これにより、生成されたビデオははるかに没入的で信じられるものになります。映画制作者、ゲーム開発者、コンテンツクリエイターにとって、これは作品に命を吹き込む全く新しい方法を意味します。音声とビジュアルの両方を一度に考える必要がなく、Soraがその統合を処理してくれます。
6.3 実世界の要素の統合
Sam Altman: Sora 2では、実世界の要素も取り込むことができます。例えば、自分の犬の静止画像を撮って、お気に入りのペットに新しい友達を与えることができます。
「見て、誰が来るよ、相棒。ここにいるよ。さあ!みんな行こう。幸せな犬たちだ!」
このように、実際に存在するものから始めて、それを新しいシナリオやコンテキストに拡張できます。Sora 2は元の被写体の特性を理解し、それを新しく生成された要素とシームレスに統合します。
Sora 2はまた、コンセプト開発にも優れています。バイブや製品を説明するだけで、Soraが視覚的な出発点を提供してくれます。私たちはここで、eコマース広告のコンセプトを生成するためにそれを使用しています。
「場所が空白のキャンバスのように感じられるとき、ブラウズして、カスタマイズして、数分でチェックアウト。あなたのドアに速く配達されます。」
これは、アイデアの初期段階で特に価値があります。詳細な絵コンテやモックアップを作成する前に、コンセプトを素早く視覚化し、反復することができます。
6.4 実例:Mattelでの活用
Sam Altman: 人々は本当にSora 2を気に入っているようです。立ち上げ以来、App Storeのトップを維持しています。今、API内のSora 2プレビューにより、同じ高品質のビデオを製品内で直接生成できます。同期された現実的なサウンドも完備しています。
そして、他のモダリティと同様に、柔軟性を考慮して構築されています。ビデオの長さ、アスペクト比、解像度を制御でき、ビデオを簡単にリミックスできます。
Mattelは素晴らしいパートナーであり、私たちと協力してAPI内のSora 2をテストし、製品アイデアをより迅速に実現しています。デザイナーの1人は、スケッチから始めて、初期のコンセプトを実際に見て共有できるものに変えることができます。
ビデオを見てみましょう。
これは、おもちゃを作る非常にクールな方法です。アイデアがどれほど速く、共有可能で実用的なデザインに変わるかを見るのは信じられないことです。皆さんが自分の製品でSora 2をどのように使用するか、楽しみにしています。
7. クロージング
7.1 発表内容の総括
Sam Altman: 今日の発表が、皆さんに構築すべき新しいもののアイデアをいくつか提供できたことを願っています。私たちは、OpenAIをこの新しい構築の時代のための素晴らしいプラットフォームにしたいと考えています。
物事は、かなり信じられないほどのものに、かなり早くなるでしょう。そして、今日のすべての発表は、それをサポートすることを目的としています。
ChatGPTでネイティブアプリを構築するためのApps SDK。自信を持ってエージェントをデプロイできるようにするAgentKit。あなたとあなたのチームがより速く出荷するのを助ける、より強力なCodex。
そして、API内の新しいモデル、GPT5 Pro、Sora 2、Realtime Miniが、可能なことを大幅に拡張します。
私たちは、重要な何かが起こっているのを見ています。ソフトウェアは、構築するのに数ヶ月や数年かかっていました。今日、皆さんは見ました。今では数分でできます。そして、AIで構築するのに、巨大なチームは必要ありません。大量のインフラストラクチャも必要ありません。必要なのは、良いアイデアだけです。
7.2 AI開発の民主化
Sam Altman: 今日お見せしたことで、AI開発がどれほど民主化されているかを示したいと思います。これは、もはや大企業や専門的な技術チームだけのものではありません。
日本では、89歳の退職者がChatGPTの助けを借りて独学でコーディングを学びました。彼は現在、高齢者ユーザー向けに11のiPhoneアプリを構築しています。彼は生涯の知恵を、他の人々がより自立して生活するのを助けるツールに変えています。これは、年齢や以前の経験に関係なく、誰でもビルダーになれることを示しています。
スペインでは、Pau GarciaとDomestic Data Streamersのメンバーが、ChatGPT、画像生成、Soraを使用して、人々が記憶と再びつながるのを助けています。彼らは技術を使って、深く個人的で感情的な体験を創り出しています。
ASUでは、医学生が、医師として行わなければならない困難な人間的な会話の種類を練習するより良い方法を必要としていました。そこで彼らは、私たちのモデルを使用して仮想患者アプリを構築しました。そこでは、試行し、失敗し、実際の診察室に足を踏み入れる前により良くなることができます。これは教育を変革しています。
そしてフランスのヴェルサイユでは、訪問者が今や宮殿を歩きながら、それと話すことができます。彼らは、私たちのリアルタイムAPIを使用して、アートや彫刻とライブディスカッションができる体験を構築しました。歴史が会話になるのです。
これらの例は、世界中から来ています。異なる背景、異なるユースケース、しかし共通のテーマがあります。良いアイデアを持つ人々が、それを現実にできるということです。巨大なチームも、大量のインフラストラクチャも必要ありません。
7.3 今後の展望
Sam Altman: ここにいてくれてありがとうございます。構築してくれてありがとうございます。あと少しで終わります。
私たちの目標は、AIをすべての人にとって有用なものにすることです。そして、皆さんなしではそれを成し遂げることはできません。皆さんが私たちと一緒に構築してくれていることに感謝しています。
また、今日を可能にしてくれたチームにも大きな感謝を伝えたいと思います。一日を通してさらに多くのことが起こっていますので、セッションを楽しんで、後でお会いしましょう。
本当にありがとうございました。