※本記事は、NVIDIAのCEOであるJensen Huang氏がDell Technologies World(#DellTechWorld)に登壇し、Dell TechnologiesのCEOであるMichael Dell氏と対談した内容を基に作成されています。Jensen Huang氏は、AIファクトリーやアクセラレーテッド・インフラから、インテリジェント・システムの次なる進化に至るまで、コンピューティングのアーキテクチャそのものがリアルタイムで作り変えられている様子について、その未来へのビジョンを語っています。動画は YouTube(https://www.youtube.com/watch?v=PY6TSu3U1Rg )でご覧いただけます。本記事では、対談の内容を要約しております。なお、本記事の内容は登壇者の見解を正確に反映するよう努めていますが、要約や解釈による誤りがある可能性もありますので、正確な情報や文脈については、オリジナルの動画をご視聴いただくことをお勧めいたします。
1. agentic AIの現在地と「useful AI」時代の到来
1.1 Dell Tech Worldでの再会と現状認識
Michael: Jensen、今年もDell Tech Worldに戻ってきてくれて本当に嬉しいです。私はここで毎年Dellを売っているわけですが、私たちはずっとエージェントについて語り合ってきました。今日はぜひ、あなたの視点を聞かせてほしいのです。この「agentic recursive self-improvement(エージェント的な再帰的自己改善)」の世界において、私たちは今どこにいるのか。朝起きるたびに、モデルや能力のどこかで飛躍が起きているように見えますし、それがまったく頭打ちになる気配がない。最前線にいるあなたから見て、今の状況をどう捉えていますか。
Jensen: お招きいただいて、本当に感謝しています。2年前にここに来たとき、私たちはちょうどgenerative AI、生成AIの旅を始めたばかりでした。生成AIはもちろんコンテンツを生成できますが、思い出してほしいのは、それが「思考するためのコンテンツ」、つまり思考そのものを生成できるということです。これがreasoning(推論)へとつながり、planning(計画)へとつながり、そしてagentic systems(エージェント・システム)へとつながっていきました。
1.2 generative AIから思考の生成への発展
Jensen: そして今、私たちは史上初めて「useful AI(役に立つAI)」を手にしました。これこそが、あなたの需要も、私の需要も、文字どおり放物線を描くように爆発的に伸びている理由です。なぜ爆発的なのか。それはエージェント・システムというものが、AIに理解させ、推論させ、思考させ、計画を立てさせ、ツールを使わせ、そのツールの結果を見て、さらに考え、場合によっては改善した計画を練り直す、という動きをするからです。AIは仕事をやり遂げるまで、さまざまなツールを使いながらこれを反復し続けるのです。
Michael: つまり、ただ問い合わせに応答するだけだった頃とは、まったく性質が変わったということですね。
Jensen: そのとおりです。これまでのAIは、目新しく、興味深く、信じられないほどわくわくするものではありましたが、エンタープライズのレベルで見れば、その潜在的な可能性は途方もないのに、実際の利用はごくわずかにとどまっていました。あなた自身も、ここ数年そう語ってこられたはずです。ところが今、それが一気に離陸し始めたのです。私たちはようやく、この「useful AIの時代」に到達しました。それは私たち全員にとって、本当に心躍ることだと思っています。
2. 計算需要の爆発とagent利用の急速な普及
2.1 自律稼働による計算量の爆発的増加
Michael: エージェントが自律的に動き続けるとなると、当然ながら必要な計算量も大きく変わってきますね。
Jensen: ええ、ここが決定的に違うところです。エージェント・システムは、単にクエリに応答するのではなく、長時間にわたって自律的に走り続けます。そのために必要となる計算量は、100倍、1000倍へと膨れ上がりました。取り組む仕事の内容によっては、たとえばソフトウェア・プログラミングのジョブを一つ走らせると、それが1週間終わらない、ということも起こります。もちろん、その1週間でやってのけた仕事というのは、本来チーム全体で1カ月かかったであろう作業なのです。ですから、生産性という意味では大きな前進ですが、同時に計算要件という意味では桁違いの飛躍が起きているわけです。
2.2 agent利用の普及と需要の「積」
Jensen: ここでひとまず、計算そのものが100倍、あるいは1000倍に増えたとしましょう。ところが、それと並行して、AIがあまりにも役に立つものですから、エージェントを使う人の数もあらゆる場所で爆発的に増えています。あらゆる企業が、私たちの会社も、あなたの会社も、いたるところでエージェントを使っている。ソフトウェア開発、DevOps、SRE、CI/CDのすべての作業、QA、テスト、こうしたものをエージェントが支えているのです。今や私たちの会社で、エージェントに支えられて行われているソフトウェアの仕事の量は、信じられないほどです。
Michael: つまり、一人ひとりのエンジニアの働き方そのものが変わっていくということですね。
Jensen: そうです。今日、本当に優秀なエンジニアは一つのエージェントと組んで仕事をしています。しかし、これから先、本当に卓越したエンジニアというのは、大量のエージェントをオーケストレーション(統括)する存在になります。そしてそのエージェントたちが、さらに大量のサブエージェントをオーケストレーションして仕事をこなしていく。こうして、一方では計算量が増え、もう一方では利用する人と用途が増えていく。その二つの積こそが、私たちの需要なのです。
3. エンタープライズへの浸透と「ambition(野心)」の変化
3.1 大企業の本格参入とワークフロー再構想
Jensen: こうして私たちは、ついに「useful AIの時代」に到達しました。これは本当にわくわくすることです。というのも、これまでのAIは目新しく、興味深く、信じがたいほど刺激的ではあったものの、エンタープライズのレベルで見れば、その潜在力は途方もないのに実際の利用はごくわずかだったからです。それが今、一気に離陸し始めました。数年前には、私たちにはエンタープライズの顧客が5,000社もいませんでした。それが今では、世界最大級の企業がここに殺到しているのです。
Michael: 先ほども話に出ましたが、LillyやSamsung、Honeywellといった顔ぶれですね。
Jensen: そのとおりです。彼らが大々的にこの世界へ飛び込んできています。とはいえ、これでもまだ始まったばかりなのです。自分たちのワークフローを再構想(reimagine)し、この技術がどう改善していくのか、その軌跡を理解し、最終的に自分の会社が何になり得るのかを描き直す。そこまで踏み込んでいる企業も確かに存在しますが、その数はごくわずかで、まだ何ら規模を伴っていません。それはまだ「アイデア」の段階にすぎないのです。
3.2 生産性向上とambitionそのものの変化
Michael: あなたも私も、自分の会社でそれを体感していますね。私たちの会社はもともと速く動いてきましたが、今は本当に、加速の度合いがまるで違う。
Jensen: ええ、社内で生み出されるコンテンツの量、進む進歩のスピードを見れば明らかです。AIが私たちをより生産的にする、とよく言われますが、それは疑いようがありません。かつて数カ月かかったことが今は数週間で済み、数週間かかったことが数日になり、数日かかったことが数時間になる。そして1時間かかっていたようなことは、あなたも私も、もうほぼ即座にできて当然だと思うようになっています。
Michael: つまり、変わったのは単なるスピードだけではない、ということですね。
Jensen: そこなのです。本当に変わったのは、私たちのambition(野心)そのものです。私の野心も間違いなく変わりました。かつての私は、何者かになって、何かを成し遂げて、貢献できればいい、と思っていました。でもそれは「old Jensen(昔のJensen)」です。「new Jensen(新しいJensen)」には、もっと大きな野心があります。私たちは皆、自分自身にこう問わなければなりません。「how high is up?(上とはどこまで高いのか)」と。その答えは、かなり高い、ということなのです。
4. agentを動かす新しいコンピュータとアーキテクチャ
4.1 NVLink 72と「頭脳」としての大規模システム
Michael: あなたのところには素晴らしい製品が揃っていて、私たちはあらゆるものにAIを埋め込み、分散した推論とインテリジェンスを実現しようとしています。実は、Michaelと私とで、エージェントを走らせるためのまったく新しいコンピュータのラインを一緒に手がけてきたのですよね。
Jensen: そうです。エージェントというものは、こう考えるとわかりやすいです。まず、large language model(大規模言語モデル)があります。これは途方もなく巨大で、世界がこれまで知る中で最も計算集約的なソフトウェアです。それを動かすのが、向こうにあるシステム、NVLink 72です。これは世界最大のscale-up(スケールアップ)型の単一ドメイン・コンピュータであり、一つの巨大なシステムが、まるごと一台のコンピュータとして動作します。その中に大規模言語モデルが収まっていて、1テラバイトでも10テラバイトでも、パラメータの規模はまったく問題になりません。これが一つの巨大なシステム、いわば「脳」にあたります。
4.2 ハーネス、sandbox、ハイブリッドAI構成
Jensen: ところが、エージェントというのは「harness(ハーネス)」から始まります。このハーネスは、安全に統制されたコンテナの中に置かれなければなりません。私たちはこれをsandbox(サンドボックス)と呼んでいます。NVIDIAがオープンソースで公開したこのサンドボックスは、今や業界のほぼ誰もが使っているセキュリティの仕組みになっています。その内側に、私たちが「Nemo Cloud」と呼ぶリファレンス・ハーネスがあります。
Michael: そのNemo Cloudは、CPU上で動くものですね。
Jensen: そうです。CPUはここにあってもいいし、あちらにあってもいい。そしてそこでは、NeMoTronや、あなたが自社向けに作ったオープンソースのモデルを動かすこともできます。自分の会社の特別なデータやスキルの領域に合わせて訓練した、独自の専用エージェントを、もしお望みならローカルで走らせるのです。そして大規模言語モデルのほうは、クラウドで走らせればいい。こうして、ハイブリッドAIという形が成り立ちます。ハーネスがCPU上で動き、ローカルのAIモデルがこちらのシステムで動き、巨大なモデルはクラウド、あるいは自社のデータセンターにある、あの大きなマシンの上で動く。この三層が組み合わさるのです。
5. アーキテクチャの普遍性とconfidential computing
5.1 全モデルを動かす唯一のアーキテクチャ
Jensen: ここで本当に素晴らしいのは、NVIDIAのアーキテクチャが、世界中であらゆるフロンティアAIモデルを動かせる唯一のアーキテクチャだということです。そしてこの1年ほどの間、ごく最近のことですが、AnthropicがNVIDIAのアーキテクチャに本格的に力を入れてくれるようになりました。ですから今や私たちは、ありとあらゆるフロンティアモデルをサポートし、ありとあらゆるオープンソースモデルをサポートしています。しかも、それをクラウドでも、ローカルでも動かせるのです。
Michael: つまり、このコンピュータは、あらゆるクラウドの上で動きながら、同時に手元のローカルでも動く、と。
Jensen: ご覧のとおり、私たちのコンピュータは、世界で初めてあらゆるクラウドで動き、なおかつローカルでも動くものです。一つのアーキテクチャが、あらゆるクラウドで動き、あらゆるモデルを動かし、ハイブリッドAIを動かし、そしてエージェント・システムを動かす。すべてがその上に成り立っているのです。
5.2 機密計算とデータ主権
Jensen: そしてもし、あなたがどうしても外に出したくない、極めてセンシティブなモデルを抱えているのなら、私たちのシステムはconfidential computing(機密計算)を前提に作られています。
Michael: それはつまり、データセンターを運用している相手を信頼しなくてもよい、ということですね。
Jensen: まさにそのとおりです。これによって、自分の機密データを扱うにあたって、そのデータセンターを運用しているオペレーターを信頼する必要がなくなるのです。秘匿したいデータを、運用者にすら委ねずに守ることができる。だからこそ、これらのアーキテクチャはすべて、あらゆるクラウドで動き、あらゆるモデルを動かし、ハイブリッドAIを動かし、エージェント・システムを動かす、という形に行き着くわけです。
6. Vera CPUとトークン生成時代の経済原理
6.1 CPUコア課金からトークン生成経済への移行
Jensen: そして、ハーネスはCPU上で動くわけですが、そのCPU自身もまたツールを使います。このCPUは私たちが新たに作ったもので、先ほどあなたも触れてくれましたが、「Vera」と呼んでいます。
Michael: これまでのCPUとは、設計思想からして違うのですよね。
Jensen: ええ、まったく違います。過去のCPUは、ハイパースケールのクラウド向けに作られていました。そこではCPUのコアを貸し出すわけですから、できるだけ多くのCPUコアを詰め込むことに最適化されていたのです。ところが、エージェントが主役となるこの新しい世界では、あなたが生み出しているのはトークンです。もはやCPUコアを貸し出しているのではない。トークンを生成し、それを商いにしている。これこそが、このAIの時代の経済そのものなのです。ですからAIは、自分の仕事を走らせ、できる限り速く、できる限り多くのトークンを生成したい。トークンこそが、知能のアウトプットだからです。
6.2 Vera CPUの性能とデータベース処理
Jensen: Vera CPUは、世界中のどのCPUよりも高いシングルスレッド性能を持っています。さらに、世界最速のCPUと比べて3倍のメモリ帯域幅を備えています。その結果として、Starburstや DuckDB といったデータベースが、信じられないほど高速に走るのです。
Michael: エージェントがデータベースに対して、それだけ激しく負荷をかけてくる、ということですね。
Jensen: そのとおりです。エージェントはデータベースを猛烈に叩き続けますから、CPUは何としても超高速でなければなりません。エージェントは自分の仕事をどんどん片づけていきたいので、CPUがとにかく速くないと困るのです。そうでなければ、向こうにあるあの大きなマシンが、エージェントが仕事を終えるのをただ待つことになってしまう。ですから今や、こちらのシステムの上でハーネスが動き、こちらのシステムの上でローカルのAIモデルが動き、そしてクラウド、あるいは自社のデータセンターにあるあの大きなマシンの上で巨大なモデルが動く、という形になっているのです。
7. 人間の創造性の拡張と製品ラインナップ
7.1 unmetered intelligenceと人間の役割
Michael: では実際に見に行きましょう。ただその前に、わくわくすることを少し話させてください。これまで私たち人間は、自分で仕事をして、それを次の人間へと引き継いでいました。でも今や、私たちは大量のエージェントを管理する側になっている。一人の人間が、100体、いや1000体ものエージェントを束ねられるのです。それが人間の創造性に、そして人間にこれから何ができるのかという可能性に、どれほどのものを解き放つか。私はこの「unmetered intelligence(計測されない知能)」という考え方が大好きなのです。その力を自分自身のPCの中に、自分自身のデータセンターの中に持ち、自分自身のデータとともに使える。これは本当にクールなことだと思います。
Jensen: ええ、トークンの不安、いわゆる「token anxiety」に苦しまなくて済むのです。
Michael: そうなのです。従業員に向かって「トークンを使い果たすな」とか、あの恐ろしい請求書のことを心配しろ、などと言わずに済む。
7.2 製品実演と31年のパートナーシップ
Michael: ところでJensen、せっかく来てくれたのですから、この最新の一台にサインをしてもらえませんか。
Jensen: わかりました、よじ登らないといけませんね。私はあなたほど背が高くないものですから。今日は何日でしたか。18日、5月18日ですね。これは売り物にはしません。これはこのとおり、Michaelもすでにここにサインを入れています。さて、これがそのMichaelのマシンで、こちらの一台は、その100倍も大きいstation(ステーション)です。まったく同じアーキテクチャで、中身はGB300です。これは世界で唯一、1テラバイト、つまり1兆パラメータのAIモデルを動かせるデスクトップ・コンピュータなのです。
Michael: ほんの1年や2年前なら、想像すらできなかったことですね。
Jensen: まったくです。1兆パラメータといえば、ほんの数日前ならまるごと一つのクラウドに相当したような規模ですよ。それがこのstationに収まっている。そしてこのstationは、こちらの一台の100倍の大きさ、さらにあちらの一台は、このstationの5倍から6倍も大きい。そしてこれが私のお気に入りの一つ、いちばん小さなTitan(タイタン)です。すべて、あの大きな一台とまったく同じアーキテクチャ。一つのアーキテクチャで貫かれている。信じがたいことです。
Michael: Jensen、今日は本当にありがとうございました。NVIDIAとの素晴らしいパートナーシップを、そして世界中のお客様のために共に成し遂げてきたすべてを、私たちは心から大切に思っています。
Jensen: 私たちは、いわば一緒に育ってきた仲ですからね。31年です。31年もの間、これを共にやってきたのです。ありがとう。皆さん、これからも素晴らしい仕事を続けてください。