※本記事は、AI for Good Global Summit 2025において王凱(Wang Kai)氏が行った講演「元京モデル: 産業デジタル化の促進」の動画内容を基に作成されています。講演の動画は https://www.youtube.com/watch?v=9vrKoBp_7N4 でご覧いただけます。本記事では、講演の内容を詳細に文字起こしし、要約・整理しております。なお、本記事の内容は講演者の発言内容を忠実に反映するよう努めていますが、文字起こしや翻訳による誤りがある可能性もありますので、正確な情報や文脈については、オリジナルの動画講演をご視聴いただくことをお勧めいたします。
登壇者紹介: 王凱(Wang Kai)氏は、中国聯通(チャイナユニコム)データインテリジェンス株式会社の副マネージャーです。本講演では、中国聯通の「元(Yuan)大規模モデル」が産業のデジタル化・インテリジェント化を推進した成果について詳細に解説されました。データ、モデル、MaaS、産業エージェント、AIセキュリティシステムからなる5 in 1 AIフレームワークの構築から、産業、政務、文化観光、教育など複数のセクターにおける具体的な実装事例まで、包括的な産業デジタル化戦略を紹介されています。
AI for Good Global Summitは、ITUが50以上の国連パートナーと連携して主催し、スイス政府との共催で開催される、革新的なAIアプリケーションの特定とグローバルな課題解決に向けたパートナーシップ推進を目的とした国際会議です。
1. チャイナユニコムの5層AIエコシステム
1.1 企業概要とデジタル中国建設における役割
Wang Kai:私はチャイナユニコムのKaiです。今日は、元大規模モデルを使用して産業間のデジタル化を促進する私たちの最新の取り組みについて紹介いたします。チャイナユニコムは中国の3大通信事業者の1つであり、デジタル中国建設の主要な推進力でもあります。私たちは5つの要素からなる統合AIエコシステムを確立しました。このエコシステムは、基盤となるAI推論層から始まり、その上にデータ層、大規模モデル層、エージェント層、そして特別なAI安全システムという構造で構成されています。この包括的なアプローチにより、私たちは産業デジタル化の推進において重要な役割を果たすことができています。
1.2 AI推論層からエージェント層までの統合アーキテクチャ
Wang Kai:基礎層は私たちのAI推論層であり、この層では私たち独自のGPUリソースを持つAIDCと、大規模モデルの学習と推論をサポートするネットワークを構築しています。その上にはデータ層があり、このデータ層では現在までに400ギガバイトを超える非常に大規模なデータセットを構築し、データの取引と流通をより簡単にする信頼できるデータスペースも構築しました。データ層の上には大規模モデル層があります。この大規模モデル層では、元大規模モデルを構築しています。基盤モデルから、マルチモーダルモデルファミリーを構築し、エンジンマスプラットフォームも保有しています。このプラットフォームにより、大規模モデルの使用と修正がより簡単になります。基盤モデルとマスを使用して、多くの産業特化型モデルを構築し、これらのモデルを直接私たちのアプリケーションで使用しています。
大規模モデル層の上には、エージェント層を構築しました。基本的に3つのタイプのエージェントがあります。最初のタイプはデジタル従業員エージェントです。これは企業の内部使用のために機能し、企業の従業員がエージェントをより簡単に使用して日常業務を行えるようにします。2番目のタイプは個人エージェント、ホームエージェントと呼んでいるもので、個人および家庭での使用を目的としています。3番目のタイプは産業AIエージェントです。これは主に様々な産業アプリケーション、製造業、政府、文化、医療分野での産業アプリケーションのために機能します。
1.3 AI安全システムとガードレール機能
Wang Kai:また、AI安全システムと呼ばれる特別なシステムも保有しています。ご存知の通り、AIの安全性は極めて重要であり、ここで私たちはAIの内部安全性を含む様々な種類のAI安全戦略を研究開発しました。また、AIの使用をより安全にするAIのガードレールも開発しています。これらの安全対策により、AIシステム全体の信頼性と安全性を確保することができています。
2. 元(Yuan)基盤モデルとプラットフォーム技術
2.1 4つのモダリティとオープンソース統合戦略
Wang Kai:元基盤モデルについては、現在までに4つのモダリティのモデルを構築しています。それは元言語モデル、音声モデル、視覚モデル、そしてマルチモーダルモデルです。また、Llama、Qwen等のオープンソースモデルもインポートしています。ここでの目標は、ユーザーに最適で最も包括的で広範囲なモデルをシステムやアプリケーションのために提供することです。特に私たちは顧客向けに特別な機能を持っています。
2.2 モデル能力定量化手法と選択ガイドシステム
Wang Kai:まず、モデルの選択をより簡単にするための機能があります。ご存知の通り、モデルの選択はすべてのアプリケーションにとって非常に重要です。ほとんどの場合、ユーザーは自分がどのようなモデルを選択すべきかを認識していません。特に特定の目標がある場合、特定のアプリケーションがあり、限られたGPUリソースしか持たない場合でも、通常はどのタイプのモデル、どのような種類のモデル、どのモデルを選択すべきかを知りません。つまり、これを認識していないのです。ユーザーがモデルを選択するのを支援するため、私たちはモデル能力定量化手法を提案しました。この手法により、ユーザーがより良いモデル選択を行うのを支援し、特にモデル能力評価とモデル選択ガイドを提供しています。これはユーザーマニュアルのように機能します。ユーザーはマニュアルを見て対応する情報を見つけるだけで、自分のアプリケーションに最適なモデルを得ることができます。
2.3 難易度適応型推論による30%コスト削減実験
Wang Kai:2番目の機能として、ご存知の通り推論モデルは今日非常に人気があり、現在のSOA(State-of-the-Art)モデルの大部分は推論モデルです。しかし推論モデルには欠点があります。特に「9+5は何ですか?」のような非常に簡単な質問を尋ねたときに、しばしば過度に考えてしまうことです。このような場合、非常に長い答えを出力してしまいます。これは実際にはコスト効率的ではありません。推論コストを向上させるため、私たちは難易度適応型スロー思考手法を提案しました。この手法により、簡単な質問には簡単な答えを出力し、困難な問題に対しては厳密な思考プロセスを維持することができます。平均して、推論コストを30%削減することができました。
2.4 マスプラットフォームとRAG技術(20%精度向上実証)
Wang Kai:3番目の機能として、私たちは全てのモデルの安全機能を評価できる安全強化および評価手法を提案し、評価用のオープンソースベンチマークを提案しました。また、安全モデルを強化してモデルを実際のアプリケーションで実用的にするためのデータセットも提案しています。
マスプラットフォームについては、現在までにユーザーが使用するための多くのツールセットを提供しています。ユーザーはモデルを選択でき、モデルを修正して様々なアプリケーションに適用できます。これらのツールに加えて、最も人気があり最も有用なRAGエージェントRAGとエージェントツールも提供しています。特にRAGについては、オープンソースソリューションと比較してRAGの精度を20%向上させることができました。ここで私たちのエンジンマスクのオープンソース版を紹介したいと思います。これはGitHubからダウンロードできます。これは制限なしの無料版で、実際にはDeifyのような人気のオープンソースフレームワークと少し似ていますが、制限なしで自由に使用でき、フィードバックを提供していただけることを歓迎します。
3. 産業特化モデル開発と実装戦略
3.1 30以上の産業特化モデル構築
Wang Kai:私たちの基盤モデルとマスシステムを使用して、現在30を超える産業特化モデルを確立しました。これらのモデルは政府機関、新型工業化、公共部門、そして様々な企業アプリケーションで使用することができます。私たちはパートナーと協力して、共同研究所や共同プロジェクトを通じてこのようなモデルファミリーを構築しており、国内外から様々な賞を受賞しています。
3.2 政府・製造業・企業向けカスタマイズ
Wang Kai:これらの産業特化モデルは、政府機関での使用、新型工業化の推進、公共部門でのサービス向上、そして様々な企業アプリケーションでの活用を目的として開発されています。各分野の特殊な要件に対応するため、私たちは基盤モデルとマスシステムを基盤として、それぞれの産業領域に最適化されたカスタマイズを行っています。これにより、実際の業務環境で直接適用可能な実用的なソリューションを提供することができています。
3.3 パートナーとの共同開発体制と受賞実績
Wang Kai:私たちはパートナーと共に協力して、共同研究所や共同プロジェクトを通じてこのようなモデルファミリーを構築しています。このような協力体制により、私たちは国内外から様々な賞を受賞することができました。これらの共同開発の取り組みは、産業デジタル化の推進において重要な役割を果たしており、パートナーとの連携によってより包括的で効果的なソリューションを提供することが可能になっています。
4. 社内業務効率化とセキュリティ応用
4.1 SMS詐欺防止システムとプライバシー保護機構
Wang Kai:次に、私たちが実際に行った実用的なアプリケーションをいくつか紹介します。最初は、チャイナユニコムの内部業務でのアプリケーション事例です。ご存知の通り、通信事業者として、SMSの安全性は私たちにとって非常に重要です。特にSMSの詐欺防止対策が重要です。私たちは元大規模モデルを使用してSMS詐欺防止を行うことを提案しました。受信するすべてのSMSメッセージに対して、元大規模モデルを使用して詐欺情報が含まれているかどうかを検出し、詐欺情報がある場合は、ユーザーに別のメッセージを送信して、受信した内容に詐欺の可能性があることを伝え、予期しない事例を避けるようにしています。
特に言及すべきは、私たちはこのSMSの内容にアクセスする権限を持っていないということです。大規模モデルのみがSMSにアクセスできます。これによりユーザーのプライバシーを保護することができています。
4.2 社内規則QAとオフィスツール自動化
Wang Kai:私たちはまた、チャイナユニコムの内部従業員向けに、チャイナユニコムの規則をより良く理解するのを支援するアプリを開発しました。従業員は簡単なQ&A形式で規則にアクセスでき、これにより当社の規則をより簡単に理解できるようになります。
また、私たちは多くのオフィスツールを提供しています。特に文書作成、特にスライド作成のためのツールです。ご存知の通り、スライド生成は現在非常に人気がありますが、私たちが提供する違いは、まず大規模モデルを使用してスライドを生成することをユーザーに許可し、スライドが生成された後、修正を行うための様々なツールも提供することです。つまり、大規模モデルを使用してスライド内のテキストや画像を修正できるということです。これによりスライドの作成がより簡単になります。このようなスライド作成に加えて、Excelの生成用ツールも提供しています。
4.3 プレゼンテーション・文書生成の統合ソリューション
Wang Kai:スライド生成については、現在非常に人気のある機能ですが、私たちが提供する差別化要因は次の通りです。まず、ユーザーが大規模モデルを使用してスライドを生成することを可能にし、スライドが生成された後、修正を行うための様々なツールも提供しています。ユーザーは大規模モデルを使用してスライド内のテキストや画像を修正することができ、これによりスライドの作成がより簡単になります。このようなスライド機能に加えて、文書やExcel生成のためのツールも提供しています。これらの統合されたオフィスソリューションにより、従業員の日常業務効率を大幅に向上させることができています。
5. 政府サービス業務変革の実証事例
5.1 12345ホットライン効率化(186秒→133秒処理時間短縮)
Wang Kai:政府サービスについても、中国のユーザー向けに多くのツールを提供しています。12345という有名な電話番号があります。12345は中国の有名なホットラインであり、中国のすべての市民がこの番号に電話して政府に苦情を申し立てたり、要求を伝えたりできます。特に特定の要求がある場合に利用されています。12345ホットラインの背後には、カスタマー代表者、カスタマーエージェントがいます。市民のために働く多くのエージェントが働いています。
過去には、サービスエージェントが市民からの要求を受けると、まずこの要求を記録し、その後対応する公共部門にこの要求を振り分けていました。例えば、市民が環境汚染について苦情を申し立てた場合、エージェントはこれを環境保護部門に送ります。しかし問題は、毎日大量の電話があり、記録と振り分け作業が非常に労働集約的でエラーが発生しやすいということでした。
ここで私たちは大規模モデルを使用して、サービスエージェントが要求を記録し、より簡単な方法で振り分けるのを支援しました。元大規模モデルを使用することで、現在エージェントが行う必要があるのは確認作業だけです。記録作業と振り分け作業はすべて大規模モデルによって行われます。この大規模モデルを使用することで、処理時間を186秒から133秒に短縮することができ、これにより市民も非常に満足しています。
5.2 市民緊急事態報告システム(4日→2日処理期間短縮)
Wang Kai:私たちはまた、中国の省である蘇州省の市民向けアプリを開発しました。このアプリを使用することで、市民が重要な出来事や緊急事態を目撃した際、その出来事の写真を撮るだけで済みます。私たちは大規模モデルを使用してこの出来事を描写し、この画像をテキストに変換して政府に直接送信します。このアプリを使用することで、処理時間を平均4営業日から2営業日に短縮することができました。
5.3 経済予測と意思決定支援(GDP予測成功事例)
Wang Kai:政府サービスについて、私たちはまた大規模モデルを使用して政府の経済意思決定支援を行っています。ご存知の通り、中国政府は経済指標を定期的に発表しています。毎月、四半期ごと、毎年発表しています。ここで私たちは大規模モデルを使用してGDPなどの重要な経済指標を予測しています。
一例として、昨年、北京政府がGDP数値を発表する2ヶ月前に、私たちは正確なGDP数値の予測に成功し、その数値を政府に伝えたところ、彼らは驚きました。これは実際に政府が発表したものと全く同じでした。ここで私たちはモデルをどのように使用するかについて説明します。私たちは公的な人々の活動データ、製造業データ、そして多くの公的データを使用してこれらの予測を行い、この予測は実際に政府が経済決定をより簡単に行うのに役立っています。
6. 製造業デジタル化とイノベーション支援
6.1 大型設備保守システム(90%超回復率達成)
Wang Kai:産業製造業においても、私たちは大規模モデルを使用して技術者を支援しています。非常に大きな設備、非常に大きな設備の修理について、これは非常に労働集約的であり、技術者は多くの作業を行う必要があります。例えば、大型設備のコンポーネントが故障した場合、技術者はマニュアルやガイドを調べて何が問題なのかを見つけ、それをどのように修理するかも調べなければなりません。
現在、元大規模モデルを使用することで、非常に強力なデータベースを構築することができ、大規模モデルを使用して問題を見つけ、簡単なQ&A形式でトラブルシューティングを行うことができます。技術者は自分の問題を簡単に記述するだけで、大規模モデルが答えを提供します。これは元モデルと私たちのRAG技術に基づいています。私たちの顧客の一つでは、元モデルを使用することで回復率を90%を超えて達成できると報告されました。これは非常に印象的な数値であり、この高い回復率により、ユーザーは実際のアプリケーションでこのシステムを使用することができています。
6.2 AIGCによるファッションデザイン革新
Wang Kai:私たちはまた大規模モデルを使用してユーザーのファッションデザインを支援しています。ご存知の通り、過去にデザイナーがファッションデザインを行う際は、多くのスケッチを作成し、ソフトウェアを使用して3D衣服をモデリングして、希望する衣服がどのように見えるかを確認する必要がありました。これには非常に長い時間がかかっていました。
しかし現在は、大規模モデルとAI、AIGC技術を使用することで、数秒以内に衣服の画像を作成することができます。デザイナーは、色、生地、スタイルなど、希望する衣服についてのプロンプトを与えるだけです。最初に生成された衣服が満足できない場合、簡単なプロンプトを通してさらに修正することができます。Tシャツが欲しいか何かを伝えるだけで、モデルが生成結果を修正し、さらにモデルがこの衣服を着た時の効果を見ることができます。つまり、この衣服を着た人物を見ることができるということです。
これは実際にデザインの方法を大きく変革しました。ファッションデザイナーが簡単なプロンプトで衣服をデザインできるということは、過去には想像することが困難でした。過去には通常多くのスケッチを描く必要がありましたが、現在はプロンプトを学ぶだけで満足のいくファッションをデザインできます。このシステムは中国の様々な工場で使用されており、デザイナーたちは大規模モデルシステムを使用してファッションをデザインし始めています。
6.3 品質検査・計数・安全監視システム(200社導入実績)
Wang Kai:実際に私たちは元大規模モデルを使用して多くの製造業務を行っています。例えば、製品品質検査にモデルを使用し、精密測定にもモデルを使用しています。例えば、米粒の重量を予測するためにモデルを使用できます。また、卵の動的計数、家畜の動的計数など、多くの動的計数も行っています。さらに、モデルを使用して製造業務のコンプライアンスと安全性を監視し、工場が製造の安全性を維持するのを支援しています。実際に私たちは200社以上の顧客がモデルを使用した製造を行うのを支援しました。
7. 教育・文化・消費者サービス展開
7.1 大学連携プロジェクトとセキュリティ課題対応
Wang Kai:教育サービスについては、大規模モデルの出現により、私たちは中国の大学とも協力しています。蘇州大学と呼ばれる中国の大学と協力し、大学生が大学の規則を理解し、様々なキャンパス活動、例えばコースの登録などを行うのを支援するアプリの構築を支援しました。ここで興味深い話をお伝えします。最初に学生向けにこのアプリを展開した際、大学は元のDeepSeekモデルを使用していました。ご存知の通り、DeepSeekモデルには多くの安全性の問題があります。大学生は通常非常にオープンマインドで活発です。
そこで一人の学生がプロンプトインジェクション手法を使用してアプリを破ろうと試みました。彼はWindowsキーIDについてアプリに質問しました。これは典型的なプロンプトインジェクション問題であり、モデルはWindowsキーを彼に教えてしまいました。幸い、学生はその違法なキーを使用する代わりに、この問題を直接学校のIT部門に報告しました。大学がこれを認識した後、彼らは私たちにモデルを安全強化された元モデルに置き換えるよう要求し、この元モデルにより、学生により安全なソリューションを提供することができ、その問題を回避することができました。
7.2 プロンプトインジェクション攻撃の実体験と安全強化
Wang Kai:この事例において、学生がプロンプトインジェクション手法を使用してアプリを攻撃しようと試みたことは、AI安全性の重要性を示す実際の教訓となりました。学生はWindowsキーIDについてアプリに質問し、これは典型的なプロンプトインジェクション問題でした。DeepSeekモデルは適切な安全対策が施されていなかったため、実際にWindowsキーを提供してしまいました。
幸いなことに、この学生は責任ある行動を取り、その違法なキーを悪用する代わりに、この深刻なセキュリティ問題を直接学校のIT部門に報告しました。大学側がこの脆弱性を認識した後、私たちにモデルを安全強化された元モデルに置き換えるよう要求しました。この安全強化された元モデルの導入により、学生により安全なソリューションを提供することができ、そのような問題を回避することができるようになりました。この実体験は、実用的なAIシステムにおける堅牢な安全対策の必要性を明確に示しています。
7.3 文化遺産デジタル化と消費者向けアプリケーション
Wang Kai:これは中国文化遺産保護のためのアプリケーションです。ご存知の通り、中国には多くの文化遺産と古物があります。大規模モデルを使用することで、中国の文化遺物を中国系の女性、つまりアジア系中国女性に変換することができます。これにより、顧客が中国の遺産をより良く理解するのに役立ちます。ここではチャイナユニコムの展示ブースに機械も持参しており、中国の衣服を着た自分の写真や動画を生成する体験をすることができます。
また、私たちは多くの2Cアプリケーション、顧客アプリケーションでも大規模モデルを使用しています。例えば、チャイナユニコムのクラウドフォン上でアプリを操作するのを支援するアシスタントアプリを提供しています。簡単なプロンプトを通じて、チケットの予約、ナビゲーション、動画の再生を自動的に行うことができます。これが今日の元モデルのアプリケーションのすべてです。チャイナユニコムはパートナーと協力して、大規模モデルによる産業デジタル化の促進を共に推進したいと考えています。