科学技術
トップ  > コラム&リポート 科学技術 >  File No.26-021

【26-021】中国で基盤モデルの新技術・新製品が次々と登場

都 芃(科技日報記者) 2026年02月27日

 春節を迎え、中国ではAI産業を巡る競争が日々、熱を帯びている。今年に入ってから、百度(バイドゥ)、アリババ(阿里巴巴)、DeepSeek(ディープシーク)が基盤モデルの新技術や新製品を集中的に発表し、AIイノベーションの主導権争いを加速させている。

 百度は1月22日にネイティブフルモーダル統合モデリング技術を採用した「文心大規模モデル5.0」正式版を公開し、テキスト、画像、音声、動画など多様な情報の入力と出力に対応した。アリババは1月26日にフラッグシップ推論モデル「Qwen3-Max-Thinking」を発表し、推論技術を刷新して性能向上を実現した。その後、DeepSeekは新たな「DeepSeek-OCR-2」モデルを投入し、オープンソース化した。業界関係者は、短期間のうちに中国のAIは「三つどもえの構図」に入ったとし、イノベーションの歩みが明らかに速まっているとみなしている。

 基盤モデルの進化は、AI応用能力の上限を左右する。文心大規模モデル5.0正式版は、ネイティブフルモーダル構造によって技術革新を牽引し、競争優位を形づくる。百度の関係者によると、業界の多くが採用する「後期融合」のマルチモーダル手法とは異なり、同モデルは統一された自己回帰アーキテクチャを用いてネイティブフルモーダル・モデリングを実現。テキスト、画像、動画、音声といった複数ソースのデータを同一の枠組みで共同学習させることで、マルチモーダル特性が統一アーキテクチャの下で融合・最適化され、フルモーダルの統一理解と生成をネイティブに実現した。先に公表されたLMArena世界大規模言語モデル競技場ランキングでは、文心大規模モデル5.0正式版がテキスト部門および視覚理解部門で中国首位を複数回獲得し、世界の上位グループを走っている。

 アリババも千問(Qwen)大規模言語モデルを軸に継続的に攻勢をかけている。最新の推論モデルQwen3-Max-Thinkingは、新たなテスト時スケーリングメカニズムを採用し、同一コンテキスト内でより効率的な推論計算を実現し、よりスマートな推論結果をより低コストで得られるようにした。さらにアリババは、アプリケーションエコシステムを足がかりに、自社のトラフィック入口の強みを生かし、千問大規模言語モデルをEC、酒蔵ツーリズム、決済などの優位分野と連動させ、淘宝(タオバオ)、支付宝(アリペイ)、飛猪(フリギー)といったプラットフォームに深く組み込み、技術とシーンの高効率な協調を実現している。

 業界専門家によると、百度やアリババが強力な自社ビジネスエコシステムを背景に全面展開しているのとは対照的に、DeepSeekはオープンソースの強みを基盤に、モデルの基礎能力とオープンエコシステムの構築に注力し、「モデル重み付け+学習フレームワーク+デプロイツール」というフルスタックのオープンソース化によって、コストパフォーマンスの優位性を「極限まで引き出している」という。

 DeepSeekが発表したDeepSeek-OCR-2は、革新的なDeepEncoder V2手法を採用し、画像の意味に応じて各部分を動的に再配置できるようにした。これは人間がシーンを見る際の論理的プロセスを模倣したもので、複雑な画像処理において、よりスマートで論理的な性能を発揮し、独自の技術的発想を示している。

 DeepSeek-OCR-2に対抗する形で、百度も1月29日、文心派生モデル「Paddle OCR-VL-1.5」を発表し、オープンソース化した。同モデルはOCR(光学文字認識)分野で初となる「異形枠位置特定」技術を打ち出し、傾き、折れ、端の巻き込みなどを伴う不規則な文書も正確に認識できる。

 百度の関係者は、「当社は数少ないフルスタックAI能力を備える企業として、ソフトとハードの協調やシナリオ実装に長期的な投資を続けており、今回の『トッププレーヤー』競争においても粘り強さを示している」と説明した。

 基盤ハードウエアの面では、自社事業における計算能力への極限的需要を起点に、百度がインキュベートしたAIチップブランド「崑崙芯」は、専用型から汎用型へ、社内支援から対外サービスへと至る発展経路を歩み、シーン定義型チップの実現可能性を実証した。近年は独立上場プロセスも始動し、多分野展開を加速させている。現在、百度は国内初となる完全自社開発の3兆回レベルの崑崙芯クラスターを稼働させ、複数の1000億パラメータ級大規模モデルのトレーニングを同時に支え、自社開発の計算能力を「使える」段階から「大規模かつ再現可能」な段階へと引き上げつつある。

 信頼性の高い基盤計算能力、先進的なクラウドサービス、強力なモデル能力が相まって、より多様な製品・サービスが生み出されている。百度は文心基盤大規模モデルに基づき、マトリクス型モデルと専用モデルを構築している。マトリクス型モデルは製品レベルの応用や汎用シーンへの迅速な実装を担い、専用モデルは業界用途や特定シーンに対応する。例えば、文心デジタルヒューマン大規模モデルはライブコマース分野などで大規模な実装を実現し、新たなインタラクション体験とコンテンツ形態を生み出している。2025年の大規模通販セール「ダブル11」期間中、デジタルヒューマンによるライブ配信の取引総額は前年同期比91%増、配信ルーム数は119%増となり、10万を超える事業者が利用した。

 2025年の春節(旧正月、2026年は2月17日)期間にDeepSeekが注目を集めて以降、中国のAIは国際的な科学技術分野におけるホットトピックとなっている。1年以上にわたる発展を経て、AI技術は中国で大規模実装の新たな段階に入りつつあり、産業変革を牽引し、より幅広い社会的効果を生み出す中で、その価値が改めて検証されつつある。企業ごとに発展の道筋は異なるものの、その背後には明確なイノベーション能力の高度化の軌跡が存在し、AI産業を押し上げている。


※本稿は、科技日報「中国AI产业创新步伐加快」(2026年2月5日付)を科技日報の許諾を得て日本語訳/転載したものである。

 

上へ戻る