このほど発表された「全国データ資源調査報告(2025年)」によると、2025年の中国のデータ生成量は前年比27.28%増の52.26ゼタバイト(ZB)だった。伸び率は前年を2.28ポイント上回り、世界全体に占める割合は約27.44%だった。新華社が伝えた。
報告によると、2025年も中国のデータ資源規模は拡大した。主体別では、企業がデータ生成の中心となり、新たに増加したデータの約9割を企業データが占めた。産業別では、製造業、交通・物流業、ソフトウェア・情報技術サービス業などでデータ生成量の増加が目立ち、それぞれ前年比1.27ゼタバイト、1.22ゼタバイト、0.92ゼタバイト増加した。エンボディドAIや低空経済といった新興分野でもデータ生成量が増え、成長率はそれぞれ477.78%、75%だった。中国全体のデータ保存量は同21.05%増の2.53ゼタバイトとなった。
計算能力インフラの整備も進んでいる。報告によれば、「東数西算」(東部地域のデータを西部地域で保存・計算するプロジェクト)が実施され、中国全体で統合型計算ネットワークの構築が進められている。AI(人工知能)向け計算能力の供給も拡大しており、2025年末時点で中国全体のAI計算能力規模は159万PFLOPS(ペタフロップス、1PFLOPSは毎秒1000兆回の計算速度)に達した。汎用計算能力からAI計算能力への移行が進み、AI開発を支えるインフラの一つとなっている。
AI分野では、学習や推論に使われるデータ量も増えている。調査によると、2025年にAIの学習と推論に利用されたデータ総量は前年比42.86%増の199.48エクサバイト(EB)だった。推論に使われたデータ量は101.34エクサバイトに達し、初めて学習データ量を上回った。高品質データセット数は同61.13%増の11万件超で、総規模は同142.58%増の908ペタバイト(PB)超となった。年間のトークン呼び出し量は約2京1100兆に達し、AIの利用状況を示す指標の一つとなっている。