【AsianScientist】アジアのスーパーコンピューターの二酸化炭素排出に蓋をする

考えぬかれたプロセッサ設計に最適化されたプログラミング、政府の強力なサポートが、高性能コンピューティング (HPC)のエコシステムの持続可能性を高めていく。(2023年6月20日公開)

2013年、ピクサーとディズニーがアニメ映画モンスターズ・ユニバーシティを初めて公開したとき、ファンはすぐにあるディテールに感嘆した。主人公の1人、サリーを覆う毛皮が非常にリアルだったのだ。

穏やかな巨人が手足を動かすたびに何百万もの小さな毛皮が自然に揺れ、タイトなシャツの下では考えられるとおりに波立つことさえあった。アニメーターのコツは? 当時世界最速にランクされていたであろうスーパーコンピューターが、毛皮の毛の1本1本を自動的に再現し、動きの各フレームで光を捉えて反射させたのだ。

通常のデスクトップコンピューターは、この種のアニメーションを実行するための処理能力を持たないし、上級モデルであっても実際には問題が起こるだろう。しかしアニメーターたちは、映画に登場するサリーや他の怪物も、すべてのテクスチャ、シェーディング、フレームも、高性能コンピューティング (HPC) のおかげで鮮明に表現できることを明らかにした。

何十億もの計算を簡単に処理できるこの技術は、津波の予測、ヘルスケア・イノベーションの推進、超巨大ブラックホールの起源の研究に活用されているのと同じ種類の技術である。強力なプロセッサ、洗練されたソフトウェア、その他最先端のコンピューティング技術を組み合わせた HPC は、同時に動く数千のコンピューティング・ノードを使用して、通常のコンピューターよりもはるかに迅速に非常に複雑なコンピューティング・タスクを完了させる。

1つだけ問題がある。優れたコンピューティング能力は、大きなエネルギー負荷が伴う。モンスターズ・ユニバーシティから 10年間、HPC システムは社会で最も差し迫った問題のいくつを解決してきたが、膨大な二酸化炭素(CO2)排出量が別の問題を引き起こしている。

コンピューティング能力と持続可能性のバランスをとるために、アジアではスーパーコンピューターの設計でプロセッサとプログラミングのエネルギー効率の改善が進んでいる。一方、政府はHPCエコシステムを形成し成長させる中で、持続可能性の高いエネルギー源と政策の必要性に気づき始めている。

HPC の厄介なエネルギー問題

HPC炭素排出の主な原因の 1つは、エネルギー需要の急激な高まりである。何と言っても、強力なコンピューティング能力を支えるには、信頼性が高く堅牢なエネルギーを提供し続けなければならない。たとえば、モンスターズ・ユニバーシティを作成した HPCシステムは、2,000台のコンピュータで構成されており、合計24,000のコアを持っていた。このコンピューティング能力にもかかわらず、映画を完全に仕上げるために要した時間は1億CPU時間以上であった。その間ずっと、ピクサーの電気料金は上がり続けていた。

さらに、2022年11月時点で世界で最も強力なスーパーコンピューターである Frontier システムは、870万を超えるコアを持ち20MW以上の電力を必要とする。これは、シンガポールの約52,600世帯の1カ月分に十分相当する電力である。

結局のところ、世界のトップ500のスーパーコンピューターに電力を供給するだけで、年間約 200万トンの二酸化炭素が排出される。これは約285,000世帯に相当する。

それに加えて、HPCシステムが環境に与える負担を正確に計算するには、システムを支える技術のエコシステム全体についても考慮する必要がある。つまり、コンピューターそものもは計算の中心部分ではあるが、1つの部分でしかない。

スーパーコンピューターに流れ込むエネルギーの大部分は熱として消散する。温度を管理し、マシンが適切に稼働し続けるようにするために、コンピューティング施設は精巧な冷却メカニズムを採用しているが、通常はそれ自体が多くの電力を消費してしまう。

HPCシステムが抱える炭素排出量の別の原因はデータである。国際エネルギー機関は、2021年に世界中のデータセンターが約220から321TWhのエネルギーを使用したと見積もったが、これよりも消費量の少ない国はいくつもある。世界で HPC システムへの依存度が高まっていることを踏まえ、シンガポール国立スーパーコンピューティングセンター (NSCC) の最高経営責任者であるタン・ティンウィー (Tan Tin Wee) 教授は、将来、世界のエネルギー消費量の10%がデータセンターの運営によるものとなると予測している。タン教授はSupercomputing Asia誌に、「エネルギー消費は大きな問題になるでしょう」と語った。

徹底した思考と強い心

理化学研究所計算科学研究センター長の松岡聡氏はSupercomputing Asia誌 とのインタビューで、HPCシステムの急騰するエネルギーコストに対する主な解決策は、コンピューティングのエネルギー効率を最大化することであると述べた。目標は、電力消費を可能な限り低いレベルに保ちながら、性能を高める方法を見つけることであると語った。

理研には、富士通が開発した「富岳」スーパーコンピューターがある。2020年の登場以来、富岳は常に世界最速のスーパーコンピューターTOP500のトップの座に君臨していた。2022年6月にFrontierによってその座を奪われはしたが、特にその実用状況を見ると、富岳は今でも世界で最も強力でエネルギー効率の高いスーパーコンピューターの1つである。

松岡氏によると、富岳の性能の基礎となっているのは十分に考えられた設計である。「まず、効率性の高い設計とする必要がありました」と彼は述べた。スーパーコンピューターが持続可能性の研究に使用されることを知っていたため、最高のコンピューティング性能を達成するように特にそのための部品を構築した。それと同時に、他の無関係な機能を排除し、「電力節約を考えながら富岳を構築しました」

富岳の心臓部であり、その優れたエネルギー効率を主に作り出しているのはA64FXプロセッサである。これも富士通が開発したものである。

1つのA64FXチップには、4つのコアメモリのグループ (CMG) に分割された48個のコンピューティングコアが含まれている。各 CMG には、補助的に機能する追加コアをそれぞれ1つ含めることもできる。プロセッサのコアは小さな処理ユニットであり、1つのコアは他のコアと独立して計算タスクを実行できる。大多数のコンピュータユーザーの場合、2つまたは4つのコアを搭載したマシンがあれば十分である。A64FX は48のコアを持つため、性能は高くなっている。

A64FXの各コアのクロック速度は1.8から2.2Ghzである。これは、すべての1つのコアが毎秒18億から22億サイクルを完了できることを意味する。単純な計算タスクは1サイクルで完了できるが、命令が複雑であれば複数のサイクルが必要である。簡単に言えば、通常、クロック速度が高いほど、コンピューティング性能は優れたものになる。

松岡氏は、富岳はプロセッサだけでなく、ネットワーク自体も非常に効率的であると述べた。商用ネットワークのカードが1ノードあたり最大25から30W を使用するのに対し、富岳の銅線ネットワーク上のイーサネットは1ノードあたり10から20Wを使用している。

富岳の設計には、ユーザー向けの正確な電力制御機能も含まれている。 ほとんどのプロセッサは、すべての計算ノードを同時にオンまたはオフにして動作するが、富岳は特定のタスクに関連する部分のみが動作するように構成できる。「電力使用量が大きく節約できます」と松岡氏は語る。

これらの機能と他の技術革新により、富岳スーパーコンピューターは性能と省エネの壁を打ち破ることができた。松岡教授の計算によると、富岳の実使用性能は、2019年に終了した富士通の前任スーパーコンピューターである「京」の約70倍高い。「しかし、消費電力の増加はおそらく20~30%程度です」と松岡教授は話す。「したがって、京と比較して、富岳の電力効率はほぼ50倍になります」

ソフトウェアとチップ・アーキテクチャの大幅な簡素化

ピーク効率は、日本企業の Preferred Networks と神戸大学と共同で開発したスーパーコンピューターであるMN-3の目標でもある。

実際、富岳の性能は信じられないほどであるが、MN-3はエネルギー効率の点でそれを軽々と上回っている。富士通独自の数値によると、富岳は1ワットのエネルギーで約150億回の計算を実行できる。MN-3は同じエネルギーで約410億回の計算を実行できる。効率は2倍以上である。

エネルギー効率の観点からマシンのランキングを年2回行うGreen500では、MN-3はこの素晴らしい数値により、常に世界で最も効率的なスーパーコンピューターの1つに挙げられている。2021年11月、2021年6月、2020年6月にはトップの座を獲得した。

Preferred Networksのコンピューティング・インフラストラクチャ担当副社長である土井裕介博士は、Supercomputing Asia誌とのインタビューで「MN-3は現在、128個のMNコア・プロセッサと 1,536個のIntel Xeon CPUを搭載しています。32のノードで構成されており、それぞれが4つのMNコア・プロセッサを備えています」と説明した。

しかし、「MN-3がGreen500リストで3回トップにランクされた主な理由は、GPU ではなく、ディープラーニングに必要なマトリックス演算に特化した MNコアを使用しているからです」と付け加えた。

MNコアは階層型アーキテクチャで設計されたアクセラレータで、4ダイパッケージで提供されている。各ダイには4つのレベル2ブロックがあり、各ブロックはさらに8つのレベル1ブロックに分割されている。レベル1ブロックには、16個のマトリックス演算ブロックがあり、それぞれ4個の処理素子を搭載している。

各レベルの各ブロックは独自のネットワークオンチップに接続されており、すべての階層レベルでデータをブロードキャスト、集約、収集することができる。大規模なデータセットの異なる部分をブロックの異なる部分に分散させることができるため、非常に効率的な処理と計算が可能になる。

また、Preferred Networksはソフトウェアを最適化して、MNコアのハードウェアの可能性を最大限に引き出し、MN-3のエネルギー効率をさらに向上させた。

Preferred Networksが特に考えたのはMNコア・コンパイラである。これは、高レベルのコンピュータコードを、さらに機械になじむ別の言語に翻訳するプログラムである。このコンパイラは、2つのことを主な目的として設計されている。ユーザーが改造する必要性を最小限に抑えること、そしてMNコアの機能を最大限に活用して最高の演算性能を実現することである。

具体的には、MNコアの階層構造の中にある各計算ユニットに計算を割り当てる最適な方法をコンパイラが考える構造とした。また、アクセラレータは単一の命令ストリームしか使用しないため、プログラムは安定したデータフローを確保し、性能を理論上の最大値に近づける必要があった。

最終的な決め手となるのはハードウェアを強力に制御し、最大の効率を達成する計算方法を指示するソフトウェアである。土井博士は「MNコアでは、今まではハードウェア内で自動的に決定され処理されていたものをソフトウェア側に公開し、ソフトウェアはハードウェア内の計算の詳細を『手動モード』で制御してエネルギー消費を最適化することができます」と説明する。

これは、スマートなソフトウェア設計を通じてハードウェアの真の性能を実現するという、Preferred Networksの中核となる哲学を反映している。土井博士は「ソフトウェアが適切な制御を行うならば、シリコンが持つ真の可能性を解き放つことができます」と述べる。

権限、政策、可能性を見せる先例

富士通やPreferred Networksなどといった企業は、業界を変革しようと持続可能性の取り組みを行っている。だが、いくつかの重要な要素は民間企業の力ではどうにもならないままである。

たとえば、スーパーコンピューターの炭素排出量を評価するには、エネルギー使用量や計算の効率性を調べるだけでは十分ではない。国のエネルギーミックスを考えることも重要である。主に再生可能エネルギーで電力を供給する国のHPCシステムは、化石燃料に依存している地域よりも持続可能性が高い。松岡氏は、日本の洋上風力発電と太陽光発電の開発を支援することが富岳の使命の一部であると教えてくれた。しかし、すべての国が対応できるわけではない。

シンガポールのエネルギー市場監督庁 (EMA) によると、同国の電力の約 95% は天然ガスを原料としている。これは化石燃料エネルギーとしては最もクリーンなものだが、それでも炭素集約型のエネルギー源である。EMA の予測によると、シンガポールは当面天然ガスに依存し続けるということだが、太陽エネルギーなどといった持続可能性の高い代替手段を模索し、投資を継続している。

各国政府は、よりクリーンなエネルギー源の開発だけでなく、自国のHPCエコシステムを形成する権限も持つ。消費者や産業の需要に応えつつ、排出目標に沿うような政策を打ち出すことができる。

たとえば日本では、データセンターが施設を持続可能なものにアップグレードするために、政府が多額の補助金を出すという発表をした。日本政府は、電力を大量に消費するデータセンターを国内の寒冷地域に集中させることも検討している。これにより、冷却システムの電力需要を削減することができる。

一方、シンガポール政府は、350MWの電力フットプリントを指摘し、2019年に新しいデータセンターの承認と建設を停止した。停止期間は2022年に終了し、当局は前に進んで新しい指針を作成できるようになった。

新しい規則に従えば、厳格な国際基準に合格し、最高レベルのエネルギー効率技術を採用し、再生可能エネルギーその他革新的なエネルギー経路を稼働に統合する明確な計画を提示する施設のみが許可を得る。これらの措置により、シンガポールはデータセンターの増大するニーズと緊急の気候危機への対応の必要性とのバランスを取ることができるであろう。

しかし、テクノロジーと状況は常に進化している。今日最高レベルのものであっても、明日には効率性が低いものとなるかもしれない。今年の炭素目標が、来年には不適当なものとなるかもしれない。このような不確実性に直面したシンガポールは自国のために良い前例を作り、他のアジア諸国にも良い手本を示した。一時停止ボタンを押し、持てる者と持たざる者を見極め、より優れた道を切り開いたのである。

NSCC は政府が資金提供するスーパーコンピューティング施設である。その最高経営責任者であるタン・ティンウィー 教授は、NSCCの役割は模範を示して率先することであると述べた。過去 7年間、彼のチームは、HPCシステムのエネルギー消費を削減することのできる低価格かつ効率的な冷却技術を探求してきた。これは、熱帯の国でのスーパーコンピューティングにとって重要な試みである。タン教授は「私たちは、商業データセンターではできない新しいことを試し、それを続けることができます」と説明する。「私たちが他の人々に対し可能性を示すことができれば、他の人々は後に続くことができます」

このような技術はNSCC の最新スーパーコンピューターであるASPIRE 2Aに応用されている。この地域の典型的なデータセンターのPUE(データセンターのエネルギー効率の測定に使用される電力使用効率の指標)は2であるが、ASPIRE 1の教訓に基づいて設計された ASPIRE 2AのPUEは 1.08近くとなっている。

すでに、これらのイノベーションは当然の評価を得ている。ASPIRE 2Aを収容する NUS-NSCC i4.0データセンターは、2021年に建築建設庁 (BCA) のデータセンター・ グリーン マーク・プラチナ賞を受賞し、2022年にはW.Mediaの東南アジア・クラウド & データセンター (DC) 効率的イノベーション賞を受賞した。

システムのエネルギー効率を改善し続けるために、NSCC は独自のスーパーコンピューターのシミュレーションも実行している。これについてタン教授は、「スーパーコンピューターは単なる貢献者ではなく、問題の解決策そのものです」と述べる。

超リアリスティックなアニメのモンスターを作成する場合であれ、最先端の科学知識を推進する場合であれ、HPCシステムの排出量を地球の持続可能性の目標と一致させることは重要である。 アジアのイノベーションは、プロセッサでも、プログラミングでも、政策でも、これが可能であることを示している。

上へ戻る