【AsianScientist】高性能コンピューティング(HPC) の未来を牽引するテクノロジー|その他アジア等コラム＆リポート|Science Portal Asia Pacific アジア・太平洋地域の科学技術の今を伝える

高性能コンピューティング(High Performance Computing:HPC)の力を解き放ち、研究や産業の中の大きな課題を解決するイノベーションに注目していただきたい。

国際サッカー連盟(FIFA)がトップサッカーチームの世界ランキングを作り、音楽チャートでは毎週曲が上下するように、世界中の最も強力なコンピューターもTop500リストと呼ばれるものでランク付けされている。442ペタフロップスの計算速度を誇る日本の富岳は 2年連続でスーパーコンピューティング・チャートのトップに君臨していた。しかし、米オークリッジ国立研究所の1.1エクサフロップスの「フロンティア」が新たな挑戦者として現れ、2022年5月に発表された最新ランキングでは初登場トップとなり、富岳を首位から引きずり落とした。

トップだけでなく下位の部分でも、半年ぶりのTop500の発表で大きな順位の入れ替わりがあった。ランキングにおけるこのような動きは、HPCの分野で技術の進歩が猛烈なペースで進んでいることの証である。膨大な量のデータを高速で計算するHPCシステムは、テクノロジー業界の最前線に立つだけでなく、他の多くの分野で複雑な問題に取り組むための有効なツールとしても機能する。たとえば、科学者はHPC技術を使用すれば、臨床データから生物医学的な大発見をしたり、新しい材料の特性をより効率的かつ正確にモデル化したりすることができる。

これらのイノベーションの価値が拡大し続けていることを考えると、研究者や業界大手が、構成要素から集合体まで、微調整から性能の大幅なアップグレードまで、スーパーコンピューティングの限界に挑戦し続けていることは当然のことである。HPC の期待される能力は多くの可動部分に依存しているため、本記事では、さらに強力でアクセスしやすいスーパーコンピューティングシステム構築の基礎を築く技術とトレンドを紹介する。

機械知能に革命を起こす

日常的に生成されるデータの急増に伴い、人工知能(AI)やデータ分析ツールの使用はますます高まっている。関連情報を抽出し、モデルを構築し、そして意思決定の指導やシステムの最適化を行う。HPCは、人間の脳の処理パターンを真似たニューラルネットワーク上に構築された機械学習(ML)システムやディープラーニング(DL) システムなど、AI技術の強化に不可欠である。

DLアルゴリズムは所定のルールに従いデータを分析するのではない。パターンを検出し、一連のトレーニングデータからルールを学習し、その後、学習したルールを新しいデータやまったく新しい問題に適用する。DL の性能は通常、利用可能なデータの量と質に依存する。計算コストと時間がかかるが、スーパーコンピューターはこれらの学習フェーズを加速し、より多くのデータを精査して、最終的には改善されたモデルを得ることができる。

たとえば、医療分野では、計算モデルを使い、複雑な分子ネットワークがどのように相互作用して疾患の進行を促進するかをシミュレートする。このようにして新たに発見するものがあれば、がんや心血管代謝状態などといった複雑な病気を検出して治療できる新しい方法を生み出すかもしれない。

タイのチュラロンコン大学の研究者チームは、新型コロナウイルス(SARS-CoV-2)に対する治療標的を調査するために、タイ国立科学技術開発庁(NSTDA)のスーパーコンピューターセンターに設置されている250テラフロップスのスーパーコンピューティング・クラスターであるTARA を使用して、分子動力学シミュレーションを行った。チームはこのシミュレーションを通じて、ある種類の阻害薬とウイルスの複製に重要であることが知られているタンパク質の相互作用をマッピングし、タンパク質に結合しSARS-CoV-2を抑制する可能性のある薬剤の設計について、新たな知見を得た。

HPCの能力は、気象予測や気候変動のモニタリングにも利用できる。韓国は、国家気象スーパーコンピューターセンターを通じて、高解像度で正確度の高いの予測モデルを構築している。韓国気象庁は昨年、気候モデリングと AI 分析の広範な計算需要を満たすために、第 3 世代 Intel Xeon スケーラブル・プロセッサに Lenovo ThinkSystem SD650 V2サーバーをインストールして、HPC リソースを最新のものにした。新しいクラスターは50ペタフロップスを記録した。以前のクラスターよりも8倍速く、エネルギー効率は4倍向上している。

スーパーコンピューティングがAIに負荷のかかる作業を可能にさせることは確かだが、このようなスマート・システムは、セキュリティ強化のためのネットワーク構成の評価など、HPCデータセンターの最適化にも有効である。また、サーバーの健全性を監視することで、予測アルゴリズムがユーザーに機器の潜在的な故障を警告するのでダウンタイムの短縮と効率性の向上に役立ち、継続的なHPCタスクに貢献してくれる。

チップの行列

HPCを使うAIはスーパーコンピューティングのソフトウェア分野を対象としているかもしれないが、ハードウェア分野も同様に重要である。この分野の進歩は、プロセッサやチップの開発の革新性に依存している。可能な限り短い時間で完了可能な操作数を限界を超え増やそうとしている。

おそらく、コンピューターで使用されるチップの中で最もよく知られているのは、比較的少量のデータを処理する単純なモデルを簡単に実行できる中央処理装置(CPU) である。CPUは通常、いくつものメモリにアクセスして、いくつかの小さなタスクを同時に実行するように設計されているため、頻繁に繰り返されるタスクには役に立つが、トレーニングモデルのような複雑で時間のかかる作業の場合は異なる。

多くのCPUノードを詰め込むと計算能力が向上するが、システムに装置を追加するだけでは効率的でも実用的でもない。大量のMLワークロードを処理するには、HPCリソースをスケールアップするために画像処理装置(GPU)とテンソル処理装置(TPU)の形をしたアクセラレーターが不可欠である。事実、これらは、スーパーコンピューターと性能の低いコンピューターを区別するコンポーネントである。

その名前の通り、GPUは画像のレンダリングに優れているため、途切れがちのビデオやフレームレートのラグを引き起こさない。しかし、それだけではない。幾何学的な図形や遷移を滑らかにするには、連続した演算をできるだけ速く完了させることが重要であるため、GPUは瞬時に計算を実行するように作られている。この速度により、GPUは大きなモデルを処理し、データ集約型のMLタスクを実行することが可能なのである。

TPUは、画像レンダリングよりも DLモデルのニューラル・ネットワークで一般的に見られる行列計算を処理することで、これらのコンピューティング機能をさらに一歩前進させる。TPUは2つのユニットで構成される集積回路であり、各ユニットはそれぞれが異なる種類の操作を実行するように設計されている。行列乗算のユニットは混合精度形式を使用し、計算には16ビット、結果には32ビットの間でシフトする。

16ビットの方が演算速度が速く、メモリ使用量も少ないが、モデルの一部を32ビットにすることで、アルゴリズム実行時の誤差を減らすことができる。このようなアーキテクチャでは、行列の計算を複数のGPUノードに分散させるのではなく、わずか1つのTPUコアで完了させることができるため、正確性を犠牲にすることなく計算速度とパワーを大幅に向上させることができる。

優れた処理装置を設計する競争の中で、世界中のチップ製造会社は、常に新しい製造方法を模索し、材料科学の最新研究を試し、重要なHPC部品の性能を向上させている。

オンデマンドでアクセスする

スーパーコンピューティング・システムは決して安いものではない。効果的に使用するための技術的ノウハウはもちろんのこと、構築と維持にはかなりの資金、空間、およびエネルギーが必要である。これらのコストはHPCの普及を妨げるものとなろう。HPCインフラは通常、社内データセンターとして設置されるが、イノベーションへのアクセスを増やすために、近年はクラウドでも展開されている。

クラウドコンピューティングには、分析プロセスからストレージスペースまで、インターネットを介した技術サービスの提供が含まれる。HPC as a Service (HPCaaS) と呼ばれるこの方法は、スーパーコンピューティング・リソースをサイバースペースに分散させることで、現場に設置したシステムに比べて柔軟性と拡張性を高めることができる。

スーパーコンピューティングが学界から産業界に移行する中、金融から石油、ガス、自動車産業に至るまで、HPCaaSが重要な架け橋として機能すると、多くのエンドユーザーが強力なリソースを利用できる。最適化されたスケジューリング戦略とリソースの割り当てを行えば、これらのシステムは多様な産業特有の作業量に対応し、HPC機能を共有することで、より強力なコラボレーションを促進することができる。

理化学研究所と共同で富岳を開発した富士通は、業界全体の破壊的技術をさらに促進するというビジョンを持って HPCaaSシステムを開始した。企業はクラウドにより、富士通のスーパーコンピューターであるPRIMEHPC FX1000サーバーのコンピューター・リソースにアクセスできる。このサーバーはを実行するのはARM A64Xプロセッサであり、AIおよびML作業用のソフトウェアが補完を行う。これらのチップは富岳システムにも使われており、高性能であるだけでなく、エネルギー効率も非常に優れている。

アジアでは特に技術の進歩が不均一で様々な状態が見られるため、柔軟なHPC消費モデルはデジタルデバイドを解消するための鍵となる。最高のリソースを共有し、国境を越えた協働を行い、スーパーコンピューティングを民主化すれば、革新的なアイデアは命を吹き込まれ、新しい研究の方向性は、もっと素早く切り開かれる。

エクサスケールとその先へ

米国のフロンティアの登場はエクサスケールの壁を打ち破り、HPC界の画期的なマイルストーンとなった。フロンティアが登場する前は、世界最高のスーパーコンピューターは64 ビット精度で測定するとペタスケールで作動していた。1ペタフロップスは、毎秒1000兆 (1015)回の計算に相当する。

このようなシステムは、非常に複雑なモデリングを実行でき、科学的発見を迅速に進めることができる。たとえば、富岳は、遺伝子データをマッピングし、がん患者の治療効果を予測するために使用されている。高い解像度で大気と海洋の流体力学をシミュレーションする。津波による洪水のリアルタイム予測モデルを開発する。さらに画期的大発見への道を開く可能性を持つエクサスケール・コンピューティングは、現実性の高いシミュレーションと、1 秒あたり百京回(10の18乗である!)の計算という高速化を実現できる。このように速度が向上すると、宇宙の仕組みを形作る複雑な物理力と核力の理解など、さまざまな用途と基礎研究を推進することができる。

持続可能性から高度製造まで、科学者はこれらHPCリソースを使用して、正確性の高い地球の水域モデルを構築したり、新材料の光学的特性・化学的特性やナノ粒子について深く掘り下げることもできる。

化学空間というものがある。あらゆる化学物質を含む概念的な領域であり、その探索はとりわけ刺激的である。1万180の化合物が存在すると推定されているが、この数は宇宙に存在する原子の数の2倍以上であり、アメリカ化学会のCASレジストリに登録されている2億6千万個の物質と比較すると、興味深い数字である。

科学者はエクサスケール・コンピューティングを利用すれば、この化学空間の隅々まで探索可能な、強力な新しい手段を手に入れることができる。薬物分子、太陽電池用の光吸収化合物、効率的の高い水フィルター用ナノ材料などを発見するかもしれない。

また、ペタスケール・システムが国内ばかりか国境を越えても共有されるため、コンピューター・リソースの増加はアクセスの分散やHPCの普及の役に立つ。アジアにはまだエクサスケールのスーパーコンピューターはないが、富岳や中国の「神威・太湖之光」は共に32ビットでエクサフロップスというベンチマークを達成した。アジア地域のハイテク産業の最前線では、イノベーターたちが64ビットレベルで同じ偉業を達成しようとしており、アジアやその他の地域におけるHPCとその用途にバラ色の未来を見せている。

(2022年11月17日公開)