【AsianScientist】アジアのエクサスケール競争についていく

世界中の主要なスーパーコンピュータセンターが、エクサスケール・コンピューティングという大きな目標を達成しつつある。

一般論として、研究者が仕事をする時は常にサイズ、性能、速度を改良する努力を続けている。これは、高性能コンピューティング(High Performance Ccomputing:HPC)の場合には特に当てはまる。HPCは、気候研究から生物医学に至るまで、さまざまな最新の研究活動を支える分野である。

過去 14 年間、この分野はペタスケールの仕事をしてきた。第1号は2008年、IBMの Roadrunner が毎秒 1.026 千兆回、つまり 1.026 ペタフロップスの浮動小数点演算を続けて実現した。次にエクサスケールとして知られる 100 京フロップスでの作動が正式に達成され、大きな節目となった。今後、エクサスケール・コンピューターは、高速かつ効率的な計算を行い、世界中の研究を推進すると期待されている。

まさに今年、世界最速のスーパーコンピューター TOP500 のリストで、米国のオークリッジ国立研究所の「フロンティア」が最初の「真の」エクサスケール・マシンであることが発表された。1.102 エクサフロップスというLINPACK 性能を達成したのである。しかし、重要なことだが、エクサスケールで作動するマシンは他にもある。例えば日本の富岳は最も一般的に適用されるLINPACK ベンチマークではなく、別のベンチマークに基づく偉業を達成した。

米国のフロンティアは現時点で最初の真のエクサスケール・マシンと見なされているが、アジアのスーパーコンピューター・センターが持続的なエクサスケール性能に向けて飛躍していることから、エクサスケール・マシンはフロンティアだけではないかもしれない。

大海の一滴を超えて

中国・無錫の国立スーパーコンピューターセンターには、世界最強のスーパーコンピュータのトップ 10 に入り、93 ペタフロップスで作動する「神威・太湖之光」が置かれている。しかし、中国はさらに多くのことを行っているようである。中国では 2 台のエクサスケール・スーパーコンピュータが動いていると考えられているが、どちらも公式に公開されていない。

Sunway Oceanlite は神威・太湖之光の後継マシンとして知られている。2022年3月にベンチマーク対象となった後、ピーク性能は1.3エクサフロップスに達したと報告されている。

調査により分かっている範囲では、このマシンはすでに使用されており、脳のような人工知能(AI)となるように設計された最近のプロジェクト(パラメーターの数を人間の脳のシナプスの数と同じようにしている)では主役となっている。実際、このプロジェクトは、エクサスケールのスーパーコンピュータ全体を脳規模のモデルとしてトレーニングを行う最初のものであり、マシンの潜在能力を最大限に引き出すことができる。

これまでに、OceanLightシステム最大の試験構成では、何と105台のキャビネットの4,193万コアについて、107,520のメモへのアクセスを記録したことが報告されている。

また、中国は国防科技大学に、ほぼ同じ速度で実行可能なもう一つのスーパーコンピューターである「天河3号」を持つ。天河3号もディープニューラル・ネットワークのトレーニング用に展開されており、すべて国産のアーキテクチャで作動する。具体的には、このマシンはPhytium社の FeiTingプロセッサシリーズを基礎としている。中国はHPCの主要拠点として発展を続けているが、さらに大きく、さらに高速なマシンを構築するために、独自のアーキテクチャに依存している。

用途の重要性

442 ペタフロップスという LINPACK ベンチマークで作動する日本のスーパーコンピューター「富岳」は、TOP500 リストのトップに君臨していた。富士通と理化学研究所が共同開発し、理化学研究所計算科学研究センターに設置されているこのマシンは、日本の研究において重要な役割を担い、医療や気候モデルなどの解明につながった。たとえば、研究者は富岳を使うことで、一般のコンピュータで津波による浸水を迅速に予測できる新しい人工知能(AI)システムを開発できたことは知られている。2021年1月には富岳を使用して分子の動きをシミュレーションし、タンパク質と約2,000の既存の薬との相互作用を特定して、新型コロナウイルス感染症(COVID-19)の効果的な治療法を発見した。

このような用途では、スーパーコンピューターを低精度で作動させることで、十分な正確度を維持したまま性能を向上させることが可能であり、富岳は1エクサフロップを超える性能を達成している。

「通常、富岳では何百、場合によっては何千ものタスクが行われています」と理化学研究所計算科学研究センター長の松岡聡氏はSupercomputing Asia とのインタビューでこう話す。「いつでも最大限のエクサスケールで作動しているかどうかを判断するのは困難ですが、エクサスケール・マシンに期待されるレベルで動いていることは間違いありません」

興味深いことに、松岡氏は富岳を汎用マシンと定義しており、世界中の研究者や商用ユーザーは富岳の一部をさまざまな用途に利用できる。そのため、それらの用途では通常、富岳のごく一部だけを利用するため、富岳の能力が完全に発揮できない場合がある。しかし、研究者のニーズを満たすことは、特定のベンチマークを満たすという象徴的なニーズよりも重要であることは明らかであるが、時宜に応じてスーパーコンピューターの限界を実証することも、やはり重要である。

「方法の限界を検証するだけでなく、マシンの半分以上を使用してフルスケールで実行した場合の速度を決定する必要があります」と松岡氏。

理研チームは富岳の能力の限界に挑んだ後、より強力な後継マシンの開発に着手した。「このマシンは、日本国内の主なスパコン関係者全員だけでなく、海外の事業体や大企業も関わる、かなりのものとなるでしょう」と松岡氏は語る。

エクサスケール成功に向けて協力

スーパーコンピューターの躍進は、東南アジアでも起こっている。2021年末、シンガポール国家スーパーコンピューティングセンター(NSCC)とシンガポール国立大学保健機構(NUHS)は、シンガポールの第3のスーパーコンピューターにつながる協定を発表した。PRESCIENCEと名付けられた新しいマシンは、ペタスケールのスーパーコンピューターであり、より良い医療の提供およびシンガポールの公共医療システムにおける現在の情報インフラの改善に特化して使用される。

毎年、世界中の公衆衛生システムが推定平均50ペタバイトという大量の患者データを生成し、保管している。このため、医療機関はこのデータを利用して機械学習とAIを使用すれば、患者の転帰に関する深い洞察を提供し、患者の健康状態の悪化に際し健康状態を改善する最善の治療コースを提供できる絶好の立場にある。NUHSはPRESCIENCEを使用し、それを行おうとしている。

NUHSとの現在の提携協定は、エクサスケール・コンピューティングへの移行などを含めてシンガポールのHPC研究環境を成長させ、成熟させようとするNSCCの大きなロードマップの一部である。

NSCCは、シンガポール独自のHPCリソースを構築し、まさに必要とされるエクサスケール・コンピュータを確立し、アクセスを提供しようとする長期的な取り組みに向けて、日本、フィンランド、オーストラリアのスーパーコンピューター・センターと協力して、すでに前に進んでいる。

これからの道

インドの国家スーパーコンピューティング・ミッション(NSM)は今年はじめ、インド工科大学ルールキー校(IIT Roorkee)のマシンである「PARAM」(サンスクリット語で「最高」)シリーズにおいて新しいペタスケール・スーパーコンピューター部分である「PARAM Ganga」の展開を発表した。1.66ペタフロップスで作動するこのマシンは、今年開始が予定される9つの新しいスーパーコンピューター・システムの1つである。

NSM の開始は2015年であり、それ以来、全国に15のシステムを展開している。インドで開発され製造された部品で構築された独自のスーパーコンピューター・システムを開発するというインド政府の野心的な目標に従い、さらに多くのマシンが計画されている。独自の技術の開発は、スーパーコンピューターの研究をさらに進め、公共・民間部門全体でインド独特の研究能力を高めるというインド政府の大きな目標の1つである。

インドの次のステップは、最終的にPARAMシリーズを通じて、現在のペタスケール・コンピューターからエクサスケール・コンピューターにアップスケールすることである。2024年に予定されているPARAM SHANKHエクサスケール・システムの立ち上げにより、この目標に徐々に近づきつつある。すると、インドの現在の最強マシンであるPARAM Siddhi-AI(LINPACK性能4.62ペタFLOPS)を追い越すことになる。

PARAM SHANKH の立ち上げのその時まで、インドの研究者やエンジニアは、エクサスケール コンピューターを支えるネイティブ アーキテクチャの開発と改善に取り組み続ける。インテル・ファウンドリー ・サービスおよび台湾積体電路製造 (TSMC) と国際的なパートナーシップを結び、インドはこの協力を通じてエクサスケール・コンピューターの進歩をさらに加速させる。

大きな進歩を続けているのはアジアだけではない。世界の他の地域も同様である。欧州連合(EU )では、 151.9 ペタフロップスの LINPACK 性能を持つフィンランドのLUMIシステムがTOP500リストの 第3位である。LUMI と米国のフロンティアは速度だけでなく電力効率も重視しており、どちらも TOP500 の中でもGREEN500のトップ3に入っている。

しかし、世界中のスーパーコンピューターの限界を検証しランク付けする際には、その存在意義を忘れてはならない。スーパーコンピューターは、速度を競うためだけに存在しているのではない。研究者たちが協力して世界の喫緊の課題の解決策を模索する時、仕事を効率的かつ効果的なものにするためにも存在しているのである。

CityU で計算とモデリングを加速

最近、世界的なedge-to-cloud企業であるヒューレット・パッカード・エンタープライズ (HPE) が構築した新しいHPCクラスターが香港城市大学(CityU)のキャンパスに届いた。CityU Burgundyと名付けられたこのスーパーコンピューター・クラスターは、同大学の以前のHPCリソースよりも10倍近く早い計算速度を実現し、生物医学から行動科学に至るまで、研究して発見を推し進めることができる。

CityU Burgundy は HPE Apollo 2000 および HPE Apollo 6500 Gen10 Plus システムを採用している。これらは、最適化された密度を持つ専用プラットフォームであり、要求レベルの高いHPCおよびAIアプリケーション用に設計されている。新しいクラスターには、328 個の AMD EPYC 7742 プロセッサ、56 個の Nvidia V100 Tensor Core 画像処理装置 (GPU)、および 8 個の Nvidia A100 80ギガバイトTensor Core GPUも搭載されている。 これらのコンポーネントを組み合わせることで、AIと機械学習の鍵となる画像分析、モデリング、およびシミュレーションの効率性を高めることができる。

CityU Burgundy は速度が大幅に向上しただけでなく、その設計により包括的な共同研究をサポートすることができる。HPCリソースを 1 つの場所に統合することで、集中型設備として機能するため、さまざまな関係者のアクセスを容易にすると同時にデータセンターのスペース要件を削減する。

生物医学研究者は、すでに新しい HPC クラスターを使用して、多様な集団からの遺伝データと環境データを統合している。この取り組みは、慢性疾患の複雑性をさらに理解し、新しい診断方法や治療方法を模索することを目的としている。

GPUの性能向上とレイテンシーの低下により、CityU Burgundyリソースは、新データ可視化プロジェクト、公共政策のための分析、消費者行動科学など、従来はHPCを使用する例はなかった他の分野にも適用されている。

HPC部門の最高科学責任者であるドミニク・チェン (Dominic Chien) 博士は「新しいHPCクラスターは、運用効率とコスト削減を実現しながら、香港で最も強力な学術用HPCプラットフォームの構築に一歩近づきました」と公表。「HPCは、世界レベルの研究チームを構築しサポートし、人類が科学上の大発見を続けるために重要な役割を担っています」

シンガポールの量子エコシステムをレベルアップ

デジタルイノベーションのハブとして繁栄するシンガポールは、量子コンピュータへの投資を増加させ、国の技術力を新たな高みに引き上げるために 3 つの国家プラットフォームを立ち上げた。これらは国家量子安全ネットワーク(NQSN)、国家量子コンピューティング・ハブ(NQCH)、および 国家量子ファブレス・ファンドリー(NQFF)という3つのイニシアチブのためのものである。

シンガポールの Research, Innovation and Enterprise 2020 (RIE2020) 計画に基づき、シンガポール国立研究財団 (NRF) の量子エンジニアリング・プログラムは2,350 万シンガポールドル以上を出資してこれらのプラットフォームを最大 3 年半支援すると約束した。

NQSN プロジェクトを率いているのはシンガポール国立大学(NUS)の量子技術センター (CQT) チームとシンガポールの南洋理工大学(NTU)であり、情報通信メディア開発庁 (IMDA) など15 を超える官民の協力者が参加している。NQSN は、機密データと重要なインフラを保護する堅牢なネットワーク・セキュリティの実現を目的として、量子安全通信技術に関する全国規模の試験を実施する。

CQT チームは、シンガポール科学技術研究庁(A*STAR) の高性能コンピューティング研究所 (IHPC) と共に、NQCH にも参加し、量子コンピュータのハードウェアとミドルウェアを開発している。これを支援するために、シンガポール国立スーパーコンピューティング・センター (NSCC) は、量子コンピューティング施設を運営し、金融、物流、化学などの産業用途を調査するリソースを提供する。

NQFFについては、A*STAR の材料研究工学研究所 (IMRE) が関係しており、計算、通信、およびセンシング用の部品材料と量子デバイスの製造に適用する微細加工技術を開発する。

NRF の CEO である ロー・テックセン (Low Teck Seng ) 教授は、「3 つの国家プラットフォームの立ち上げは、シンガポールがこれまで行ってきた量子技術への投資を基に、パートナー機関と密接に産業開発を行うという意図と野心を示しています」と述べた。これらの国家量子イニシアチは、人材育成と官民パートナーシップの構築により、シンガポール全土で量子イノベーションを実現する環境を作り上げることを想定している。

スーパーコンピューティング分野の拡大

2021年に世界全体の収益が420億米ドル(約6兆円)に達したHPC業界では、今後10年間、着実な成長が見込まれている。市場調査・コンサルティング会社であるEmergen Researchは、年平均成長率(CAGR)は6.2%であり、2030年までに市場規模は718億米ドルに達すると予測している。

一方、技術調査・アドバイス会社であるTechnavioは、2021 年から 2026 年にかけての世界のHPC市場の成長の中で、アジア太平洋地域は 49% を占めると予測している。同社はCAGRを一定の11.31%とすれば、予測期間全体で 271 億 5000 万米ドルの収益増加というさらに顕著な成長も予測している。

特に、クラウドコンピューティングとデータセンターの分野は、HPCの領域で成長の主要な原動力になる可能性を持つ。クラウドコンピューティングであれば、高コストでアクセスできないスーパーコンピューティング・リソースにも接続可能となるため、中小企業のHPCの導入を促進することができる。

ビッグデータ分析が増加する中、膨大な量のデータを保存・処理し、最終的には意味のある洞察を生成し、業界全体のデジタル化を加速するスーパーコンピューターサーバーとデータセンターが必要とされている。そのため、この分野は、企業や政府の間でさらに支持を得て、10 年間で HPC 市場の大幅な成長に拍車をかけると予測されている。

(2022年12月20日公開)

上へ戻る