【AsianScientist】AIに向けられる目、進化が社会を変える|その他アジア等コラム＆リポート|Science Portal Asia Pacific アジア・太平洋地域の科学技術の今を伝える

AIは膨大な計算能力に支えられて画期的な進歩を遂げ、患者ケアを提供する方法から、太陽光発電など再生可能エネルギー資源を活用する方法まで、社会のいくつもの分野を変えている。(2024年6月17日公開)

1982年、若手俳優のデビッド・ハッセルホフは自動運転車に座り、音声プロンプトだけで指示を与えた。ナイト2000（またはKITT）と呼ばれた自動車は、おそらく初めて人気テレビ番組に現れた人工知能 (AI) の一つであり、ハッセルホフが演じる登場人物に現代のアレクサのような反応をした。かつては現実離れしたSFの夢だったものは、超高速計算機能を持つ高性能コンピューティング (HPC) に支えられたAIの進歩によって可能になった。

今日、生成AI (GenAI) モデルの構築にはとてつもない計算機能が使用される。モデルのトレーニングにはテラバイトのデータが使用される。パラメータ数は数十億あり、中には一兆というパラメータ数を持つものもある。

それと同時に、クラウドコンピューティングにより革新的なAIツールへのアクセスが容易になり、企業が独自のAIソリューションを作成する能力を持てるようになっているため、HPCは一般的になってきている。

それが巡り巡ってスーパーコンピューターは自身の能力をレベルアップさせ、AIを使う設計ツールを動かし、ますます洗練された半導体チップの開発を加速させている。

ボットの戦い

OpenAIのChatGPTが2022年後半に爆発的に普及して以来、より複雑なタスクをより高い精度で達成できるGenAIを作ろうとテック企業がしのぎを削る中、大規模言語モデル (LLM) が次々とリリースされた。

中国のGenAI業界は太平洋全体で活気を見せている。中国の多くのハイテク企業は独自のLLMを構築して既存の製品とサービスにGenAIを搭載させて新しいものにしたり、クラウドでAIによるビジネスソリューションを提供したりしている。2023年10月の時点で、中国のハイテク分野は少なくとも130個のLLMを生産しており、これは世界全体の40％に該当する。

2023年3月、中国最大のインターネット企業の1つであるバイドゥは、独自のチャットボットであるErnie Botをリリースした。それ以来、Ernie Botは勢いを増し、5か月後に一般用サービスをリリースをして以来4500万人ものユーザーを獲得した。Ernie Botは音声プロンプトを使用してテレビコマーシャルを作成し、複雑な幾何学の問題を解き、ひねりの効いた武侠小説を書くことさえできる。

バイドゥは既存のユーザーベースを利用してErnieを使用し、バイドゥ検索エンジン、バイドゥマップ、クラウドコンピューティングサービスであるバイドゥクラウドなどの製品とサービスの再設計と再構築を行っている。バイドゥの代表者は、Ernieの基本モデルは、数兆個のデータポイントと数千億の知識ポイントに基づいて構築されたと述べている。

2023年10月、バイドゥは同社のチャットボットの最新バージョンであるErnie 4.0を発表した。発売時、バイドゥのCEOであるロビン・リー (Robin Li) 氏は、テキストと音声に応答するAIアシスタントが一人一人に合わせた検索結果を提供し、都市の地図を教え、クラウドドライブに保存したビデオに字幕を追加する方法を説明した。

バイドゥは一般消費者向けの製品だけでなく、金融、マーケティング、メディアなどの多様な分野の企業を対象とした、Qianfanを作成した。QianfanはAI向けのMaaS (Model-as-a-Service) クラウドプラットフォームである。

リー氏によると、Qianfanはバイドゥとその他のサードパーティが構築した基盤モデルへのアクセスも企業に提供しているため、計算能力とストレージに焦点を当てた他の一般向けククラウドサービスと対照的なものとなっている。Qianfanユーザーは独自のデータを使用してこれらのインストール済みLLMを微調整して、ニーズに合わせて自分に合ったソリューションを作成できる。

LLM分野で奮闘しているのはバイドゥだけではない。中国におけるGenAIの台頭は、中国の巨大ハイテク企業であるテンセントの副社長であるジエ・ジャン (Jie Jiang) 氏により「百モデル戦争」と名付けられた。同社は2023年9月に独自のモデルであるHunyuanをリリースした。Hunyuanは企業を念頭に開発され、中国企業はテンセントのクラウドプラットフォームを通じて利用できる。同社はまた、人気のモバイル・メッセージング・アプリであるWeChatなどの自社製品にもHunyuanを組み込んでいる。

その他、タオバオなど人気のeコマース・プラットフォームで有名なアリババも参戦している。2023年4月、アリババはTongyi Qianwenを抱えてGenAIブームに加わり、10月にはバージョン2.0に更新した。数億人のタオバオの買い物客には、会話をして一人一人に合わせたアドバイスをしてくれるパーソナルアシスタントが提供される。

アリババはまた、ニュージーランドに拠点を置くメタバース企業であるFutureverseと協力して、アリババの最新のAIプラットフォーム (PAI) を使い、Futureverseのテキストから音楽を生成するモデルであるJen-1のトレーニングを行っている。

医薬品探索に力を与える

医薬品開発は昔から骨が折れ費用のかかるプロセスであるが、AIは次の画期的な医薬品の探索についてもバイオ企業を導いている。通常、研究者はまず人体内の分子標的を探し回る。標的となるタンパク質や遺伝子に狙いを定め、数百万種類もの化合物をスクリーニングした後、有望ないくつかの化合物にたどり着く。これらの化合物は、動物実験を行う前に、研究室で最適化される必要がある。このような創薬段階は、ヒトでの臨床試験を開始する前に完了させるものであるが、実行可能な新薬候補を1つ得るのに、最長で6年、4億米ドル以上の費用がかかる。

AIはこれら厄介な手順の多くを引き継いで、創薬プロセスを加速することができるかもしれない。実際、香港に本社を持つバイオ企業であるInsilico Medicineは、世界初の完全にAI開発の小分子薬を作り出した。2023年半ばにヒト安全性試験をクリアした後で有効性評価を目的として、現在、第II相臨床試験に進んでいる。ヒト試験に入るまでに30か月もかからず、コストは一般的なもののわずか10分の1で済んだ。

特発性肺線維症と呼ばれる慢性肺疾患を対象とする医薬品を設計するために、InsilicoはAIを駆使したツール群を駆使し、標的発見から化合物生成までのステップに取り組んだ。特に、同社はChemistry42と呼ばれるGenAI医薬品設計エンジンを開発した。これは今まで見たことのない分子構造を数日で作り出す。完全に自動化されたプラットフォームにはNVIDIA V100TensorコアGPUが搭載され、クラウドとオンサイトの両方で展開できる。

一方、日本では、理化学研究所計算科学研究センター (R-CCS) と富士通が、アジアで最速のスーパーコンピューターである富岳を使い、次世代のIT創薬テクノロジーを開発している。最適化された医薬品を設計するにあたり、重要なことは、医薬品が標的タンパク質に効果的に結合するようにすることである。これにより、医薬品とタンパク質の相互作用のモデルを作ることがプロセスの重要なステップになる。しかし、タンパク質は非常に柔軟であり、多くの異なる立体構造を切り替え、他の分子に結合すると大きな構造変化を起こすことは珍しくない。

タンパク質の柔軟性の課題に取り組むために、R-CCSと富士通の共同プロジェクトでは、富士通のディープラーニングと理化学研究所のAI創薬シミュレーション技術を組み合わせている。このプロジェクトは2026年末までに医薬品タンパク質複合体を分析し、ハイスピードかつ高精度の技術で分子の大規模な構造変化を予測できるようになることを目的としている。

医師のためのペタスケール力

HPCは生物医学研究をサポートするだけでなく、研究で得た発見を研究室から臨床の場に送り込んでもいる。シンガポールの最新のペタスケールスーパーコンピューターであるPrescienceは、国の医療ニーズに取り組むように設計されたAIモデルを動かす。Prescienceは国立大学保健機構 (NUHS) とシンガポール国立スーパーコンピューティングセンター (NSCC) との協働の成果である。その基盤は国立大学病院 (NUH) に設置されており、2023年7月から稼働している。大規模なデータセットから患者の個人データを除去する必要性はなく、モデルトレーニングを高速化し、患者データ保護を強化する。

Prescienceは、膨大な量のデータを処理するためのGPU馬力として複数のNVIDIA DGX A100コンピュートノードを搭載しており、医療従事者向けのChatGPTとも言えるRUSSELLなどのLLMをトレーニングするよう調整されている。RUSSELLは、クリニカルノートの要約や紹介状の作成といった事務作業を自動化するだけでなく、臨床医の日常業務を支えるためにNUHSのプロトコル並びに医療情報及び名簿も含んでいる。

医師が適切な患者治療を計画し、リソースを最適に割り当てることができるよう、研究者たちはPrescienceを使用して患者の軌道予測モデルを構築している。このモデルは患者の入院期間を推定するために、患者に施した救急医療や入院初日に関する医師のクリニカルノートと検査の情報を取り込む。このモデルで重要なことは、予測に使用される要因を医師が容易に理解できるように説明してくれることである。

Prescienceは臨床医がワークフローを合理化するのを支援するだけでなく、歯科患者が写真映えする笑顔を得る役にも立つ。シンガポール国立大学口腔医療センター (Nucohs) は、口腔衛生を強化するためのスマートモニタリングとインテリジェント学習 (SMILE AI : Smart Monitoring and Intelligent Learning for Enhancing oral health) プロジェクトを通じて、デンタルチャートと歯周病リスクの予測という通常のタスクを高速化する機械学習モデルを構築するために、歯の画像を数百枚も収集している。

NUCOHSの歯周病予測モデルは上顎と下顎にX線を使用し、病気のリスク別に患者を層別化することを目的としている。予防医療を推進すれば、このモデルは国民全体に実装可能であり、多くの地域の歯科医師が疾患の発症前に介入できるようになる。

NUHSグループの最高技術責任者であるンギアム・キー・ユアン (Ngiam Kee Yuan) 教授は、Supercomputing Asia誌とのインタビューで「これらのモデルは、臨床医と患者の両方の役に立ちます。好ましい転帰をもたらし、待ち時間と費用を削減すると期待されています」と述べた。

気候の予測

このような医療の進歩があっても、一部の地域の医療システムでは記録的な熱波からもたらされた被害に、より多くの入院患者が発生し、死亡者さえも見られた。2023年、そのような熱波の一つがアジアを襲った。多くの国が40℃を超える気温を記録し、中国の新疆ウイグル自治区は7月に焼け焦げるかのような52.2℃を記録した。このような極端な気象事象は気候変動のせいで以前より頻繁に見られるようになり、農作物の収量は減り、地域が洪水に見舞われるようになった。

このような有害事象による損害を軽減しようと、AIを使う世界気候モデルは、予測をすることで適切な対抗戦略の設計を支援しようとしている。しかしながら、世界気候モデルの解像度は、地球を150kmから280kmの範囲の3Dグリッドセルに広く分割して得たものだが、地域の気候に関する詳細な情報を持たないことが多い。

このような限界を克服するために、オーストラリアのポージースーパーコンピューティングセンター (PSC) は、世界的な生物多様性ホットスポットである西オーストラリア州 (WA) の高解像度3kmグリッドモデルを作成している。ポージーの取り組みは、多施設パートナーシップである気候科学イニシアチブ (CSI) の一環であり、WA水資源環境規制省、マードック大学、ニューサウスウェールズ州政府も関係している。

PSCのエグゼクティブディレクターであるマーク・スティッケルズ (Mark Stickells) 氏はSupercomputing Asia誌のインタビューで、「解像度が高くなると、野火や洪水などの有害な気候イベントが地域に影響を与える時期と場所をより正確に予測できるようになります」と語った。

このプロジェクトは意欲的なものである。チームは、1950年から2100年にかけてのシミュレーションを行い、75年間の包括的な気候予測を行おうとしている。各シミュレーションは、2つの将来の気候シナリオと2つのモデリング構成を持つため、これには膨大な計算力が必要になる。

この巨大なタスクを引き受けるのは、南半球で最も強力なスーパーコンピューターであるポージーのセトニクスである。セトニクスは人間ならば15億年かかる計算を1秒で行う。セトニクスは、4000万コア時間と1.54ペタバイトのストレージ容量をCSIに割り当てている。これは、スーパーコンピューターの割り当てとしては最大のものの1つである。

シリコンでの成功を目指して進む

HPCは私たちの将来を守るための予測を行っているだけではなく、私たちの現在を進歩させるハードウェアも進化させている。半導体は、ポケットサイズのスマートフォンから大規模なスーパーコンピューティングセンターまで、技術の世界を動かし続ける。たとえば、日本の富岳は、富士通が設計した15万8976個のA64FX半導体チップを搭載して動作する。各システムのチップには、2つまたは4つのアシスタントコアを備えた48のコンピューティングコアが含まれており、強力なHPC専用プロセッサとして機能する。

AIが急速に進歩しているため、チップメーカーは厳しい納期のもとでさらに高い計算能力を要求されている。メーカーはこの需要に応えるために、シリコンチップ設計を高度なものにし、製造ワークフローを効率的にして絶えず革新を続けている。今日の半導体とスーパーコンピューターは共生関係にあり、AIはそのメーカーを支援するために介入している。

世界最大のチップメーカーの中には、TSMCやサムソンなど、プロセスを合理化するために電子設計自動化 (EDA) を活用しているところがある。これらアジアのチップメーカーは、EDA企業であるシノプシスと提携した。シノプシスは人間のエンジニアが小さなシリコン片に何十億ものトランジスタを配置する場所を特定するときに支援するAIツールを開発している。トランジスタの正確な配置がチップの性能に影響するため、この設計図は非常に重要である。

チップの複雑性が高まる中、さまざまな目標に応じて最適な設計にたどり着くために、エンジニアが手作業で何か月も繰り返し実験を行うことは珍しくない。EDAは設計の選択肢を絞り込むため、エンジニアは最も有望な設計に集中することができ、実験作業の負荷と時間を削減できる。また、シノプシスはEDAソフトウェアであるSynopsys DSO.ai™をマイクロソフトのクラウド・コンピューティング・プラットフォームであるAzure上で提供しており、企業はHPCを活用して迅速かつ優れた結果を得ることができる。チップメーカーはHPCとAIを利用して高速かつ消費電力の少ない次世代チップの開発に取り組んでいる。しかし、シリコンを使うならば、成功は限られている。シリコンは光を透過し、電気の伝導性が低いため、太陽電池のような光電子デバイスにはあまり適していない。現在、純粋な結晶シリコン太陽電池のエネルギー変換効率は、理論上29％が限界である。

有望な代替品を探す中、多くの研究者は、優れた光吸収特性を持つ結晶化合物の一種であるペロブスカイトに注目している。ペロブスカイトをシリコンの上に重ねたペロブスカイト・シリコン・タンデム (PST) 太陽電池は、異なる波長の光を吸収し、理論的には43％高い効率性を得ることができる。しかしながら、タンデムスタック構造は約572の組み合わせが考えられるため、安定した効率的なPST太陽電池を構築することは非常に困難である。

Nature Energy誌に発表された研究で、韓国の全南大学校の研究者たちが率いる国際チームは、ペロブスカイトセシウムヨウ化物 (CsPbI₃) の2つの異なる結晶構造（または多形）を積み重ねて太陽電池を製造した。CsPbI₃には4つの異なる多形があり、そのうち2つは光を吸収し太陽電池に有望である。ただし、光吸収性多形は、室温では非光吸収性多形に容易に変換し、太陽電池の効率を損なう可能性がある。

米国のペンシルバニア州立大学のRoarスーパーコンピューターによる計算シミュレーションを行ったところ、チームはCsPbI₃の2つの光吸収多形を一緒にすることで、歪みのない安定した原子界面を形成できることを発見した。この特性により、研究者はほぼ22％という高効率の太陽電池を作成することができた。室温で200時間保存した後でも効率性は安定した維持できる。

このような進歩により、HPCは1964年の最初の3メガフロップ・スーパーコンピューターから、今日のエクサスケール・スーパーコンピューターに進化した。それと同様に、1950年代初頭のチェスやチェッカーをプレイするAIプログラムは、LLMを搭載したチャットボットに道を譲った。HPCとAIは手を取り合って、この先数十年も間違いなく飛躍を続けるであろう。