2025年6月30日 斎藤 至(JSTアジア・太平洋総合研究センター フェロー)
シンガポールは人工知能(AI)に関する高度なガバナンスで世界でも最高水準の安全性を担保し、新たに開発されるAIモデルの安全性を検証するツール「AI Verify」を開発・提供している。英語・北京語・マレー語・タミル語の4つを公用語とする多民族国家で、アジア・太平洋地域の金融センターでもある同国では、多言語に対応するAIが待望されてきた。
現在、国家主導の大規模言語モデル(LLM)プログラムの一環として、東南アジア諸語を処理でき、多様なデータソースを処理してアウトプットを実行できるマルチモーダルAIが登場している。その旗艦モデルが、SEA LiON(シーライオン、Southeast Asian Languages in One Networkの頭字語)とMERaLiON(マーライオン、Multimodal Empathetic Reasoning and Learning in One Networkの頭字語)である。いずれも、東南アジア諸語の学習データを一定程度含み、国の象徴である架空の動物名を冠している。
SEA LiONは、国の主要大学・研究機関の共同研究プログラムであるAIシンガポールで開発され、2023年12月にv1が発表された。自然言語処理の基本的な機能(翻訳、要約、質疑応答、コード記述)を備え、東南アジア諸語の学習データは総学習データの約13%を占める。
MERaLiONは、A*STAR(科学技術研究庁)の情報通信技術研究所(I2R)が米Microsoft社と共同開発を進めているマルチモーダルLLMである。国家研究基金(NRF)および情報メディア開発庁(IMDA)の支援を受け、Microsoft社のクラウドコンピューティングAzureの上で稼働する。英語(標準およびシンガポール訛り)・北京語の各言語に対応し、文字起こし・翻訳・要約・質疑応答機能を備える。2024年12月に発表されたオーディオLLM v1では、従来の小規模モデルAIが不得意とする「文脈的理解」と「異なるタスクに跨る汎用性」を高めるため、言語・画像・映像などの多様なデータソースを単一の枠組みに統合し、方言を含む高度な言語処理にも対応している。
2025年5月に発表されたMERaLiONのオーディオLLM v2では、対応言語がマレー語・タミル語・インドネシア語・ベトナム語に拡張され、1つの会話で多言語が入り交じる場合の言語処理も可能となった。更に、パラ言語的要素(身振り手振り、イントネーション、声量、音程)の処理に加えて、ユーザーである人間の感情を認識し応答する共感能力(empathy)あるいは感情的知性(EI)も備わった。
ATxSummit 2025(IMDAが主催するAsia Tech x Singapore [ATxSG] 2025の旗艦イベント)において、MERaLiONを開発・支援するA*STAR I2RとIMDAは、シンガポール発AIモデルを様々な科学分野や産業領域に適用し実践的開発を加速すべく、主要な政府系組織を束ねるコンソーシアムの設立を発表した。現在の参加機関は、公衆衛生や国民の保健に携わる保健省(MOHT)、国民の安全を担うホームチーム科学技術庁(HTX)、大規模計算機ASPIREを所掌する国立スパコンセンター(NSCC)である。テック系企業、研究機関、業界のリードユーザーを対象として、参加機関を継続的に募集している。
シンガポールの多言語LLM開発事例が持つ意義は、単に近隣諸国の言語文化をカバーするという文化的側面にとどまらない。多言語に対応したモデル設計は、ユーザーが増えるほどフィードバックをより多く得られ、予測の精度を高める「データネットワーク効果」を持つことになる。低リソース言語(注釈付きデータセット、計算機資源、オンラインコンテンツに乏しい言語)の話者も含む利用者群であれば、データネットワーク効果はAIモデルの言語的汎用性を高める。
シンガポール首相府が2024年に発表した国家構想であるスマート・ネイション2.0は、AIを基盤に据えると明示している。言語的汎用性の高いAIモデルが普及・浸透すれば、AIハブとしての同国の位置は、東南アジア地域において益々高まるに違いない。