2025年11月
トップ  > 韓国科学技術ニュース> 2025年11月

マルチモーダルAIの新しいデータ拡張手法を開発 韓国KAIST

韓国科学技術院(KAIST)は10月14日、複数の感覚情報を同時に処理するマルチモーダル人工知能(AI)が、テキストと画像を均等に認識できるようにする新しいデータ拡張手法を開発したと発表した。

(左から)修士課程チェ・ソヨン(Soyoung Choi)氏、博士課程ファン・ソンヒョン(Seong-Hyeon Hwang)氏、スティーブン・ウィジョン・ファン(Steven Euijong Whang)教授

マルチモーダルAIは、テキストや映像など異なる種類の情報を組み合わせて判断するが、既存モデルは特定のデータ型に偏りやすく、精度の低下を招くことが課題となっていた。KAIST電気工学部のスティーブン・ウィジョン・ファン(Steven Euijong Whang)教授の研究チームは、あえて内容が一致しないデータペアを用いてAIを訓練する手法を開発した。この方法により、AIは文脈に依存せず、テキスト・画像・音声といった複数のモダリティを均等に活用できるようになったという。

さらに研究チームは、低品質データを補正しつつ難易度の高い例に重点を置く学習戦略を組み込み、モデルの安定性を高めた。この手法は特定のモデル構造に依存せず、さまざまなデータタイプに容易に適用できる汎用性を持つ。

データ中心型マルチモーダルAI訓練フレームワークによるモデル予測の変化
(出典:いずれもKAIST)

同教授は「AIの性能向上には、モデルやアルゴリズムを変えるだけでなく、学習に用いるデータの設計と運用が重要です。本研究は、データそのものの設計を通じて、AIが画像やテキストなど特定の情報に偏らずに学習できることを示しています」と述べた。

本研究は、博士課程のファン・ソンヒョン(Seong-Hyeon Hwang)氏と修士課程のチェ・ソヨン(Soyoung Choi)氏が共同で主導し、同教授が責任著者を務めた。研究成果は、12月に米国サンディエゴおよびメキシコシティで開催されるAI国際会議NeurIPS 2025で発表される予定だ。研究は韓国の情報通信企画評価院(IITP)の支援を受けて実施された。

サイエンスポータルアジアパシフィック編集部

  • アジア・太平洋総合研究センター
  • Science Japan
  • 客観日本
上へ戻る