習慣行動と目標志向行動を一体化したAI手法を開発 OIST

米国科学振興協会(AAAS)のオンラインニュースサービス「Eurekalert!」は6月16日、沖縄科学技術大学院大学(OIST)と上海のマイクロソフトリサーチアジア(Microsoft Research Asia)の研究チームが、習慣行動と目標志向行動の2つのシステムが互いに助け合って学習する新たなAI手法を開発したと発表した。この研究成果は、Nature Communicationsに掲載された。

心理学や神経科学では、行動は、素早く単純だが柔軟性に欠ける習慣行動と、柔軟性はあるが遅い目標指向行動の2種類に分けられる。これらの行動は、脳内の別々のシステムによって制御されていると考えられているが、それぞれ対立するものなのか、助け合うものなのかは現在も議論が分かれている。

研究チームは、「能動的推論」の理論に基づき、強化学習のAIエージェント向けに習慣的な学習行動システムと目標志向的な学習行動システムを一体化したモデルを開発した。マウスによる迷路の探索を模したコンピューターシミュレーションでこのモデルをテストしたところ、2つのシステムが一体となって働くことで、AIエージェントが適応行動を素早く達成できることが明らかになった。従来のAIアプローチでは、可能性のあるすべての目標を学習に明示的に含める必要があるが、開発されたモデルは習慣行動の組み合わせを利用することで、明示的な学習なしに効率的に目標を達成できる。

この研究成果は、AI分野において素早く確実に適応できるシステムの開発に道を開くだけでなく、神経科学と心理学の分野において人間がどのように意思決定を行っているかを解明する手がかりとなる。

サイエンスポータルアジアパシフィック編集部

上へ戻る