2024年01月
トップ  > 韓国科学技術ニュース> 2024年01月

タンパク質の酵素番号(EC番号)を予測するAI開発 韓国

韓国科学技術院(KAIST)は米カリフォルニア大学サンディエゴ校(UCSD)と共同で、タンパク質の酵素番号(Enzyme Commission numbers:EC番号)を予測できる人工知能(AI)を開発した。この研究成果は、Nature Communicationsに掲載された。

タンパク質の機能予測をはじめ、生物学的配列の特徴を解析するために、ディープラーニングに基づいたさまざまな方法論が開発されているが、大半は、AIの推論過程を解釈できないというブラックボックスの問題を抱える。また、AIを利用した酵素機能予測システムも報告されているが、このブラックボックス問題を解決していないか、推論過程をきめ細かなレベルで解釈できないという欠点がある。

KAISTの化学・生体分子工学科(Department of Chemical and Biomolecular Engineering)のイ・サンヨプ(Lee Sang Yup)特別教授とUCSDのベルンハルト・パルソン(Bernhard Palsson)教授率いる共同研究チームが開発した「DeepECtransformer」は、ディープラーニングとタンパク質相同性解析モジュールを活用して、特定のタンパク質配列の酵素機能を予測する。さらに、自然言語処理で一般に使用されるトランスフォーマーアーキテクチャも利用して、酵素機能に関する重要な特徴をタンパク質配列全体に照らして抽出することによって、EC番号を正確に予測できるようになり、合計5,360種類のEC番号の予測が可能となった。

共同研究チームはさらに、トランスフォーマーのアーキテクチャを解析し、推論プロセスにおいてAIが、酵素機能にとって重要な触媒活性部位や補因子結合部位の情報を利用していることを発見した。そして、DeepECtransformerのブラックボックスの解析を通じ、AIがその学習過程で酵素機能にとって重要な特徴を自身で特定できることを確認した。

イ教授は、開発されたDeepECtransformerを利用することで、「環境に優しい化学物質を生産する微生物細胞工場の開発が可能になる」との期待を示した。

DeepECtransformerの人工ニューラルネットワークの構造
(出典:KAIST)

(2023年11月24日付発表)

サイエンスポータルアジアパシフィック編集部

上へ戻る