韓国科学技術院(KAIST)は6月14日、KAISTの材料科学・工学科のイ・コンジェ(Lee Keon Jae)教授が率いる研究チームが、遠距離の音声を正確に識別できる圧電音響センサーを開発したと発表した。研究の成果はScience Advancesに掲載された。
内耳の蝸牛(かぎゅう)にある基底膜の構造を模した、超薄型の共振圧電膜を使用している。スマートフォン等のデバイスでの使用を見込み、商用化に向けた最初のプロトタイプが完成した。
圧電音響センサーの概念図(a)、機械学習に基づく生体音声認証(b)、モバイルサイズの商用化プロトタイプ(c)
画像提供:KAIST
イ教授らはこのセンサーの最初のコンセプトを2018年に発表していたが、今回、高感度で超薄型の圧電膜を材料に用いることで、モバイルサイズにまで小型化することに成功した。シミュレーションにより、無機圧電薄膜の下の高分子超薄膜によって共振の帯域幅が拡大され、7つのチャネルを用いて音声の周波数の全範囲を網羅できることが確認されたという。
このセンサーをモバイルデバイスの機械学習に基づく生体認証や音声処理機能に使用した実験では、遠距離の話者の音声を高い精度で識別することに成功した。話者識別の誤り率は、微小電子機械(microelectromechanical system: MEMS)マイクと比較して、学習用データセット150件の学習では56%、2,800件では75%と、大幅に減少した。
今回開発されたセンサーは、グーグルで進行中の「ウルヴァリン(Wolverine)プロジェクト」に最適だという。このプロジェクトでは、遠距離から複数のユーザーの声を聞き分ける次世代AI(人工知能)ユーザーインターフェイス向けの技術を研究している。
イ教授はセンサーの商用化のために「フロニクス(Fronics)」という企業を設立し、世界のAI企業との協業を目指している。
サイエンスポータルアジアパシフィック編集部