台湾の国家科学及技術委員会(NSTC)は10月29日、台湾大学(NTU)が生成AIにおける暴力的表現や著作権侵害の防止を目的に、高リスクな概念を削除できる新技術「リセラー(Receler:Reliable Concept Erasing via Lightweight Erasers)」を開発したと発表した。
欧州コンピュータービジョン会議(ECCV)2024で発表されたこの技術は、NTU電気工学部のユーチャン・フランク・ワン(Yu-Chiang Frank Wang)教授の研究チームが、NSTCの支援を受けて開発した。リセラーは、生成モデル全体を再学習させることなく、流血や暴力、ディープフェイクによるなりすまし、特定アーティストやブランドの作風など、高リスクな概念を精密に削除できる。
生成AIは創造性を拡張する一方で、暴力的または露骨な画像、偽造や著作権侵害などの懸念が高まっている。従来のキーワードフィルターや手動審査では、問題のある出力を見逃したり、正当なコンテンツを誤って除外したりすることがあった。これに対し、リセラーは「暴力」などの概念を削除すると、AIが直接的または比喩的な指示を受けても同様の表現を再生成できなくなる。また、特定の作風(例:スタジオジブリ)を削除した場合、中立的で非侵害的な画像のみを生成するようになる。
リセラーはオープンソースとしてGitHubで無償公開されており、Google Scholarでの引用も増えている。NTUによると、AIプラットフォームや教育機関、企業、政府機関などが導入することで、創造性を維持しながらも、安全で倫理的に信頼できるAIシステムを構築できるという。台湾はAI安全を国家的優先事項と位置づけ、堅牢性やプライバシー保護を強化する研究を進めている。
サイエンスポータルアジアパシフィック編集部