インドでは、デジタルサービス開発に向けて121の言語を、人工知能(AI)に取り込むプロジェクト「Bhashini」が進んでいる。
インドでは22の公用語と、1万人以上が話す121の言語があるが、自然言語処理によってカバーされている言語はわずかである。それゆえ、何億人ものインド人が有益な情報や多くの経済的機会から排除されている。
Bhashiniは、AIとイメージング技術を活用した言語翻訳システムであり、国家公共デジタルプラットフォームを構築することを目指す試みだ。さまざまな言語で文章を投稿し、他人が書き起こした文章や音声を検証し、文章や画像のラベルを翻訳するクラウドソーシングを行い、現在までに、数万人のインド人がこのプラットフォームに積極的に貢献している。
インドでは読み書きが苦手な人がいる。そのため、さまざまなAIモデルが音声と音声認識に集中している。ムンバイにあるIndian Language Technology Labの計算責任者であるプッシュパック・バタチャリヤ(Pushpak Bhattacharya)氏は、「政府は、インドの言語で大規模な言語モデルを訓練するためのデータセットを作成することを非常に強く推進してます。しかし、インドの言語は主に口承の伝統があり、電子記録は豊富ではなく、コードミキシング(言語の混ざり合い)も多いことが課題です」と話した。
クラウドソーシングは便利な一方で、ワーカーを教育し、報酬を支払い、より小さな言語を収集するための特別な努力をするなど、倫理的に行われなければ規模は拡大しない。テック系企業のKarya社もインドの言語の話者の音声データを生成・保存している企業であり、さまざまなサービスにAIを統合するために必要なデータセットを構築している。
同社の共同設立者であるサフィア・フセイン(Safiya Husain)氏は、「Karya社で働く人々は、自分たちが生成したデータの一部を所有することで、ロイヤリティを得ることができ、ヘルスケアや農業などの分野で、そのデータを使ってコミュニティのためのAI製品を構築できる可能性があります。例えば、1時間のオディア語の音声データは、以前は3~4ドルでしたが、今は40ドルです」と話した。
インドのAI関連のポータルサイトINDIAaiが2023年12月20日付で伝えた。
サイエンスポータルアジアパシフィック編集部