アラビア語の子供向け音声認識データセット：Arabic Little STT

本記事では、アラビア語における子供向け音声認識用データセット「Arabic Little STT」の構築について述べています。このデータセットは、レヴァンティーノアラビア語を話す288人の子供（6~13歳）から収録された355の発話を含んでいます。アラビア語はリソース不足の言語であり、特に子供の音声データが乏しく、AI技術の発展において大きな課題となっています。本研究では、最新の自動音声認識モデル「Whisper」の性能評価を行い、成人用のデータセットとの比較を実施しました。その結果、子供の音声に対する誤り率は0.66と、成人のデータセット（0.20未満）に比べて大幅に高いことが示され、子供向け音声データの必要性とともに、それらの倫理的かつプライバシーに配慮した取り扱いの重要性が強調されました。この研究がアラビア語を話す子供たちのための公正な音声技術開発の初期ステップとなることを期待しています。