この記事では、自動音声認識(ASR)や音声翻訳(ST)のタスクにおける最小ベイズリスク(MBR)デコーディングの有効性を評価しています。従来のビームサーチに比べて、MBRデコーディングは、機械翻訳やテキスト要約といったテキスト生成タスクで効果的であることが示されていますが、音声からテキストへのタスクには十分に適用されていません。本研究では、Whisperおよびその派生モデルを用いて、英語と日本語のASRおよびSTの設定でMBRデコーディングの精度を評価したところ、ほとんどの実験設定においてMBRデコーディングがビームサーチを上回る精度を示しました。これにより、MBRデコーディングは高い精度を必要とするオフラインASRおよびSTタスクにおいて有 promising な手法であることが明らかになりました。