Treble10は、遠距離音声認識、デリバーベレーション、音声強調、および音源分離のための高品質なルームアコースティックデータセットです。既存のデータセットは、音響リアリズムとスケーラビリティのトレードオフに制約されていますが、Treble10は3000以上のブロードバンドルームインパルス応答(RIR)を10の実際の部屋でシミュレートしています。このデータセットは、モノラル、8次元アンビソニクス、6チャンネルデバイスRIRなど6つの補完的サブセットを提供し、LibriSpeechの発話とペアになった反響音声シーンも含まれています。信号は32kHzでシミュレーションされ、低周波数の波効果や高周波数の反射を正確にモデル化しています。Treble10は、測定とシミュレーションのリアリズムのギャップを埋め、次世代のシミュレーション駆動のオーディオ研究のベンチマークおよびテンプレートとして利用できます。データセットはHugging Face Hubを通じて公開されており、広範なデータ拡張を可能にします。