arXiv cs.LG

畳み込み再帰神経ネットワークによる複数の移動音源の位置特定、検出、追跡

Localization, Detection and Tracking of Multiple Moving Sound Sources with a Convolutional Recurrent Neural Network

http://arxiv.org/abs/1904.12769v1


本論文では、畳み込み再帰神経ネットワーク(CRNN)を用いて、音イベントの位置特定、検出、追跡を同時に行う手法を探求しています。従来、静止音源の位置特定と検出に使用されていたCRNNを拡張し、再帰層が動的シーンでの移動音源の空間追跡を可能にすることを示しています。また、CRNNの追跡性能を、複数音源の方向推定器と粒子フィルタを組み合わせたスタンドアロン追跡手法と比較しています。異なる音響条件(無響室や残響のある環境など)や静止・移動する音源の速度、重複する音源の数においてそれぞれの性能を評価した結果、CRNNは多くの音源を一貫して追跡できる一方で、位置特定においては高い誤差が生じることが示されました。