arXiv cs.LG

パラメータプルーニングと量子化技術による深層学習ベースの音声強調モデルのコンパクト化の向上

Increasing Compactness Of Deep Learning Based Speech Enhancement Models With Parameter Pruning And Quantization Techniques

http://arxiv.org/abs/1906.01078v2


最近の研究は主に深層学習を用いた音声強調(SE)のノイズ除去性能の向上に焦点を当てていますが、実際の利用シーンではノイズ除去性能と計算コストとのバランスが重要です。本研究では、冗長なチャネルを削除する新しいパラメータプルーニング(PP)技術を提案し、また少ないクラスターセントロイドで重みを表現するパラメータ量子化(PQ)技術を適用しました。これらの技術は異なる概念に基づいているため、PPとPQを統合することでさらにコンパクトなSEモデルが得られます。実験結果では、PPとPQ技術を用いたモデルはオリジナルモデルのサイズの10.03%となり、STOIで1.43%(0.70から0.69に)、PESQで3.24%(1.85から1.79に)のわずかな性能低下を示しました。この結果は、ストレージや計算資源が限られたデバイスでのSEシステムにこれらの技術が利用できる可能性を示唆しています。