arXiv cs.AI

画像検索のためのASICエンジン上での深層畳み込みニューラルネットワークの2ビットモデル圧縮

2-bit Model Compression of Deep Convolutional Neural Network on ASIC Engine for Image Retrieval

http://arxiv.org/abs/1905.03362v1


この記事では、画像検索における深層畳み込みニューラルネットワーク(CNN)のモデルを2ビットに圧縮する方法を提案しています。CNNは画像の特徴を抽出するために広く使用されていますが、ストレージへの要求が高く、低消費電力のハードウェア実装において課題となっています。この問題を解決するために、ASICチップ上での深層モデルの量子化と圧縮を行い、わずか2ビットの重みを用いても浮動小数点モデルと同等の性能を発揮できることを示しています。また、大規模な画像を処理する際のチップのバッファサイズの制限を考慮し、改良されたプーリング手法「領域ネスト不変プーリング(RNIP)」を提案し、CNNにおける小さなサブ画像を活用します。この手法を用いることで、チップ上で大規模画像の効果的な検索が可能であることが示されています。