arXiv cs.AI

B+ANN: ビリオンスケールのディスクベース最近傍インデックス

B+ANN: A Fast Billion-Scale Disk-based Nearest-Neighbor Index

http://arxiv.org/abs/2511.15557v1


本論文では、新しいディスクベースの最近傍インデックス「B+ANN」を提案します。これは、従来のHNSWアルゴリズムが抱える問題、すなわちメモリ内設計の制約やキャッシュの劣化、精緻なペアワイズ計算に起因する性能の限界を克服することを目的としています。B+ANNは、入力データを意味的に類似するアイテムでブロックに分割し、B+ツリーの変種でブロックをメモリとディスクに格納します。また、意味的操作における空間的・時間的局所性を改善し、キャッシュミスを削減し、ディスクベースの構築時間を大幅に短縮します。実験結果では、B+ANNはHNSWに比べてリコール値とクエリ処理性能が向上することが示され、類似性クエリだけでなく異なるクエリもサポートしています。