本記事では、Vision Graph Neural Networks(ViGs)の進展に向けた新たな手法であるAdaptViGを提案します。ViGsは強力であるものの、グラフ構築フェーズにおける計算の複雑さが効率を妨げることがあります。AdaptViGは、Adaptive Graph Convolutionという新しいグラフ構築メカニズムを導入し、効率的な静的軸型スキャフォールドとコンテンツを意識した動的ゲーティング戦略であるExponential Decay Gatingを組み合わせています。このゲーティングメカニズムは、特徴の類似性に基づいて長距離接続を選択的に重み付けします。さらに、初期段階では効率的なゲーティングを、最終段階ではフルグローバルアテンションブロックを活用するハイブリッド戦略を用い、高い精度と効率のトレードオフを実現しています。具体的には、AdaptViG-Mは82.6%のトップ1精度を達成し、少ないパラメータで既存の技術を上回る成果を上げています。