本研究では、Leave-One-Out(LOO)による特徴の重要性評価とLayer-Wise Relevance Propagation(LRP)の効率の良さを比較し、LRPの限界を明らかにしています。具体的には、最近のAttnLRPの進展で使用される二次元伝播ルールが実装の不変性公理に違反することを証明し、線形注意層での実証結果を示しました。また、CP-LRPを診断基準として再評価し、ソフトマックス層を通さずに関連性を伝播させることで、特に中間から後期のトランスフォーマー層においてLOOとの整合性が向上することを確認しました。全体的に、LRPがLOOを近似する能力には、二次元因子分解の感度とソフトマックス伝播エラーが影響を与える可能性があることが示されています。