arXiv cs.LG

神経ネットワークによるTSPソルバーのメカニスティック解釈可能性

Mechanistic Interpretability for Neural TSP Solvers

http://arxiv.org/abs/2510.21693v1


近年の神経ネットワークの進展により、組合せ最適化が進化し、Transformerベースのソルバーが旅行セールスマン問題(TSP)においてミリ秒単位で近似最適解を実現しています。しかし、これらのモデルはブラックボックスとして機能しており、学習する幾何学的パターンやツアー構築中に使用されるヒューリスティックについての洞察を提供しません。本研究では、稀な自己符号化器(SAE)というメカニスティック解釈技術をTSPソルバーに適用することにより、運用研究モデルへの解釈可能性手法の初の適用を行いました。100ノードのインスタンスに対して強化学習を用いてポインタネットワークを訓練し、その後エンコーダの残差ストリームにSAEを適合させることで、解釈可能な特徴の辞書を発見します。この分析により、ソルバーが自然に基本的なTSP概念を映し出す特徴を発展させることが分かりました。これらの発見は、神経TSPソルバーがノード選択前に何を計算しているかの初の内部説明を提供し、明示的な監視なしでも幾何学的構造が出現することを示唆しています。