arXiv cs.AI

MAGNET: コードクローン検出のためのマルチグラフ注意ネットワーク

MAGNET: A Multi-Graph Attentional Network for Code Clone Detection

http://arxiv.org/abs/2510.24241v1


コードクローン検出はソフトウェア工学における基本的なタスクであり、リファクタリングやデバッグ、著作権侵害の検出、脆弱性分析の基盤となります。従来の手法は抽象構文木(AST)、制御フローグラフ(CFG)、データフローグラフ(DFG)などの単一の表現に依存しており、コードの意味を部分的にしか捉えられませんでした。本研究では、AST、CFG、DFGの表現を統合的に活用し、ソースコードの構文的および意味的特徴を捉える「MAGNET」というマルチグラフ注意フレームワークを提案します。MAGNETは、残差グラフニューラルネットワークとノードレベルの自己注意を用いてローカルおよび長距離の依存関係を学習し、ゲーテッド交差注意メカニズムを導入してグラフ間の細かな相互作用を実現しています。実験結果では、BigCloneBenchおよびGoogle Code Jamのデータセットで96.5%および99.2%のF1スコアを達成し、マルチグラフ融合の重要性も確認されました。