arXiv cs.AI

MTIR-SQL:テキストからSQLへのマルチターンツール統合推論強化学習

MTIR-SQL: Multi-turn Tool-Integrated Reasoning Reinforcement Learning for Text-to-SQL

http://arxiv.org/abs/2510.25510v1


本論文では、テキストからSQLへのタスクに対して、従来の静的な実行フィードバックに依存する方法の問題点を解決するために、MTIR-SQLという新しいフレームワークを提案しています。MTIR-SQLは、動的フィードバックを反映した実行意識のあるマルチターン推論パラダイムを導入し、各推論ステップでデータベース実行フィードバックを組み込むことを可能にします。これにより、文脈に応じたクエリ生成と推論プロセス中の進行的な精緻化が実現されます。実験結果によると、MTIR-SQLは4Bパラメータを持ち、BIRD Devで64.4%、SPIDER Devで84.6%の実行精度を達成し、既存のアプローチを大きく上回る性能を示しました。この手法は、GRPOアルゴリズムを複雑なマルチターンの相互作用シナリオに対応させるために拡張しており、安定性の向上にも貢献しています。