状態空間モデル(SSMs)は、シーケンスモデリングにおけるトランスフォーマーの主要な代替手段となっていますが、真の長形式生成問題を正確に解決することができないという制限があります。しかし、外部ツールへのインタラクティブアクセスを許可することで、この制限を緩和できることを示しています。適切なツールと問題依存のトレーニングデータを用いることで、SSMsは任意のサイズの問題に対して解決策を学び、長さの一般化を実現できると述べています。実際の研究では、ツールを拡張したSSMsが算術、推論、コーディングのタスクにおいて優れた長さの一般化を達成したことが示されています。この発見により、SSMsはツールに基づくインタラクティブな設定においてトランスフォーマーに対する効率的な代替手段となる可能性が強調されています。