本稿では、複雑なタブularデータの数値推論における課題に取り組むために、TabDSRという新しいフレームワークを提案しています。既存の大規模言語モデルは、複雑な問いやノイズの多いデータに対して性能が劣ることが多いため、TabDSRは以下の3つの要素から構成されています。1) 複雑な質問を分解するクエリ分解器、2) ノイズを除去するテーブル浄化器、3) 知識を基にしたプログラムを用いて最終結果を生成する推論器です。また、複雑な数値推論用の新しいデータセットCalTab151を導入し、これを用いた実験では従来の手法に比べ改善が確認され、特にTAT-QA、TableBenchにおいてはそれぞれ8.79%、6.08%、19.87%の精度向上を達成しました。さらに、TabDSRは主要な言語モデルとシームレスに統合でき、複雑な数値推論を支援するための強力な解決策となります。これにより、LLMのパフォーマンスが向上することが示されています。