ソフトウェアの保守やモダナイゼーションにおいて、ソースコードの目的を理解することは重要なタスクです。本記事では、自然言語のアーティファクトをGitHubから活用し、大規模言語モデル(LLM)を用いたコード理解を向上させる新たなアプローチを提案しています。このシステムは、関連するGitHubの文脈を抽出・構造化するコンポーネント、高度なコード説明を生成するコンポーネント、説明を検証するコンポーネントの3つから成り立っており、AI支援開発ツールとの統合が可能です。特に、生成されたインサイトが有用で非自明であることがユーザースタディで示されており、ハリュシネーションがないことが確認されています。