本論文では、歩行者-車両事故における安全性向上を目的とした「多視点フェーズ認識歩行者-車両事故推論フレームワーク(MP-PVIR)」を提案します。歩行者は交通死亡者の20%以上を占め、事故発生時の状況を理解することが求められています。既存のシステムは事故の発生を検出することはできるものの、事故が展開される過程を解析する能力が乏しいです。MP-PVIRは、イベントトリガーに基づいた多視点動画の収集、歩行者行動のフェーズ分割、フェーズ毎の多視点推論、そして階層的な合成・診断を4つのステージで実行します。特に、行動フェーズの分割にはTG-VLMを、フェーズに基づく多視点分析にはPhaVR-VLMを使用し、詳細な報告書を生成するために大規模言語モデルを活用します。評価実験では、MP-PVIRが多視点動画から実用的な洞察を引き出す能力を示し、AI駆動の交通安全分析の進展に寄与することを確認しました。