急速に進展する都市化に伴い、各種センサーからの交通信号は都市の状態を監視する上で重要な役割を果たしており、安全な移動や交通渋滞の緩和、都市のモビリティ最適化に寄与しています。従来の交通信号モデルでは、センサーからの数値データに依存する単一モダリティアプローチが主流ですが、これにより異なる視点から得られる意味情報が失われ、交通信号の理解と複雑な交通ダイナミクスの予測が制限されています。本研究では、多様な視点からの特徴を学ぶ新たな多モーダルフレームワーク「MTP」を提案します。視覚、数値、テキストの三つの視点から情報を融合し、特に視覚的データの強化やテキストの増強を行います。実験結果は、従来の手法と比べて優れた性能を示しました。