本研究では、ライセンスプレート(ナンバープレート)画像の復元に焦点を当てた新しい拡散モデル「CharDiff」を提案します。このモデルは、低品質のライセンスプレート画像の効果的な復元と認識を実現します。CharDiffは、外部のセグメンテーションと光学式文字認識(OCR)モジュールによって抽出された詳細なキャラクター・レベルの情報を利用し、キャラクターごとにマスキングされた注意機構(CHARM)を導入しています。この機構により、各キャラクターのガイダンスが自身の領域に限定され、他の領域との干渉を避けることができます。実験の結果、CharDiffは基準モデルに対し、復元の質と認識精度の両方で大幅な向上を示し、Roboflow-LPデータセット上で28%のCERの相対的な削減を達成しました。これにより、実際の使用環境における拡散ベースのライセンスプレート復元と認識の堅牢性が向上することが確認されました。