脳の老化を構造的MRIから正確に推定することは、加齢や神経変性研究において価値のあるバイオマーカーです。従来の回帰やCNNベースの手法は、手動による特徴選択や過学習の問題があります。本研究では、視覚トランスフォーマー(ViT)のグローバルコンテキストモデリングと残差CNNのローカル改善を兼ね備えたハイブリッドアーキテクチャBrainRotViTを提案します。ViTエンコーダーは年齢・性別分類タスクで事前学習され、その後、2Dの埋め込みベクトルが生成されます。このベクトルは、性別を考慮した残差CNN回帰器に渡され、脳年齢を推定します。この手法は、11のMRIデータセットでMAE3.34歳(相関係数r=0.98)を達成し、最先端モデルを凌駕しました。また、脳年齢のギャップ分析では、加齢パターンがアルツハイマー病や自閉症などと関連していることが示されています。これにより、この手法は脳年齢予測の効率的で解釈可能なモデルを提供し、新たな研究の道を開きます。