arXiv cs.LG

ForensicFlow: 強靭なディープフェイク検出のための三モーダル適応ネットワーク

ForensicFlow: A Tri-Modal Adaptive Network for Robust Deepfake Detection

http://arxiv.org/abs/2511.14554v1


ディープフェイクは、高度な生成敵対ネットワーク(GAN)やオートエンコーダーによって生成され、情報の整合性や社会の安定性を脅かすリスクがあります。本研究では、ForensicFlowという三モーダルの法医学的フレームワークを提案し、RGB、テクスチャ、周波数の証拠を融合してビデオのディープフェイクを検出します。RGBブランチは視覚的な不整合を抽出し、テクスチャブランチは微細なブレンドアーティファクトを検出、周波数ブランチは周期的なスペクトルノイズを特定します。高証拠フレームを優先する注意ベースの時間的プーリングが活用され、適応的注意融合により、各ブランチのバランスが取られています。Celeb-DF (v2) データセットにおいて、ForensicFlowはAUC 0.9752、F1スコア0.9408、精度0.9208を達成し、単一ストリームのベースラインを上回ります。この研究は、微妙な偽造に対する優れた耐性を提供するための包括的な特徴融合を示しています。