arXiv cs.AI

フィッシングウェブサイト検出のための小型言語モデル: コスト、パフォーマンス、プライバシーのトレードオフ

Small Language Models for Phishing Website Detection: Cost, Performance, and Privacy Trade-Offs

http://arxiv.org/abs/2511.15434v1


フィッシングウェブサイトは重大なサイバーセキュリティの脅威で、ユーザーを騙して大きな財務的及び組織的損害を引き起こします。従来の機械学習手法では、特徴エンジニアリングや継続的な再訓練、大規模なインフラ維持が必要です。一方で、大型のプロプライエタリ言語モデル(LLMs)は高い分類精度を持ちながら、その運用コストや外部サービスへの依存が実用面での課題とされています。本研究では、フィッシング検出のために小型言語モデル(SLMs)の利用可能性を探求し、15種類のSLMを評価しました。その結果、SLMは最新のLLMに比べてパフォーマンスは劣るものの、コスト効率が良く、データ管理の制御が可能であることが示されました。これにより、セキュリティと経済的実用性のバランスを取るための将来研究の基盤が築かれました。