arXiv cs.AI

事実とは何か?犯罪裁判所の意見からの裁判で確立された事実の自動抽出

What Are the Facts? Automated Extraction of Court-Established Facts from Criminal-Court Opinions

http://arxiv.org/abs/2511.05320v1


本記事では、スロバキアの公開裁判決定から犯罪行為の記述を自動抽出する可行性を探ります。犯罪司法に関するデータは限られた情報しか含んでいませんが、判決の中には豊富な情報が存在します。抽出には、通常の正規表現と大規模言語モデル(LLM)の二つのアプローチを使用しました。正規表現を使った基本的手法では判決の40.5%しか認識できませんでしたが、進化した正規表現とLLMを用いると、それぞれ97%と98.75%、組み合わせると99.5%の精度が達成されました。法学生による評価では、先進的な手法は人間の注釈と約90%一致し、LLMは91.75%の一致率を示しました。これにより、法律の専門家に近い精度で裁判所の記録から事実を抽出できる可能性が確認されました。