arXiv cs.AI

特定領域の知識グラフ構築のための大規模言語モデルの教師ありファインチューニング:湖南の歴史的人物に関するケーススタディ

Supervised Fine Tuning of Large Language Models for Domain Specific Knowledge Graph Construction:A Case Study on Hunan's Historical Celebrities

http://arxiv.org/abs/2511.17012v1


この記事では、湖南省の歴史的人物を対象にした特定領域の知識グラフ構築のための大規模言語モデルの教師ありファインチューニングについて述べています。大規模言語モデルと知識グラフは、文化遺産の抽出や分析において大きな可能性を持っていますが、特に湖南の歴史的人物に関するデータが不足しているため、一般的なモデルは十分なパフォーマンスを発揮できません。この研究は、特定領域の情報抽出を強化するために、湖南の歴史的人物に特化した細かなスキーマガイドの指示テンプレートを設計し、指示調整データセットを構築しました。その結果、Qwen3-8Bモデルが最も優れた性能を示し、ファインチューニング後に顕著な改善を観察しました。この研究は、地域の歴史・文化領域に特化した大規模言語モデルのファインチューニングに新たな洞察を提供し、文化遺産の知識抽出と知識グラフ構築におけるコスト効果の高い応用の可能性を強調しています。