フルオロピリミジンは大腸癌や乳癌の治療に広く使用されていますが、手足症候群や心毒性などの有害事象が関連しています。本研究では、臨床ノートに埋め込まれた治療と毒性情報を抽出するための自然言語処理(NLP)手法の開発と評価を行いました。236の臨床ノートから成るゴールドスタンダードデータセットを作成し、治療レジメンと毒性に関連するカテゴリーを専門家が注釈しました。NLPアプローチとして、ルールベース、機械学習、深層学習、及び大規模言語モデルを用いました。結果として、大規模言語モデルが他の手法を上回る性能を示し、特にフルオロピリミジンの治療と毒性に関する情報の抽出において高い精度を達成しました。機械学習や深層学習の手法は小規模なトレーニングデータによる限界がありました。これにより、大規模言語モデルが臨床研究や薬剤監視において強力な支援を提供する可能性が示されました。