本研究では、自然言語処理(NLP)におけるエンティティベースの処理に注目し、エンティティが特定の文脈で果たす役割を特定する「エンティティ役割検出」について述べています。エンティティの役割は、通常、人物、場所、組織などのタイプに依存するサブタイプであり、これらの役割に基づいてエンティティを取得する必要がある場合に問題が発生します。本論文は、エンティティ役割検出問題を名付けられたエンティティ認識(NER)およびエンティティの取得・ランキングタスクとしてモデル化する提案がなされています。役割は相互排他的なクラスとして扱われ、標準的なNER手法を用いてタグ付けが行われます。また、エンティティ取得においては、役割をクエリ、エンティティをコレクションとして定義し、代表的な単語やフレーズの自動学習を通じて役割とエンティティの表現を構築します。文脈に依存する役割の性質から、大規模なドメイン特化型データセットが必ずしも存在しないため、小規模データセットから情報を引き出し、ドメインに依存しない学習方法を模索しています。