この記事では、テキストデータから潜在的な政治的立場を推定するための無監督および半監督の計算テキストベースの理想点推定(CT-IPE)アルゴリズムの体系的レビューを初めて行っています。これらのアルゴリズムは、政治学や社交科学など幅広い分野で使用されており、過去20年間にわたり、言葉の頻度モデルから大規模言語モデル(LLM)へと技術が進化しています。ただし、この発展により、アルゴリズム間の比較が不十分なfragmentedな領域が生じています。著者らは、25のCT-IPEアルゴリズムを特定し、分析した結果をもとに、言葉の頻度、トピックモデリング、単語埋め込み、LLMベースのアプローチの4つの方法論的ファミリーに分類しました。最終的に、アルゴリズムの選択に影響を与えるトレードオフを強調し、体系的なベンチマークの必要性を訴えています。これにより、さまざまな方法がどのように関連し、どのように使用されるべきかについての実践的な指針が提供されます。