arXiv cs.AI

LLMを用いた反実仮想シミュレーションによるオンラインモデレーションの評価

Evaluating Online Moderation Via LLM-Powered Counterfactual Simulations

http://arxiv.org/abs/2511.07204v1


この記事では、オンラインソーシャルネットワーク(OSN)におけるコンテンツモデレーションの効果を評価する新しいアプローチを提案しています。従来の方法ではデータ収集や実験制御のコストが高いため、モデレーションの実際の効果は明確ではありませんでした。著者たちは、大規模言語モデル(LLM)を活用して、人間のような社会行動を模擬するシミュレーターを設計しました。このシミュレーションでは、モデレーション介入が有害な行動に与える影響を実験的に検証します。実験の結果、OSNエージェントの心理的リアリズム、社会的感染現象の出現、個別化されたモデレーション戦略の優れた効果が明らかになりました。この研究は、AAAI人工知能会議2026で発表されました。