arXiv cs.LG

感情テキストにおける責任ある合成データ生成のための解釈可能性ガイドフレームワーク

An Interpretability-Guided Framework for Responsible Synthetic Data Generation in Emotional Text

http://arxiv.org/abs/2511.16132v1


本記事では、ソーシャルメディアからの感情認識の重要性と、訓練データの入手が難しくなっている現状について述べています。著者らは、Shapley Additive Explanations (SHAP) を活用した解釈可能性ガイドフレームワークを提案し、これにより、大規模言語モデル(LLM)に基づいた合成データ生成の品質が向上し、特に過小評価された感情クラスの分類精度が改善されることを示しています。しかし、合成テキストは実際の投稿よりも語彙の豊かさや個人的・時間的表現が少ないことが明らかになりました。この研究は、責任ある合成データ生成の実践的な枠組みを提供しつつ、合成データの効用と現実世界での真正性とのトレードオフについての重要な視点も提示しています。今後の信頼性のあるAIの発展は、これらの課題を乗り越えることにかかっています。