大規模言語モデル(LLMs)が多様な文化やコミュニティにサービスを提供するアプリケーションに統合される中、LLMsを平均的な原則を超えて多元的な人間の価値に整合させることが重要です。著者たちは、価値の相対的優先度と複雑な相互依存性を考慮せずに複数の価値を独立して扱ってしまう既存の方法の課題を指摘しています。これらの課題に対処するために、COUPLEという反事実的推論フレームワークを提案し、複雑な関連性と価値の優先順位をモデル化します。この手法は高次の価値次元と行動との因果関係を明示的に示し、望ましい価値目標に整合した出力を生成します。実際のデータセットを用いた評価では、COUPLEが多様な価値目標に対して他の基準を上回る効果を示しました。