LILO: インタラクティブな自然言語フィードバックを用いたベイズ最適化

本論文では、複雑で微妙な目標や主観的なゴールを定量化可能な最適化目的に変換するためにフィードバックが重要であることを述べられています。著者たちは、自然言語での非構造的フィードバックをスカラーのユーティリティに変換する大規模言語モデル(LLM)を用いた「言語インザループ」フレームワークを提案しています。従来の優先順位ベイズ最適化は特定の形式のフィードバックしか受け付けないのに対し、提案手法は多様なテキストフィードバックを一貫したユーティリティ信号に変換し、ユーザーの優先資格を柔軟に組み込むことが可能です。この方法はサンプル効率と不確実性の原則を維持しながら、より自然な意思決定インターフェースを提供し、特にフィードバックが限られている環境では従来のベイズ最適化やLLM単体の最適化手法を上回ることが示されています。