arXiv cs.AI

限られたデモンストレーションを持つ集団に対して学ぶことの遅延

Learning To Defer To A Population With Limited Demonstrations

http://arxiv.org/abs/2510.19351v1


この記事では、学習を遅延させる(L2D)システムの実用的な展開を妨げる重要なデータの不足に対処しています。著者たちは、メタラーニングを使用して、少数のデモから専門家固有の埋め込みを生成する文脈認識型の半教師ありフレームワークを提案しています。この埋め込みは、最初に大量の擬似ラベルを生成するために利用され、次にテスト時に新しい専門家に即座に適応する能力を持つメカニズムとして機能します。実験結果は、合成ラベルで訓練されたモデルが急速にオラクルレベルのパフォーマンスに達することを確認し、データ効率の良さを検証しています。この研究は、適応型L2Dシステムをより実用的かつスケーラブルにし、リアルな環境における人とAIの協力の道を開くものです。