この記事では、AIエージェントの大規模な監視型ファインチューニングに関する公的研究結果が少ない理由を探ります。特に、エージェント訓練データの収集にはユニークなチャレンジがあり、データがさまざまなフォーマットやツール、インターフェースに分散しているため、ボトルネックはデータ源の不足ではないと指摘します。その解決策として、エージェントデータプロトコル(ADP)を導入します。ADPは、エージェントデータセットの間での「インターリングア」として機能し、多様なタスクを表現できる軽量の表現言語です。実験では、13の既存エージェント訓練データセットをADPフォーマットに統一し、複数のエージェントフレームワーク用の訓練準備が整った形式に変換しました。その結果、平均して約20%の性能向上を示し、特定のドメイン調整なしに標準的なベンチマークで最先端のパフォーマンスを達成しました。