arXiv cs.LG

車載データストリームからの効率的なデータセット収集のためのフィードバック制御フレームワーク

A Feedback-Control Framework for Efficient Dataset Collection from In-Vehicle Data Streams

http://arxiv.org/abs/2511.03239v1


本論文では、現代のAIシステムが直面するデータの質と多様性の問題を解決するために、効率的なデータセット収集の新たな手法であるフィードバック制御フレームワーク(FCDC)を提案しています。従来の開ループ方式では冗長なサンプルが無駄に収集されるため、非効率なストレージや高額なラベリングが発生しやすいですが、FCDCはデータ収集を閉ループ制御問題と捉え、オンライン確率モデルを用いてデータ分布の状態を継続的に近似します。フィードバック信号に基づいてサンプルの保持を調整することで、探索と利用のバランスを動的に保ち、データセットの多様性を維持することが可能です。実験結果では、FCDCがデータのストレージを39.8%削減しつつ、よりバランスの取れたデータセットを25.9%生成することが示され、データ収集のプロセスを受動的なパイプラインから自己調整型のフィードバック駆動プロセスへと進化させる可能性があることが分かりました。