arXiv cs.AI

行列とテンソル分解を用いた効率的なAutoMLパイプライン探索

Efficient AutoML Pipeline Search with Matrix and Tensor Factorization

http://arxiv.org/abs/2006.04216v1


データサイエンティストは新しいデータセットに対して良い教師あり学習モデルを選ぶ際に、データの前処理、特徴の選択、次元削減、推定アルゴリズムの選択、各パイプラインコンポーネントのハイパーパラメータ設定など、さまざまな選択肢に直面します。この問題に対処するために、本研究では新しいAutoMLシステムを設計しました。このシステムは、行列やテンソル分解を代理モデルとして利用し、組み合わせ的なパイプライン探索空間をモデル化します。提案する手法では、効率的に新しいデータセットに関する情報を収集するための貪欲な実験設計プロトコルを開発しており、実際の分類問題の大規模なデータセットにおける実験によって、その有効性が示されています。