本記事では、機械学習における計算資源の需要が高まる中、異なる性能やエネルギー効率を持つハードウェアクラスタでの効率的なリソース割り当ての重要性を論じています。最新のハードウェアへのアップグレードが難しい状況で、既存の多様な世代の資源を持続可能に活用することが求められています。提案されたシステムは、オンラインでの機械学習のワークロード管理のための学習ベースのアーキテクチャです。このシステムは、リクエストに応じてリソースを動的に割り当てることで、エネルギー消費を最小限に抑えつつ、パフォーマンス要件を満たします。2つのニューラルネットワークを用いており、一つは新しいモデルが異なるハードウェアの種類をどのように利用するかを予測し、もう一つは実際のパフォーマンスデータを基に予測を洗練します。このアプローチにより、リソース割り当ての効果性が時間と共に向上します。