arXiv cs.LG

SLOFetch: 圧縮階層型命令プリフェッチングによるクラウドマイクロサービスの最適化

SLOFetch: Compressed-Hierarchical Instruction Prefetching for Cloud Microservices

http://arxiv.org/abs/2511.04774v1


本記事では、クラウドマイクロサービス向けの命令プリフェッチング手法「SLOFetch」が提案されています。大規模なネットワークサービスでは、ソフトウェアスタックの深さやマイクロサービスのオーケストレーションが原因で命令のフットプリントが増加し、フロントエンドでの待機が発生し、レイテンシやエネルギー消費が増大します。SLOFetchは、Entangling Instruction Prefetcher (EIP) に基づき、最大8つの宛先を36ビットで捉える圧縮エントリーと、L1に常駐し頻繁に参照されるエントリーのみをチップ上に保持する階層メタデータストレージを導入しています。また、文脈特徴を用いてプリフェッチの収益性を評価する軽量のオンラインMLコントローラーも追加されています。これにより、データセンター向けアプリケーションの効率が改善され、EIPに匹敵する速度向上も維持されます。