HackerNews

ウエハ規模のAIコンピューティング:システムソフトウェアの視点

Wafer-Scale AI Compute: A System Software Perspective

https://www.sigops.org/2025/wafer-scale-ai-compute-a-system-software-perspective/


本記事では、AIモデルの複雑さが増す中で、従来のコンピューティングアーキテクチャが限界に直面していることを示しています。ウエハ規模のAIチップは、数十万のコアと大規模なオンチップメモリを一つのウエハ上に統合することで、この限界を押し広げています。しかし、ハードウェアだけでは不十分で、システムソフトウェアの進化が求められます。ウエハスケールシステムの出現は、AIのスケーリング法則の追求から生じており、PLMRという概念モデルがその主要なアーキテクチャ特性を捉えています。今日のAIソフトウェアスタックがこれらを最大限に活用できていない理由を説明し、ウエハスケールシステムが試験時の計算効率を高め、マルチチップ設計に内在するオフチップ通信のボトルネックを軽減する道を示唆します。その一例として、WaferLLMというシステムがミリ秒未満の推論レイテンシを実現し、ウエハスケールの統合によるスケーリングの効率性を示しています。この新しいコンピューティング時代において、AIシステムスタックの再考が必要であることが結論付けられています。