本記事では、Nvidia DGX Sparkの性能について、リリース日に行われたファームウェア580.95.05およびOllama v0.12.6を使用したパフォーマンステストの結果を報告します。各テストは10回実施され、出力トークン数は500、温度は0に設定されました。テストスクリプトでは、特定のプロンプトに基づいてデータが取得され、キャッシングは無効にされています。DGX Sparkのモデルによって異なるトークン処理能力が示され、例えば、gpt-oss 20Bモデルでは、入力トークンのプリフィル速度は3.224k、デコード速度は58.27トークン/秒でした。また、ファームウェアの更新やOllamaとOpenAIのCodexのインストール手順についても詳述されています。この情報を基に、Nvidia DGX Sparkの最適な使用法と効率的な実行が可能になります。