DeepSeek-OCRは特にOCR向けにファインチューニングされた6.6GBのモデルで、NVIDIA Spark上で動作させるためにClaude Codeを用いて強引に実行しました。最初にDocker環境を設定し、Claude Codeに全権限を与え、プロジェクトを進行しました。数回のプロンプトでDeepSeekモデルの実行が可能となり、文書のOCRを行い、詳しいノートも生成しました。しかし、実行中にNVIDIAのGPUとPyTorchの互換性の問題に直面し、最終的には異なるPyTorchのバージョンを試すことが提案されました。記事では、作業の進め方やトラブルシューティングの過程が詳細に説明されています。