この記事では、Core MLとdots.ocrを使用したオンデバイスのOCR技術について解説しています。2025年において、オンデバイスで競争力のあるモデルを実行することがより現実的になりました。RedNoteの3BパラメータOCRモデルであるdots.ocrは、OmniDocBenchでGemini 2.5 Proを上回り、APIキーの取り扱いやネットワーク接続なしで使えることが開発者にとって魅力的です。しかし、限られたコンピュータ資源と電力制限を考慮する必要があります。AppleのNeural Engineは高い性能を持ちながらも消費電力が少ないですが、Core MLを介してしかアクセスできません。本記事は、CoreMLとMLXを組み合わせてdots.ocrをオンデバイスで実行するための変換プロセスを詳述しています。変換は基本的にPyTorchからCore MLへの2段階プロセスで行われ、まずはグラフをキャプチャし、次にそれをコンパイルします。最後に、モデルの理解を深め、簡素化しながら最小限の機能を持ったモデルを作成する重要性にも触れています。