この記事では、AIモデルがモバイルコンピューティングに普及している現状において、Androidシステム上での最適な実行構成について研究されています。特に、物体検出(YOLOファミリー)と画像分類(ResNet)という2つの重要なタスクに注目し、さまざまなモデルの量子化スキームとデバイス内アクセラレータ(GPUやNPU)の利用法を評価しています。目的は、精度の劣化を最小限に抑えつつ、推論速度の最大化を図るための最適な組み合わせを経験的に特定することです。記事は、リアルタイムの制約を最大限活用する実行戦略や異種ハードウェアアーキテクチャの活用によるユーザーエクスペリエンスの向上を目指しています。