この記事では、画像をテキストの代わりに使用することでLLMトークンを節約できるかどうかについて考察します。研究によると、画像を入力として使用する場合、トークン消費はほとんどテキストの場合と変わらず、サイズが50倍違っても同様です。実験を通じて、テキストを画像に変換し、APIに送信する方法を試みました。結果、特定の条件下でgpt-5モデルトークンを40%以上削減できるケースもありましたが、他のモデルでは画像入力に対してトークン消費が増加する傾向が見られました。特にgpt-5-chatプロンプト以外では、生成トークンのコストが高くなるため、トークン貯蓄には限界があります。結論として、特定の状況下で節約は可能ですが、それに伴うトレードオフを考慮する必要があります。