HackerNews

キロバイトで巨大ZIPの内部を覗く

Peeking Inside Gigantic Zips with Only Kilobytes

https://ritiksahni.com/blog/peeking-inside-gigantic-zips-with-only-kilobytes/


この記事では、巨大なZIPファイルをまるごとダウンロードせずに中身を確認する方法が紹介されています。ZIP形式の内部構造において、重要な要素はファイルのデータの後に配置される小さなインデックス(セントラルディレクトリ)です。このインデックスはファイル名、サイズ、圧縮方法などの情報を含み、全体のファイル構造を理解する手助けとなります。著者は、HTTP Rangeリクエストを使用して必要な部分だけを取得する手法を提案し、具体的にはZIPファイルの最後からEOCD(セントラルディレクトリ終了)を探し出し、その後インデックス情報を取得して、ファイルの詳細を表示する方法を解説しています。これにより、多ページにわたる大型アーカイブの内容を簡単に把握でき、必要に応じて特定のファイルだけをダウンロードすることも可能です。