HuggingFace

transformersで利用できるOpenAI gpt-ossのトリック

Tricks from OpenAI gpt-oss YOU 🫵 can use with transformers

https://huggingface.co/blog/faster-transformers


OpenAIは新たにGPT-OSSシリーズのモデルを発表しました。このモデルは、MXFP4量子化や効率的なカーネル、新しいチャットフォーマットなどの革新的な技術を特徴としており、transformersライブラリが大幅にアップグレードされた結果、モデルの読み込み、実行、ファインチューニングが非常に効率的になりました。記事では、これらのアップグレードの詳細と、それがどのようにtransformersのツールキットに統合され、他のモデルがそれから恩恵を受けられるかについて説明しています。特に、Zero-build KernelsやMXFP4量子化、テンソル並列性、動的スライディングウィンドウなどの新機能が追加されており、これらの機能はほとんどの主要なtransformersモデルで動作することが期待されます。また、カスタムカーネルを使用することで、効率的な計算処理が可能となり、開発者が新しい方法を迅速に理解し採用できるようにされています。