Kandinsky 5.0は、高解像度の画像生成と10秒動画合成のための最新の基盤モデル群を紹介します。このフレームワークは、主に3つのモデルラインから成り立っています。Kandinsky 5.0 Image Liteは6Bパラメータを用いた画像生成モデル、Kandinsky 5.0 Video Liteは2Bパラメータで迅速かつ軽量なテキストから動画および画像から動画への変換モデル、Kandinsky 5.0 Video Proは19Bパラメータを搭載し、優れた動画生成品質を実現します。データの収集、処理、フィルタリング、クラスタリングを含むマルチステージトレーニングパイプラインの詳細がレビューされ、自己教師ありファインチューニング(SFT)や強化学習(RL)に基づくポストトレーニングなどの品質向上技術が取り入れられています。Kandinsky 5.0は、大規模な公開生成フレームワークとして、生成モデルの質を向上させることを目指し、オープンソースコードとトレーニングチェックポイントを提供することで、研究コミュニティの発展に寄与することを期待しています。