arXiv cs.AI

制御可能なシンボリック音楽生成のための潜在的制約としての条件付き拡散

Conditional Diffusion as Latent Constraints for Controllable Symbolic Music Generation

http://arxiv.org/abs/2511.07156v1


本研究では、音楽属性に対する精密な制御を求める専門ユーザーのニーズに応えるべく、条件付き拡散モデルを用いたシンボリック音楽生成の新たなアプローチを提案します。従来の音楽生成技術は、主に音楽的文脈や自然言語に依存していましたが、本研究では、無条件のシンボリック音楽生成モデルに対するノイズ除去拡散プロセスを潜在的な制約として活用します。具体的には、凍結された無条件バックボーンの潜在変数に対して小規模な条件付き拡散モデルのライブラリを確率的な事前情報として利用するフレームワークを提案し、音符の密度、音高の範囲、輪郭、リズムの複雑さなど多様な音楽属性に対してその効果を実証しました。結果として、拡散に基づく制約が従来の属性正則化や他の潜在制約アーキテクチャよりも優れた相関性を示し、生成された音楽が高い知覚品質と多様性を維持しながら目標属性との相関を強めることを確認しました。