arXiv cs.AI

MusRec: ゼロショットのテキストから音楽への編集を可能にする修正フローと拡散トランスフォーマー

MusRec: Zero-Shot Text-to-Music Editing via Rectified Flow and Diffusion Transformers

http://arxiv.org/abs/2511.04376v1


MusRecは、音楽編集の新しいアプローチであり、ゼロショットテキストから音楽への編集を実現する最初のモデルです。従来のモデルは、合成音楽の編集や高度に特定化されたプロンプトを必要とするため、操作性に限界があります。しかし、MusRecは、修正フローと拡散トランスフォーマーの技術を活用することで、実際の音楽に対して多様な編集タスクを効率的に実行できます。実験結果によれば、MusRecは音楽の内容、構造の一貫性、編集の忠実度を保持する点で既存の手法より優れた性能を示しました。この研究は、現実のシナリオにおける制御可能な音楽編集のための強固な基盤を提供します。