arXiv cs.AI

MusicAIR: アルゴリズム駆動のコアによるマルチモーダルAI音楽生成フレームワーク

MusicAIR: A Multimodal AI Music Generation Framework Powered by an Algorithm-Driven Core

http://arxiv.org/abs/2511.17323v1


最近の生成AIの進展により、音楽生成は注目の研究対象となっています。しかし、多くの神経ベースのモデルは大規模なデータセットに依存しており、著作権侵害や高性能コストの懸念があります。これに対し、MusicAIRは新しいアルゴリズム駆動の象徴的音楽コアを搭載したマルチモーダルAI音楽生成フレームワークを提案し、著作権侵害のリスクを軽減します。この音楽コアは重要な歌詞やリズム情報を結びつけて音楽特徴を自動的に導出し、歌詞から完全で一貫したメロディスコアを作成します。さらに、MusicAIRは歌詞、テキスト、画像から音楽を生成することができ、生成されたスコアは音楽理論の原則に従っています。私たちが開発したウェブツール「Generate AI Music(GenAIM)」は、歌詞からの楽曲生成や画像から音楽生成を行い、実験では、このシステムが生成した音楽スコアの平均的なキー確信度が85%に達し、79%の人間作曲家を上回ることが示されました。GenAIMは音楽作曲の支援ツールとして、また教育的な作曲チューターとしても活用可能です。