Stability AI、テキストから音楽を生成できる「Stable Audio」を公開

英Stability AIは9月13日に、新たな音楽生成AIモデル「Stable Audio」を発表しました。

このAIモデルはテキストで入力されたプロンプトを基に、高品質な音楽やサウンドエフェクトを生成することができます。

参考:Stable Audio

「Stable Audio」のプラン内容

「Stable Audio」のプラン内容については下記の通りです。

  • 無料版:ユーザーは45秒までのトラックを生成し、月に20トラックまでダウンロードすることができます。商用利用はできません。
  • サブスクリプションプラン:月額11.99米ドルで、商用利用可能な90秒のトラックを生成し、月に500トラックまで利用することができます。
  • 企業向けプラン:詳細は要問い合わせとなっています。(商用利用は可能です。)

引用:Stable Audio

※MAU: 月間アクティブユーザー(Monthly Active Users)

公開されている「Stable Audio」で生成した音楽

Stable Audioのサイトでは下記のように、プロンプトとその結果生成された音楽が公開されています。

Trance, Ibiza, Beach, Sun, 4 AM, Progressive, Synthesizer, 909, Dramatic Chords, Choir, Euphoric, Nostalgic, Dynamic, Flowing

(和訳:トランス, イビサ, ビーチ, 太陽, 午前4時, プログレッシブ, シンセサイザー, 909, ドラマチックなコード, 合唱, 多幸感, ノスタルジック, ダイナミック, 流れるような)

引用:Stable Audio

プロンプトの書き方についてのユーザーガイドも公開

Stable Audioのサイトでは、プロンプトの書き方についてのユーザーガイドも公開されています。

引用:Stable Audio

ユーザーガイドではプロンプトのコツとして下記の4つが紹介されています。

  1. 詳細を追加:特定のジャンル、説明的なフレーズ、楽器、ムードなどの情報をプロンプトに追加する。例. シネマティック, サウンドトラック, ワイルド・ウェスト, 真昼の銃撃戦, パーカッション, ホイッスルなど
  2. ムードを作る:音楽的な用語(例: グルーヴィー、リズミカル)と感情的な用語(例: 悲しい、美しい)を組み合わせる。
  3. 楽器を選ぶ:楽器名に形容詞をつけて具体的にする。例. Reverberated Guitar(残響のあるギター)、Powerful Choir(力強い合唱)、Swelling Strings(盛り上がるストリングス)など
  4. BPMの設定:出力のテンポを指定するために1分あたりの拍数(BPM)を設定したり、生成するジャンルに合ったBPMを指定することが重要。例. ドラムンベース・トラックには170 BPMを設定する。

また、Stable Audioのトレーニングデータについては、主要な音楽ライブラリとストックオーディオウェブサイトであるAudioSparxから提供された音楽のみで学習されているようです。

音楽も生成AIで簡単に作成できるように

生成AI技術の進化により、音楽生成AIを用いてテキストから簡単に音楽を生成することが可能となりました。これは創作の裾野を広げ、多くの人々に音楽制作の機会をもたらすことが予想されます。

しかし、テキスト生成AIや画像生成AIと同じく、音楽生成AIも著作権の問題があります。自動生成されるコンテンツのオリジナリティや、元となるデータの著作権、そして生成された音楽の利用範囲など、ルールや取り決めも適切にアップデートされる必要があるでしょう。