生成AI

Geminiで曲を作ってみた|音楽生成モデル「Lyria 3」の使い方や著作権対策まで徹底解説!

-

-

Geminiで曲を作ってみた|音楽生成モデル「Lyria 3」の使い方や著作権対策まで徹底解説!
アイサカ創太(AIsaka Souta)AIライター

アイサカ創太(AIsaka Souta)AIライター

こんにちは、相坂ソウタです。AIやテクノロジーの話題を、できるだけ身近に感じてもらえるよう工夫しながら記事を書いています。今は「人とAIが協力してつくる未来」にワクワクしながら執筆中。コーヒーとガジェット巡りが大好きです。


柳谷智宣(Yanagiya Tomonori)監修

柳谷智宣(Yanagiya Tomonori)監修

ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。


📌 この記事の要約

    Geminiに音楽生成モデル「Lyria 3」が統合
    2026年2月18日、Google DeepMindがGeminiに最新音楽モデル「Lyria 3」をベータ版として統合。テキスト・画像・動画から30秒の歌詞付き楽曲を生成でき、日本語を含む8言語のボーカルに対応する。

    著作権保護と安全性への技術的アプローチ
    電子透かし技術「SynthID」を全面採用し、AI生成物であることを証明。特定アーティストの直接模倣を避けるガードレールや、既存コンテンツとの照合フィルタも実装されている。

    日常使いを想定した運用設計と制限
    無料ユーザーは1日10曲程度、有料ユーザーでも1日20〜100曲程度の制限あり。生成は30秒に限定され、SNS共有やコミュニケーションツールとしての活用が主な想定用途となっている。

    実際に使ってみた:直感的なUIで簡単に楽曲生成
    ジャンル選択とプロンプト入力だけで数十秒で楽曲が完成。画像や動画からの生成にも対応し、マルチモーダル性能の高さを実感できる仕上がりとなっている。

2026年2月18日、Google DeepMindがまたもや生成AI界隈に新たな衝撃をもたらす発表を行いました。同社の主力AIである「Gemini」に、最新の音楽生成モデル「Lyria 3」が統合され、ベータ版としての提供が開始されたのです。これまでも「Suno」などの音楽生成AIが話題をさらってきましたが、Googleがついに本丸であるGeminiに、それも「歌う」機能を実装してきたことは、クリエイティブツールの勢力図に大きな影響を与えそうです。

注目は、単なるBGM作成にとどまらず、歌詞とボーカルを含めた楽曲生成が可能な点です。しかも、テキストによる指示だけでなく、画像や動画を入力として受け取り、その雰囲気に合わせた楽曲を作り出すマルチモーダル性も備えているのです。今回は、このLyria 3について解説・レビューします。


「Lyria 3」で作った天秤AIの曲です。ジャンルはバラバラで3つ、「天秤AIの歌を作って」の指示のみで作成しました。ぜひ聴いてみてください!

かっこいいラップ系

さわやかポップ系

ロック×アイドル系


画像や動画から30秒の歌を生成するマルチモーダルな音楽体験

Lyria 3はとにかく手軽に使えるのが特徴です。Geminiのインターフェースでプロンプトを入力すれば、すぐに30秒の音楽トラックを生成することができます。テキストで「雨の日の静かなジャズ」と打つこともできれば、手元の写真をアップロードして、その視覚情報からAIにムードを読み取らせ、曲を作らせることも可能です。

従来の楽曲生成AIモデルと比較して、歌詞の自動生成能力、スタイルやテンポのコントロール性、そして楽曲としての複雑性とリアリティという3つの改善を施したそうです。

特にボーカルの表現力については、48kHzのステレオ音声に対応しており、日本語を含む8言語(英・独・西・仏・ヒンディー・日・韓・葡)で歌わせることが可能です。実際にSNSなどで共有されているデモや初期のユーザー反応を見る限り、AI特有のノイズ感が低減され、人間の歌手に近い肉声感が実現されているようです。

生成された楽曲には、自動的に画像生成AI「Nano Banana」によるカバーアートが付与されます。単なる音声ファイルとしてではなく、ジャケット画像付きの動画ファイル(MP4)として出力されるため、InstagramやTikTokといったショート動画プラットフォームへの共有も手軽です。もちろん、純粋な音声ファイル(MP3)としてのダウンロードも可能です。

Googleは、Lyria 3を日常のメールやプレゼンテーションに「歓迎ソング」や「ジングル」を添えるような、新しいコミュニケーションの潤滑油として位置づけている節があります。


天秤AI byGMO

今すぐ最大6つのAIを比較検証して、最適なモデルを見つけよう!

無料で天秤AI by GMOを試す

不可視の電子透かしと厳格なフィルタリングで著作権リスクを抑制する

楽曲生成AIの最大の懸念事項である「著作権」と「倫理」に対して、Lyria 3は技術的なアプローチで対応しています。その中核となるのが、Google DeepMindが開発した電子透かし技術「SynthID」の全面採用です。生成されたすべてのトラックには、人間の耳には聞こえない不可視の透かしが埋め込まれており、これがAIによって生成されたものであることを証明します。Geminiにはこの透かしを検知する検証機能も実装されており、ユーザーは疑わしいファイルをアップロードすることで、それがGoogleのAIで作られたものかどうかを確認できる仕組みになっています。

また、既存のアーティストや楽曲の権利保護についても、慎重な設計がなされています。プロンプトで特定のアーティスト名を指定して「○○風の曲を作って」と指示した場合、Geminiはそのアーティストを直接模倣するのではなく、「広義のインスピレーション」として解釈します。つまり、そのアーティストが持つ雰囲気やスタイルを学習データから抽出して反映させつつも、メロディや声質そのものをコピーすることは避けるようガードレールが敷かれているのです。加えて、出力前に既存コンテンツとの照合フィルタを通すことで、意図せぬ権利侵害のリスクを低減させています。

学習データの透明性に関しては、多くの議論が残る部分ではありますが、Google側の公式見解としては「著作権やパートナー合意に細心の注意を払った」としています。そのうえで、権利侵害の疑いがある生成物が万が一出力された場合の報告導線を用意するなど、運用面でのリスク管理体制を敷いています。クリエイターや権利者団体との摩擦を避けようとする姿勢が見て取れます。


日常的なコミュニケーションツールとして設計された運用仕様と限界

Lyria 3の利用は、18歳以上のユーザーに限られます。無料プランでも利用でき、基本的には多くのユーザーに開かれた機能ですが、使い放題というわけではありません。報道によれば、無料ユーザーは1日10曲程度、有料ユーザーでも1日20~100曲程度という回数制限(クォータ)が設けられています。これは計算資源のコスト管理だけでなく、乱用を防ぐための措置とも考えられます。

生成される楽曲が「30秒」に限定されている点も、プロダクトの性質をよく表しています。この長さは、SNSのショート動画や日常会話のアクセントとしては十分ですが、本格的な楽曲制作を行うには短すぎます。また、長尺の生成は音楽的な構成の破綻を招きやすく、著作権侵害のリスクも高まるため、現時点では品質と安全性のバランスを取った現実的な解と言えるでしょう。ユーザーは「サビだけ」「イントロだけ」といったパーツを作る感覚で利用することになります。

YouTubeの「Dream Track」との住み分けも興味深い点です。Dream TrackもLyria 3を基盤としていますが、こちらはYouTube Shorts向けのサウンドトラック生成に特化しており、生成した音源の単体ダウンロードができません。なお、Dream Trackは米国で先行提供されており、現在グローバルに展開中です。

一方、Gemini上のLyria 3はダウンロードして外部に持ち出すことが可能です。この違いは、プラットフォーム内での循環を促すYouTubeと、汎用アシスタントとしてのGeminiという、それぞれの立ち位置の違いを反映しています。ユーザーは目的に応じて、これらを使い分けるリテラシーが求められるようになるでしょう。


直感的なUIで簡単作成!Geminiで実際にオリジナル楽曲を生成してみる

では、早速使ってみましょう。Geminiを開くと、「音楽を作成」というボタンやメニューが追加されているのでクリックします。直接、楽曲作成のウェブページ(https://gemini.google.com/music)を開いてもOKです。

「リミックスするトラックを選択」という画面が開き、「90年代のラップ」や「ラテンポップ」「フォーク バラード」といった様々なジャンルやスタイルの音楽タイルが一覧表示されます。ここからジャンルを選ぶことができます。

あとは、プロンプトを入力します。細かく曲の内容を指示することもできるのですが、まずは「生成AI「Gemini」の歌を作って」とシンプルに指示してみました。


Geminiの音楽作成ボタンをクリックする画面

「音楽を作成」をクリックします。


音楽ジャンルの選択画面とプロンプト入力欄

音楽ジャンルを選択し、プロンプトを入力します。


数十秒で30秒の曲が完成しました。Geminiが生成した正方形のイメージ画像を使った動画が生成されます。中央の再生ボタンを押すと、すぐに再生できます。

Geminiを歌い上げるとてもいい感じの曲ができました。瞬時に、好みのテーマで好みのジャンルの楽曲が得られるというのは面白い体験です。ただし、何も指示しないと英語になってしまいます。日本語の曲が欲しいなら、プロンプトで明示する必要があります。


Lyria 3で生成された楽曲の再生画面

いい感じの楽曲が生成されました。


日本語で生成された楽曲の画面

日本語で生成してもらうこともできます。


完成した楽曲がこちら!
プロンプト:生成AI「Gemini」の歌を作って。日本語で


ここでは「Gemini」の曲を作ってもらったのですが、女性が日本語で滑らかに歌っていて驚きました。SNSなどに投稿するなら、動画の右上にある「トラックをダウンロード」のアイコンからファイルをダウンロードできます。サムネイルを使った動画ファイルか、MP3形式の音楽ファイルから選べます。


トラックをダウンロードボタンの位置を示す画面

「トラックをダウンロード」をクリックします。


動画または音楽のみのダウンロード選択画面

「動画」もしくは「音楽のみ」を選びます。


なお、リミックスするトラックを選ばず、プロンプトで直接入力することも可能です。また、プロンプト入力中に、フォームをクリックするとおすすめの追加プロンプトが表示され、選択するだけで楽曲を生成することもできます。


詳細なプロンプトでフューチャーベースの楽曲を生成する画面

プロンプト:生成AI「Gemini」をテーマにした、疾走感あるフューチャーベースの楽曲。BPM132。煌びやかなシンセと重厚なベースで、デジタルな宇宙と無限の可能性を表現してください。歌詞は、膨大な知識が繋がり新たな答えを導き出す様子や、人間との共創による明るい未来を描写。透明感のある女性ボーカルと機械的なエフェクトボイスを交差させ、サビで視界が開けるようなエモーショナルでドラマチックな展開を希望します。



完成した楽曲がこちら!



プロンプト補完機能の表示画面

プロンプトを補完してくれる機能もあります。


画像や動画をアップロードすると、映像の内容を分析し、AIが曲を作ってくれます。動画の内容もきちんと理解しており、マルチモーダル性能が進化しているのがわかります。もちろん、その上で、犬の名前を教えたり、音楽ジャンルを指定することもできます。


画像をアップロードして楽曲を生成する画面

画像をアップロードして、歌を作ってもらいます。



完成した楽曲がこちら!
プロンプト:黒柴犬のコウくんです。楽しい日本語の歌を作って。



Lyria 3の登場は、音楽制作という専門的なスキルの民主化をさらに一歩進める出来事です。楽器が弾けなくても、音楽理論を知らなくても、言葉や画像さえあれば、誰もが自分の感情を「音」として表現し、誰かに届けることができます。教育現場やビジネスシーンにおいて、テキストや画像に加えて「オリジナル音楽」が当たり前の素材として扱われる未来は、もうすぐそこまで来ています。

しかし、その利便性の裏で、学習データの詳細やモデルの内部構造といった「透明性」の課題は依然として残されています。Googleは透かし技術やフィルタリングで安全性を担保しようとしていますが、クリエイターコミュニティが求めるレベルの開示がなされているとは言い難い状況です。今後、Lyria 3が社会に受け入れられ、持続可能なツールとして定着するためには、技術的な進化だけでなく、権利者との対話やデータの透明性確保に向けたさらなる努力が不可欠になるでしょう。

この記事を共有:
  • facebook
  • line
  • twitter
天秤AI by GMOイメージ

最新のAIが勢ぞろい! 天秤AI by GMOなら、最大6つのAIを同時に試せる!

無料天秤AI by GMOを試す