画像生成AI

Stable Diffusionとは？画像生成AIの使い方＆コツや著作権・商用利用について解説！

[]

AIの進化が目覚ましい昨今、テキストや画像から写真のようにリアルな画像を生成する「Stable Diffusion」が注目を集めています。

クリエイターやビジネスパーソン、そして趣味で画像制作を楽しみたい人々の間で急速に普及しているStable Diffusionですが、具体的な機能や使い方、他のAIツールとの違いについて疑問を持つ人も少なくないようです。

そこでこの記事では、Stable Diffusionの特徴やできること、プロンプトのコツ、さらには画像の権利問題まで、幅広く解説します。

Stable Diffusionを使いこなせば、クリエイティブな表現の幅が大きく広がるでしょう。

仕事での活用を考えている方はもちろん、趣味でStable Diffusionを使ってみたいという方もぜひ記事をチェックしてみてください。

画像生成AI「Stable Diffusion」とは？

Stable Diffusionは、テキストから高品質な画像を生成できるAIモデルです。2022年8月にStability AIによって公開され、オープンソースで提供されているため、誰でも無料で利用できます。

Stable Diffusionの特徴は、「潜在拡散モデル」と呼ばれるアルゴリズムを使用していることです。

画像生成AIは、ノイズ（いくつもの色が重なり合った状態の砂嵐のような画像）からスタートして、そこからノイズを引き算するように除去することで画像を生成します。

しかし、このやり方では大量のGPUが必要だったり、画像の生成に時間がかかったりしていました。

潜在拡散モデルでは計算量やメモリの消費量を削減できるため、学習や高解像度の画像生成を効率的にできるようになったのです。

他の画像生成AIとの違い

Stable Diffusionが他の画像生成AIと大きく異なる点は主に2つあります。

1つ目は「オープンソースで無料で使用できること」です。

画像生成AIにはいくつかの種類がありますが、有料であったり、画像生成回数に制限があるものが多い傾向にありました。

しかし、Stable Diffusionは完全にオープンソースで、全世界に向けて公開されているため誰でも無料で使用できます。

2つ目は「高クオリティな画像生成が可能なこと」です。Stable Diffusionは大量のデータによる学習が済んだAIモデルが搭載されているため、従来の画像生成AIよりも簡単に望む結果が得やすくなっています。

生成したいイメージをテキスト情報で入力するだけで、多種多様な画像を生成できます。

Stable Diffusionでできること

Stable Diffusionでは、多様な画像生成や編集が行えます。ここからは、Stable Diffusionの主な機能について見ていきましょう。

テキストから新しい画像を生成できる

Stable Diffusionでは、テキストから新しい画像コンテンツの生成が可能です。ユーザーが入力した文章や単語（プロンプト）をもとに、AIが解釈して画像を作り出します。

プロンプトによって生成される画像の質が大きく変わるため、効果的なプロンプトの書き方が重要です。

Stable Diffusionでは標準の状態では操作画面が全て英語表記となっており、AIへの指示も英語で行います。英文が正しいか、考えているニュアンスに合っているかなど確認したり工夫したりすることでイメージに近い画像が生成できるでしょう。

なお、拡張機能を使えばStable Diffusionの日本語化も可能です。

画像から新しい画像を生成できる

Stable Diffusionでは、既存の画像データを読み込ませたうえで新たな画像を生成することも可能です。

言語化が難しい場合や、既存の画像に新しい要素を追加・不要な部分を削除したい場合、写真をイラストや絵画風に変換するなどの場合に便利な機能です。

拡張機能で高画質化が可能

Stable Diffusionでは、デフォルトで備わっていない機能を追加できる「拡張機能」があります。豊富な種類の拡張機能があるため、希望に合わせて欲しい機能を追加しましょう。

例えば「Multi Diffusion」では、メモリの消費を抑えながら生成された画像の品質をさらに向上させることができます。

生成した画像の指定部分のみを高画質化できる「LLuL」といった拡張機能もあり、これらを活用することでより高品質な画像の生成や編集が可能です。

Stable Diffusionの使い方・始め方は3通り

Stable Diffusionの使い方・始め方は大きく分けて3通りです。

Webアプリケーション上で使用
自分で環境を構築して使用
ConoHa AI Canvasを使用

ここからは、それぞれの特徴について見ていきましょう。

Webアプリケーション上で使用

Webアプリケーションを利用する方法は、初心者にもおすすめの簡単な始め方です。

主に「Stable Diffusion オンライン」「Dream Studio」「Mage」「Hugging Face」といったサービスがあります。

Stable Diffusion オンライン

Stable Diffusion オンラインは、ブラウザ上で直接Stable Diffusionを利用できるサービスです。無料で使用でき、テキストを入力するだけですぐに画像生成を体験できます。

手軽に利用できる点が魅力ですが、生成できる画像の数に制限があり、カスタマイズも限られています。Stable Diffusion Onlineの機能を試してみたい方や、気軽に使いたい方におすすめです。

Dream Studio

Dream StudioはStability AI公式Webアプリケーションサービスで、アカウントを作成してログインしたうえで利用を開始します。

素早く画像を生成できるのが特徴で、アカウント作成時に25クレジットが付与されるため、その範囲であれば無料で利用可能です。

Mage

MageはStable Diffusionをベースモデルとしたツールで、登録やログインの必要なくテキストを入力するだけで簡単に画像を生成できます。

ログインなしで生成できる数には限りがありますが、他ユーザーの作品やプロンプトを見られたり、避けたいイメージ（ネガティブプロンプト）を指定できる点が魅力です。

Hugging Face

Hugging FaceはAIや学習済みモデル、データセットなどを共有・実行できるプラットホームです。

サイト内のStable Diffusion実行ページにアクセスし、英語でプロンプトを入力するだけで画像生成ができます。

ページ下部の「Examples」部分を選択して、例文での画像生成も可能です。イメージが浮かばないときは試してみましょう。

自分で環境を構築して使用

Stable Diffusionを使いこなしたい、無料で使い続けたいという場合は、自分のパソコンに環境を構築する方法もあります。

ただし自分でプログラムコードを書き込むなど導入ハードルが高く、パソコンのスペックもある程度高性能であることが求められるため、手軽に使用したい場合はWeb上で使えるサービスの利用がおすすめです。

ConoHa AI Canvasを使用

高性能なスペックのパソコンが手元にない場合、それを購入するだけでもかなりの費用がかかります。また、先述の通り、ブログラムの知識が必要です。

GMOインターネットグループ株式会社が提供するConoHa AI Canvasは、クラウド上でStable Diffusionを手軽に利用できるサービスで、最安のエントリープランでは月額990円から利用することができます。

ConoHa AI Canvasを起動するとStable Diffusionをすぐに利用することができます。生成スピードも速く、日本語によるドキュメントや解説動画もあるため、初心者から上級者まで幅広い方におすすめのサービスです。

Stable Diffusionのプロンプトのコツ

Stable Diffusionで自分の求める質の高い画像を生成するには、プロンプトのコツを押さえることが大切です。

先順位の高いプロンプトを先に入力する
ネガティブプロンプトを使う
BREAK構文を使う
カッコで強調する

ここでは、いくつかのプロンプトのコツの中から上記の項目について詳しく解説します。

優先順位の高いプロンプトを先に入力する

Stable Diffusionでは、プロンプトの入力順序が生成される画像の品質に大きな影響を与えます。

初めの方にある単語ほど優先度が高くなるため、重要なキーワードや要素は最初に入力するようにしましょう。

基本的な順序としては「画質など画像全体に影響する要素」「人や物に関する要素」「服装や髪型など詳細情報」「画像の構図」で入力されることが多いと言われていますが、優先したいポイントに合わせて工夫してみましょう。

ネガティブプロンプトを使う

ネガティブプロンプトとは、生成してほしくない要素を指定するものです。

ネガティブプロンプトを使用することで不要な要素を排除し、画像の矛盾や崩壊を抑え、より理想的な画像を生成できます。

高品質な画像を生成するためにも、「worst quality（最低品質）」「low quality（低品質）」「out of focus（ピンボケ）」など品質に関わる要素は入れておくのがおすすめです。

BREAK構文を使う

BREAK構文は、プロンプト内で要素を区切るためのものです。プロンプトの途中で「BREAK」を入れることで、その後ろに来る言葉を強調できます。

前述の通り、Stable Diffusionでは最初の単語は優先度が高く、後の単語は優先度が低くなりますが、BREAKを使用することでこの影響力に変化を与えることが可能です。

異なる要素の優先順位や重み付けをより細かくコントロールできるため、望む結果を得やすくなります。

カッコで強調する

プロンプト内の特定の要素を強調したい場合、カッコを使用する方法もあります。

重要なものや反映されにくいものは、カッコをつけて強調してみましょう。カッコ内にコロンを使い、強調度合いを調整することも可能です。

例えば（prompt:0.8）であれば1よりも数値が低くなるため弱くなり、（prompt:1.3）であればやや強調されることになります。

画像生成AIで作成した画像の権利は？商用利用可能？

画像生成AIを使用するうえで必ず確認しておきたいのが、著作権や肖像権といった権利問題です。

知らず知らずのうちに権利侵害をしてしまうことのないよう、権利や商用利用について知っておきましょう。

著作権について

画像生成AIによって生成された画像の著作権は、一般的には生成したユーザーが自由に使用可能とされている場合がほとんどです。（使用するサービスによっては異なる場合があります）

しかし、AI生成画像の著作権問題は複雑です。画像生成AIは膨大なデータを学習することで画像を生成していますが、学習の元となった著作物との類似性や依拠性が認められた場合、著作権侵害となる場合があります。

Stable Diffusionで生成された画像を利用する際は、慎重にチェックを行いましょう。

肖像権について

Stable Diffusionで生成された画像に人物が含まれる場合、肖像権の問題が発生する可能性があります。特に、実在の人物に似た画像を生成する場合は注意が必要です。

無断で使用すると法的な問題に発展する可能性があるため、商用利用を考えている場合は、肖像権に配慮した画像生成を心がけましょう。

商用利用について

Stable Diffusionは基本的に商用利用が認められています。他社に危害を加えるなど悪意のある内容などでなければ、生成画像を自由に使用可能です。

ただし、「商用利用が認められていない画像を読み込ませた」や「商用利用が認められていないモデルを追加学習させた」など商用利用ができないケースもあります。

商用利用を考えているのであれば、利用前に問題がないか確認しておきましょう。

まとめ

Stable Diffusionは、高品質な画像生成が可能な画像生成AIです。オープンソースで提供されているため誰でも無料で利用でき、豊富な拡張機能がありカスタマイズ性や拡張性が高いのが特徴です。

自分で環境構築して使用することもできますが、「まずは一度使ってみたい」という方はWebアプリケーション上で試してみるといいでしょう。

Stable Diffusionで作成した画像は商用利用も可能ですが、利用時は著作権や肖像権に注意したうえで利用することが大切です。

天秤AIでは、複数のテキスト生成AIを同時利用して簡単に比較可能です。Stable Diffusionと合わせてテキスト生成AIを使用する場合は、ぜひ天秤AIもご活用ください。