生成AI技術の導入により、画像生成の分野で革新的な進化が進んでいます。特に「Stable Diffusion」は、ユーザーが入力したテキスト(プロンプト)を基に、自動で高品質な画像を生成することで人気を集めています。このガイドでは、Stable Diffusionを無料で簡単に使いこなすためのステップを詳しく解説します。まずは、Stable Diffusionの基本的な使い方から始め、プロンプトの入力方法、注意点、そして画像生成のコツまでを網羅します。さらに、Web版とローカル版の違いもご紹介します。弊社では、ChatGPTや生成AIツール導入や開発に関する1時間無料相談サービスを提供しています。お気軽にお問い合わせください。→無料相談の予約はこちらからStable Diffusionとは?概要と特徴オープンソースの画像生成AIツール「Stable Diffusion」は、イギリスのスタートアップ企業である「Stability AI」が開発した画像生成AIツールです。ユーザーが入力したテキスト(プロンプト)をもとに、自動で画像を生成します。このツールはオープンソースであり、ソースコードが全世界に無償公開されています。個人利用だけでなく、法人によるサービスにも活用されており、その利用範囲は広がっています。利用方法は大きく分けて2パターン「Stable Diffusion」の利用方法は、大きく分けて2つのパターンがあります。Web版: 既に構築された環境でブラウザを通して利用ローカル版: 自分のパソコンにインストールして利用Web版Web版では、ブラウザ上で動かすことができるため、インターネット環境さえあれば誰でも利用可能です。パソコンのOSやスペックに依存しないため、手軽に試せる点が魅力です。以下のサービスがあります。Mage.spaceDreamStudioStable Diffusion Onlineローカル版ローカル版では、ツールを自分のパソコンにインストールします。カスタマイズ性に優れており、生成する画像の枚数に制限がないのがメリットです。ただし、ある程度のスペックが求められ、特にGPUは必須です。推奨スペックは以下の通りです。デスクトップパソコンOS: Windows(64bit版)CPU: Core-iシリーズ、Ryzenシリーズメインメモリ: 16GB以上GPU: VRAM 12GB以上Stable Diffusionの利用ポイントプロンプトは英語で入力「Stable Diffusion」のプロンプトは基本的に英語で入力するのが推奨されています。日本語でも生成は可能ですが、英語の方が精度が高くなる傾向があります。例えば、「空を飛ぶ猫(flying cat)」と入力した際、英語プロンプトの方が意図通りの画像が生成されます。重要なプロンプトは前半に入力プロンプトは先に入力したものが優先されるため、重要なキーワードは前半に配置するのがポイントです。同じキーワードでも順番を変えると異なる結果が得られることがあります。括弧と数字でプロンプトを強調単語の横に括弧と数字を加えることで、プロンプトを強調することができます。例えば、「Cat」を強調したい場合、(Cat:1.3)と入力します。これにより、「Cat」が通常の1.3倍の強さで指示されます。ネガティブプロンプトを活用ネガティブプロンプトは、不要な要素を排除するための指示です。例えば、「out of focus」と入力すれば、ピントの合った画像が生成されます。他にも多くのネガティブプロンプトがあり、適切な組み合わせを見つけることで、理想の画像に近づけることができます。各サービスの使い方Mage.spaceMage.spaceの使い方は非常にシンプルです。公式サイトにアクセスし、プロンプトを入力するだけです。例えば、「Soccer playing elephant(サッカーする像)」と入力すると、5秒ほどで画像が生成されます。UIがシンプルで使いやすいのが特徴です。DreamStudioDreamStudioでは、まずGoogleアカウントでログインします。その後、左側の「Prompt」にテキストを入力します。例えば、「Tigers operating computers(パソコン操作をするトラ)」と入力すると、パソコンを操作するトラの画像が生成されます。Stable Diffusion OnlineStable Diffusion Onlineはアカウント登録無しで画像生成を試せるため、最も使いやすいサービスの一つです。プロンプトを入力すると、約20秒で画像が生成されます。例えば、「cat flying in the sky(空を飛ぶ猫)」と入力すると、空を飛ぶ猫の画像が生成されます。商用利用と著作権商用利用は可能結論として、Stable Diffusionで生成した画像の商用利用は可能です。ただし、利用にはいくつかの制約があります。例えば、法律に違反する内容や他者に危害を加える内容の共有は禁止されています。サービスの利用規約の確認各サービスには利用規約が存在します。商用利用や著作権に関する問題は、各サービスの規約に基づいて確認する必要があります。他社のロゴをベースにした画像生成はNG例えば、他社のロゴ画像をダウンロードし、「img2img」を使って新たなロゴを作成する行為は著作権侵害となる可能性が高いため、避けるべきです。追加学習時のライセンス確認Stable Diffusionには、モデルを追加学習させる機能がありますが、元画像に著作権がある場合、追加学習で生成した画像の商用利用はできません。必ずライセンスを確認しましょう。ローカル環境での設定・構築手順必要なソフトウェアのインストールPython 3.10をインストールGitをインストールStable Diffusion webUIのダウンロードと起動GitでStable Diffusion webUIをクローンwebui-user.batを実行してStable Diffusion webUIを起動必要なモデルデータを取得して設定必要なPCスペックOS: Windows(64bit版)GPU: VRAM 12GB以上メモリ: 16GB以上まとめStable Diffusionは、オープンソースの画像生成AIツールであり、Web版とローカル版の2つの利用方法があります。プロンプトの入力やネガティブプロンプトの活用など、いくつかのポイントを押さえることで、高品質な画像を生成できます。商用利用も可能ですが、各サービスの利用規約を確認し、著作権に注意する必要があります。初心者はまずWeb版から試し、慣れてきたらローカル版に挑戦すると良いでしょう。弊社では、生成AI活用のコンサルティングサービスやシステム開発を通し、様々な業界の業務自動化と効率化に貢献しています:生成AI活用に特化したコンサルティングサービス: LangCoreは、最先端の生成AI技術とWeb開発の専門知識を活かし、お客様のデジタルトランスフォーメーション(DX)の推進、業務プロセスの効率化、および高効率なシステム開発をサポートします。要件定義からシステムの実装に至るまで、お客様のビジネスが直面する課題を解決し、可能性を最大化するための総合的なコンサルティングサービスを提供しています。LangCoreのシステム開発サービス:私たちは、システムの初期段階の要件定義から、その構築、そして運用に至るまで、一貫したシステム開発サービスを提供します。プロトタイプの開発による事業検証の支援、ChatGPTを使用したAIプロダクトの開発、さらにはクラウドインフラの構築に至るまで、多岐にわたる技術ニーズに対応しています。「1時間の無料相談」を承っております!「生成AIでこんなことをやってみたいが、できるか?」「何か生成AIでできそうなことを探している」など、まずはお気軽にお問い合わせください。弊社の生成AIのプロ集団が、あらゆる分野と規模のビジネスに合った生成AIやChatGPTを使用したご提案をいたします。→こちらで無料相談を予約する