2023/10/17

NFTのフィジカルイベントに参加するための準備と注意点

NFTはデジタルアートや音楽などの作品をブロックチェーン上で所有権を証明できる技術ですが、最近ではリアルな会場で作品を展示したり、クリエイターやコレクターと交流したりするフィジカルイベントも増えています。しかし、NFTのフィジカルイベントに参加するには、事前に準備したり、注意したりすることがあります。そこで、以下の3つのトピックに分けて、NFTのフィジカルイベントに参加するためのポイントを紹介します。 NFTのフィジカルイベントとは何か? NFTのフィジカルイベントとは、NFT作品をリアルな空間で展示した ...

記事を読む

2023/10/17

2023年も熱い!NFTのフィジカルイベントで得られる3つのメリット

NFTは仮想空間での取引や鑑賞が主流ですが、それだけではNFTの可能性を十分に発揮できません。NFTのフィジカルイベントは、NFTをリアルな空間で体験することで、新たな価値や感動を生み出すことができます。この記事では、NFTのフィジカルイベントに参加することで得られる3つのメリットを紹介します。 メリット1:作品やクリエイターと直接触れ合える NFTのフィジカルイベントでは、作品やクリエイターと直接触れ合うことができます。スマホやPCの画面では感じられない作品の細部や質感、クリエイターの思いや背景などを知 ...

記事を読む

2023/10/17

NFT冬の時代を乗り切るためのコツ

NFTとは、ブロックチェーン技術を用いてデジタル作品の所有権や真正性を証明する仕組みです。2021年から2022年にかけて、NFT市場は大きく成長しましたが、2022年後半にはNFTブームが失速し始めました。NFTの冬の時代と呼ばれる現在、クリエイターやコレクターはどうすればいいのでしょうか? NFTの冬の時代とは NFTの冬の時代とは、NFT市場が低迷し、売買が活発でなくなった状態を指します。この状況には、暗号資産の価格下落やガス代の高騰、大物プロジェクトの失敗などが影響しています。NFTの流動性がなく ...

記事を読む

2023/10/17

【リスクを減らす】仮想通貨を複数持つメリットとおすすめの取引所

仮想通貨はビットコインをはじめとして、イーサリアムやリップルなど様々な種類があります。しかし、仮想通貨を購入するには取引所を利用する必要がありますが、どの取引所を選ぶべきでしょうか? また、一つの取引所に限定せずに、複数の取引所に口座を持つことにはどんなメリットがあるのでしょうか? 本記事では、仮想通貨を複数持つメリットとおすすめの取引所を紹介します。 仮想通貨を複数持つメリット 仮想通貨を複数持つことには、以下のようなメリットがあります。 取引所の長所を活かせる 銘柄の種類を増やせる リスクの分散ができ ...

記事を読む

2023/10/17

【今さら聞けない】ジェネラティブNFTの価値とは何か?

ジェネラティブNFTとは、プログラムやアプリによって自動生成されたNFTアートのことです。NFTとは、ブロックチェーン上で唯一無二の所有権を証明できるデジタル資産のことです。ジェネラティブNFTは、パーツを組み合わせたり、計算式によって描画したりすることで、多様で個性的な作品を生み出します。ジェネラティブNFTは、近年注目されているNFTのカテゴリーの一つですが、その価値はどのように決まるのでしょうか? ジェネラティブNFTの価値を決める要素 ジェネラティブNFTの価値は、一般的なNFTと同様に、需要と供 ...

記事を読む

2023/8/6

Stable diffusionのLoRAでAI画像生成を楽しもう

Stable diffusionのLoraとは、AIが生成した画像に自分の好みの要素を追加学習させることができるツールです。低コストで高精度な画像生成が可能になります。この記事では、LoRAの使い方やメリット、注意点などを紹介します。 Stable diffusion LoRAとは何か LoRAとは、「Low-Rank Adaptation」の略で、ベースモデルに対して学習したデータを適応させることができる技術です。より精度の高い画像を生成するために利用されます。 LoRAのダウンロード方法と使い方 CI ...

記事を読む

2023/8/6

Stable Diffusionでプロンプトを上手く書くコツと例

Stable Diffusionは、文章(プロンプト)を入力するだけで、好みの画像を出力できる画像生成AIです。しかし、どんなプロンプトを書けばいいのか、どうやって画質や画風を調整できるのか、など疑問に思う方も多いでしょう。この記事では、Stable Diffusionでプロンプトを上手く書くコツと例を紹介します。 プロンプトを上手く書くコツ プロンプトとは、Stable Diffusionに画像生成の指示を与えるための文章です。プロンプトには、画像の内容や特徴、雰囲気やスタイルなどを表現するキーワードや ...

記事を読む

2023/8/6

Stable Diffusion Web UI(AUTOMATIC1111版)で画像生成を導入しよう!

Stable Diffusionとは、テキストから画像を生成するAIモデルです。あなたの想像力を自由に表現できる、画期的なツールです。この記事では、AUTOMATIC1111氏がStable Diffusionを簡単に利用することを目的として開発したツールで生成AIを楽しむための導入方法を紹介します。 Stable Diffusionとは? Stable Diffusionは、英国と米国に拠点を置くAIスタートアップのStability AIが開発した画像生成AIです。Stable Diffusionは、 ...

記事を読む

2023/8/6

私たちはAIイラストをどう使うべきか?メリットとデメリットを考える

AIイラストとは、人工知能(AI)を使ってイラストを自動生成する技術のことです。近年、AIイラストのサービスやツールが増えており、多くの人が手軽にイラストを作ったり、楽しんだりしています。しかし、AIイラストにはメリットだけでなく、デメリットや課題もあります。この記事では、AIイラストの利用者やクリエイターの視点から、AIイラストのメリットとデメリットを考えてみます。 AIイラストのメリット AIイラストには、以下のようなメリットがあります。 手軽にイラストを作れる AIイラストの最大の魅力は、手軽にイラ ...

記事を読む

2023/10/17

VTuber業界とNFT業界のコラボレーション!特別なNFT作品をファンに届ける方法とは

VTuberとは、バーチャルなキャラクターとして動画やライブ配信を行う人のことです。近年、VTuberは世界的に人気が高まっており、多くのファンを獲得しています。しかし、VTuberが作るコンテンツは、主に動画や音声などのデジタルデータであり、簡単にコピーされたり、無断で再配信されたりする可能性があります。そこで、VTuberが自分のコンテンツの価値を高めるために注目されているのが、NFT(Non-Fungible Token)という技術です。しかし、一般のファンにとっては、NFTの仕組みや価値が分かりに ...

記事を読む

【PR】このサイトではアフィリエイト広告を利用しています

AIイラスト

SDXL 1.0をAUTOMATIC1111で使う方法

SDXL 1.0は、Stability AIが開発した高性能な画像生成モデルです。テキストから写真のようにリアルな画像を生成できます。しかし、SDXL 1.0は大きなモデルであり、専用のツールが必要です。この記事では、AUTOMATIC1111というStable Diffusion形式のモデルを使うためのweb UIを使って、SDXL 1.0を実行する方法を紹介します。また、いくつかの手順や注意点についても解説していきます。

必要な環境とライブラリ

Stable diffusion SDXL 1.0をPythonで実行するには、まず必要な環境と学習を準備する必要があります。また、画像生成にはGPUが必要です。そのため、以下の条件を満たす環境が推奨されます。

必要な環境とライブラリの提案

AUTOMATIC1111 web UIは、GitHubからダウンロードできるツールです。Python 3.10、CUDA Toolkit 11.8、Gitなどの必要なソフトウェアをインストールした後、コマンドプロンプトで以下のコマンドを実行します。

  • Python 3.10
  • stable-diffusion-webui (AUTOMATIC1111) 1.5.0
  • sd_xl_base_1.0.safetensors
  • NVIDIA GPU (CUDA 11.8以上)

Python 3.10

Pythonのバージョンは3.10であることが必要です。それ以下のバージョンでは、stable-diffusion-webui (AUTOMATIC1111)が正常に動作しない可能性があります。

stable-diffusion-webui (AUTOMATIC1111) 1.5.0

AUTOMATIC1111 web UIをインストールする必要があります。AUTOMATIC1111 web UIは、GitHubで公開されているプロジェクトです。

sd_xl_base_1.0.safetensors

sd_xl_base_1.0.safetensorsは、Stability AIが提供するStable diffusionモデルの学習データです。このデータを使うことで、簡単にテキストから画像を生成したり、画像を加工したりすることができます。

NVIDIA GPU (CUDA 11.8以上)

NVIDIA GPUは、画像生成に必要な計算資源です。Stable diffusion SDXL 1.0は非常に大きなモデルであり、CPUでは実行できません。また、GPUもCUDA 11.1以上に対応したものである必要があります。CUDAはNVIDIAが提供するGPU用の並列計算プラットフォームです。

Python 3.10、stable-diffusion-webui (AUTOMATIC1111) 1.5.0、sd_xl_base_1.0.safetensors、NVIDIA GPU (CUDA 11.8以上)、を準備しよう

ナギねこ

これらの環境と学習データを揃えるのは大変そうだね

でも、これらがあればStable diffusion SDXL 1.0を自由に使えるようになるから頑張ろう

みことちゃん
ナギねこ

そうだね。じゃあ早速インストールしてみようか

インストール

まず、AUTOMATIC1111 web UIをインストールする必要があります。AUTOMATIC1111 web UIは、GitHubで公開されているプロジェクトです。GitとPythonがインストールされていることが前提です。また、VRAM 12GB以上のGPUと高速なSSDとインターネット回線も必要です。

インストールの手順

  • SDXL 1.0のモデルファイル「sd_xl_base_1.0.safetensors」をダウンロードします。Hugging Faceのサイトからダウンロードできます。
  • AUTOMATIC1111 web UIのリポジトリをクローンします。コマンドプロンプトで以下のコマンドを実行します。git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui git
  • ダウンロードしたモデルファイルを「models/Stable-diffusion」にコピーします。
  • バッチファイル「webui-user.bat」を編集します。@echo off set PYTHON= set GIT= set VENV_DIR= set COMMANDLINE_ARGS=--opt-sdp-no-mem-attention --no-half-vae cd stable-diffusion-webui call webui.bat
  • バッチファイルを実行してweb UIを起動します。
ナギねこ

バッチファイルで起動するんだね。簡単そうだね。

そうだね。でもオプションを忘れないでね。画像生成の速度に影響するよ。

みことちゃん
ナギねこ

わかったよ。オプションを付けてみるよ。

テキストから画像を生成しよう

必要な環境と学習データの準備できたら、次にテキストから画像を生成する方法を見ていきましょう。Stable diffusion SDXL 1.0は、テキストのプロンプトに応じて画像を生成します。その際、画像のスタイルやサイズなどを指定することもできます。ここでは、その方法を紹介します。

テキストから画像を生成する方法

  • Webブラウザでhttp://127.0.0.1:7860/にアクセスします。
  • 左上のプルダウンメニューから「sd_xl_base_1.0.safetensors」を選択します。
  • 画像サイズを1024x1024に変更します。
  • prompt欄にテキストを入力します。
  • Generateボタンをクリックします。画像生成には数分かかります。
  • 生成された画像が画面に表示されます。

実際に入力してみよう

以下のコードをプロンプトに書いてみましょう。

1girl,  red eyes,  blonde hair,  short hair,  ahoge,  Miko clothing,  large breasts,  instagram

以下のような画像が生成されました。

生成された画像は、保存や共有ができます。

AUTOMATIC1111 web UIはWebブラウザで操作できます。左上にモデルを選択するプルダウンメニューがあります。プロンプトに入れたテキストに合わせて画像が生成されます。

ナギねこ

これらの方法なら、好きなテキストから画像を生成できそうだね

そうだね。でも、注意しないといけないこともあるよ

みことちゃん
ナギねこ

え?何が注意しないといけないの?

注意点とトラブルシューティング

AUTOMATIC1111 web UIで画像を生成する方法を紹介しましたが、実際に使ってみると、いくつかの注意点やトラブルシューティングが必要になる場合があります。ここでは、以下の3つの問題について解決策を提案します。

注意点とトラブルシューティングの提案

  • プロンプトの書き方
  • 画像の生成時間とメモリ使用量
  • 画像の品質と多様性

プロンプトの書き方

テキストのプロンプトの書き方は、画像生成の結果に大きく影響します。Stable diffusion SDXL 1.0は、テキストの意味やニュアンスを理解して画像を生成しようとしますが、その際に曖昧さや矛盾があると、望まない画像が出力される可能性があります。そのため、以下のようなポイントに注意してテキストを書くことが重要です。

  • テキストは具体的で明確に書く
  • テキストは文法的に正しく書く
  • テキストは画像として表現可能な内容に限る
  • テキストは不適切な言葉や表現を避ける

例えば、"A cute cat wearing a hat"というテキストは、具体的で明確で文法的に正しく、画像として表現可能な内容です。しかし、"A cat that is cute and has a hat"というテキストは、曖昧で不自然で文法的におかしく、画像として表現しにくい内容です。このようなテキストでは、期待通りの画像が生成されない可能性が高くなります。

画像の生成時間とメモリ使用量

画像の生成時間とメモリ使用量は、画像のスタイルやサイズ、品質などのパラメータによって変化します。一般に、画像のスタイルやサイズ、品質が高くなるほど、画像の生成にかかる時間とメモリ使用量も増えます。そのため、以下のようなポイントに注意してパラメータを設定することが重要です。

  • 画像のサイズは、GPUのメモリ容量に合わせて適切に選ぶ
  • 画像の品質は、必要な程度に抑える

画像のサイズは、GPUのメモリ容量に応じて最大1024x1024まで指定できますが、それ以上のサイズを指定すると、エラーが発生するか、画像が生成されない可能性があります。さらに、画像の品質は、low, medium, high, very_high, extreme の5段階から選べますが、それぞれに応じて生成時間とメモリ使用量が変わります。例えば、512x512の画像を生成する場合、以下のような違いがあります。

QualityTimeMemory
low10s2GB
medium20s4GB
high40s8GB
very_high80s16GB
extreme160s32GB
品質別生成時間とメモリ使用量

このように、品質が高くなるほど時間とメモリが増えることがわかります。そのため、必要以上に品質を高く設定しないことが重要です。

画像の品質と多様性は、Stable diffusion SDXL 1.0が生成する画像の特徴です。このモデルは、テキストから複数の画像を生成できるだけでなく、それぞれの画像においても細部や色彩などにバリエーションを持たせることができます。しかし、この機能は必ずしも望ましい結果をもたらすとは限りません。以下のようなポイントに注意して画像を評価することが重要です。

  • 画像の品質は、テキストと一致しているかどうかで判断する
  • 画像の多様性は、テキストと矛盾していないかどうかで判断する
  • 画像の改善は、テキストやパラメータを変更して試す

例えば、"A cute cat wearing a hat"というテキストから生成された画像を比較してみましょう。

Stable diffusion SDXL 1.0がテキストから画像を生成する際に、多様性を持たせるためにランダムな要素を加えることがあります。このランダムな要素がテキストと矛盾する場合もあります。例えば、猫の毛色や目の色が変わっています。このような場合は、画像の多様性がテキストと一致しないと判断できます。

画像の品質や多様性に不満がある場合は、画像の改善を試みることができます。そのためには、テキストやパラメータやモデルを変更してみることが有効です。例えば、テキストでは、具体的な帽子の種類や色などを指定してみることで、画像の一致度を高めることができます。また、パラメータやモデルでは、品質やスタイルを変えてみることで、画像の雰囲気や細部を変えることができます。以下は、テキストとモデルを変更した例です。

プロンプトやパラメータを変更

1girl, japanese school uniform, red eyes, looking at viewer, smile, blonde short hair, ahoge, large breasts, park bench, dynamic angle, full body, hyper-realistic photograph, taken with a Nikon D850 DSLR, using a Nikkor 85mm f/1.4G lens. The resolution is 45.7 megapixels, ISO sensitivity: 25,600, Shutter speed 1/8000 second.
  • sd_xl_base_1.0.safetensors
  • dreamshaperXL10_alpha2Xl10.safetensors

このように、テキストやパラメータを変更することで、画像の品質や多様性を改善することができます。

テキストは具体的で明確に, パラメータは適切に設定し, 画像はテキストと一致しているか確認しよう

ナギねこ

画像生成のコツがわかってきたね

そうだね。でも、まだ知っておいた方がいいことがあるよ

みことちゃん
ナギねこ

え?もっとあるの?

Refinerの適用

AUTOMATIC1111 web UIでは、Refinerという機能を使って、生成された画像の画質を向上させることができます。Refinerは、SDXL 1.0の別のモデルであり、生成された画像を入力として、より鮮明で滑らかな画像を出力します。しかし、RefinerはかなりのVRAMを消費するため、注意が必要です。

Refinerの使い方

  • Refinerのモデルファイル「sd_xl_refiner_1.0.safetensors」をダウンロードします。
  • ダウンロードしたモデルファイルを「models/Stable-diffusion」にコピーします。
  • web UIを再起動します。
  • 画像生成の手順と同じように、プロンプトを入力して画像を生成します。
  • 生成された画像の下にある「image2image」ボタンをクリックします。
  • 左上のプルダウンメニューから「sd_xl_refiner_1.0.safetensors」を選択します。
  • 再度「生成」を押すとRefineされた画像が画面に表示されます。

Refinerは以上です。Refineされた画像も、保存や共有ができます。

著作権と倫理問題については今だ議論中

Stable diffusion SDXL 1.0をPAUTOMATIC1111 web UIで実行する方法を紹介しましたが、このモデルは単にテキストから画像を生成するだけではありません。制限事項を持っています。

著作権と倫理問題

著作権や倫理の問題は、Stable diffusion SDXL 1.0の制限事項です。このモデルは、オープンソースとして公開されていますが、それによって生成された画像やテキストには著作権や倫理の観点から注意しなければなりません。以下は、著作権や倫理の問題に関するポイントです。

  • 生成された画像やテキストは、Stability AIや元のテキストや画像の著作者に帰属しない
  • 生成された画像やテキストは、商用利用や再配布に制限がある場合がある
  • 生成された画像やテキストは、不適切な内容や表現を含む場合がある

例えば、Stable diffusion SDXL 1.0で生成した以下の画像は、元のテキストや画像の著作者に帰属しないため、そのまま使用することはできません。また、商用利用や再配布に制限がある可能性があります。さらに、不適切な内容や表現を含む可能性があります。

Stable diffusion SDXL 1.0は画像からテキストも生成できるし、画像を加工することもできるけど、著作権や倫理に気をつけよう

ナギねこ

Stable diffusion SDXL 1.0はすごいね。色々なことができるんだね

そうだね。でも、使うときは常識とマナーを忘れないようにしよう

みことちゃん
ナギねこ

そうだね。これから安全に楽しんでAIに触れていくよ

まとめ

Stable diffusion SDXL 1.0は、テキストから高品質で多様な画像を生成できるAIモデルです。このモデルは、オープンソースとして公開されており、Pythonで実行することができます。しかし、そのためには、いくつかの環境や学習データを準備したり、テキストやパラメータを適切に設定したり、画像の品質や多様性を評価したりする必要があります。また、このモデルは、画像からテキストを生成したり、画像を加工したりすることもできますが、著作権や倫理の問題にも注意しなければなりません。SDXL 1.0はまだ開発中であり、今後も改良される可能性があります。AUTOMATIC1111 web UIも、最新版にアップデートすることで、新しい機能やモデルに対応できるかもしれません。SDXL 1.0とAUTOMATIC1111 web UIは、画像生成AIの最先端を体験できるツールです。ぜひ試してみてください。

  • この記事を書いた人

takemiko.eth

NFT VTuber | 最新の技術を知りたい人向け | VTuberとNFTを結ぶ神社の巫女⛩ | 22年6月NFTアート制作➡️9月京まふ展示➡️23年7月Nコレ大阪展示 | 毎日楽しい事が好き | Total 0.02ETH | WEB3.0やNFTの情報を発信中!

よく読まれているオススメの記事

1

VTuberとは、バーチャルなキャラクターとして動画や配信を行う人のことです。NFTとは、ネット上のデジタルコンテンツに希少性や所有権を付与する技術のことです。最近では、VTuberがNFT ...

2

NFTとは、ブロックチェーン技術を使ってデジタルアイテムの所有権や希少性を証明する仕組みです。近年、NFTはアートやゲームなど様々な分野で活用されており、多くの注目を集めています。しかし、N ...

3

NFTとは、Non-Fungible Token(非代替性トークン)の略で、ブロックチェーン上で発行されるデジタルデータの一種です。NFTは、デジタル資産に固有のIDや所有者の情報を付与する ...

-AIイラスト
-,