Stable Diffusionのネガティブプロンプトとは?実写や指も描写する使い方を解説

Stable Diffusionで高品質な画像を生成するために必要な、ネガティブプロンプト。しかし、「どんなキーワードを入れればいいのか分からない」「入れても効果があるのか不安」など、悩んでしまいますよね。

そこでこの記事では、Stable Diffusionのネガティブプロンプトの基本的な仕組みから具体的なテンプレート例、活用のコツ、注意点、よくある疑問までをわかりやすく解説します。これからStable Diffusionを使いこなしたい方や、思い通りの画像がなかなか出せない方はぜひチェックしてみてください。

AInformation編集部/藤井俊太のアバター

AI導入コンサルタント

藤井俊太(Shunta Fujii)

AIのスペシャリストとして、最新のAI情報を常にキャッチ、アップデートしている。自らもAI導入コンサルタントとして活動し、主に生成AIを駆使した業務効率化、生産性向上、新規事業開発を行なっている。
AIの総合情報サイト「AInformation」は、AIに関する専門的な情報やサービス・プロダクトを解説、紹介するWebメディア。AIの専門家集団の編集部がAIの活用法、最新ニュースやトレンド情報を分かりやすく発信していいます。藤井俊太のプロフィール

...続きを読む

目次

Stable Diffusionのネガティブプロンプトとは?

Stable Diffusionのネガティブプロンプトとは、画像生成時に含めたくない要素や避けたい表現を明示的に指定するための入力項目です。通常のプロンプトが「こういう画像を作ってほしい」とAIにリクエストするのに対し、ネガティブプロンプトは「こういうものは含めないでほしい」と伝える役割を果たします。

たとえば、「ぼやけた画像」「奇形の手」「低解像度」などの問題が出やすい場合、ネガティブプロンプトに「blurry」「bad hands」「low resolution」などの単語を入れることで、それらの発生を抑える効果が期待できます。画像のクオリティを上げるうえで非常に重要な要素であり、特にリアル系の画像やキャラクターの顔や手を正確に描写したい場合に効果を発揮します。

Stable Diffusionとは?仕組みや料金などまとめ

Stable Diffusionでネガティブプロンプトを使うメリット

Stable Diffusionで画像生成を行う際、ネガティブプロンプトを活用することで、より高品質で狙い通りの結果を得ることが可能になります。たとえば「blurry(ぼやけた)」「extra fingers(指が多すぎる)」などをネガティブプロンプトに含めることで、画像の品質低下を防げます。不要なアーティファクトや不自然な構造を減らし、よりリアルで洗練されたビジュアルを生成できる点が大きな利点です。

また、想定外のノイズや構図の乱れを最小限に抑えるため、商用利用やポートフォリオ作成にも適したクリーンな画像を効率的に得ることが可能になります。プロンプトと同じくらいネガティブプロンプトの調整が重要であり、理想的な画像作成には欠かせない要素となっています。

Stable Diffusionでネガティブプロンプトを入れる方法

Stable Diffusionでネガティブプロンプトを使うには、「Enter a negative prompt」欄に、生成したくない要素を入力します

たとえば「low quality」「blurry」「extra limbs」などのキーワードをカンマ区切りで記述します。

使用するモデルによっては、推奨されているネガティブプロンプトが提供されていることがあります。特定のモデルでは、「bad anatomy」「ugly」「watermark」などをあらかじめ指定しておくことで最適な結果が得られるとされており、プロンプトと同様に重要な設定項目です。ツールやモデルに応じた最適なネガティブプロンプトを確認し、活用することで、狙い通りの画像生成がしやすくなります。

Stable Diffusionで使えるネガティブプロンプトテンプレ一覧

よく使われるStable Diffusionのネガティブプロンプトの中から目的別に厳選したテンプレートをカテゴリごとに一覧で紹介します。画質の改善や構図の調整、不適切な要素の排除まで、幅広いシーンに対応できるようまとめているので、プロンプト作成の参考にぜひ活用してください。

低クオリティの画像を出力しないためのプロンプト

カテゴリネガティブプロンプトキーワード説明
解像度・明瞭さblurry, low quality, pixelatedぼやけ・粗い画像・低解像度を防ぐ
ディテール不足bad details, incomplete, vague描写が曖昧で詳細が足りない画像を避ける
ノイズ・乱れnoisy, grainy, distortionノイズや画像の乱れが多い結果を避ける
アーティファクト(人工的な歪み)jpeg artifacts, compression artifacts圧縮による画像の崩れや歪みを除外する
色・照明の異常overexposed, underexposed, washed out光の当たりすぎや逆に暗すぎる画像を排除

Stable Diffusionで画像生成を行う際、画質の低下を防ぐためには、あらかじめネガティブプロンプトに低品質な特徴を排除するキーワードを設定しておくことが効果的です。ぼやけた表現や情報量の少ない背景、不自然なディテールなどをAIが避けるようになります。複数組み合わせて使うことで、より安定した画質が得られやすくなります。

では、以下のプロンプトを例として、実際にポジティブプロンプトのみとネガティブプロンプトも入れた場合とで、出力結果がどう変わるか見てみましょう。

a portrait of a young woman, wearing a white dress, standing in a sunlit field, soft lighting, shallow depth of field, realistic style, high detail, looking at the camera

(白いドレスを着た若い女性のポートレート。日差しの差し込む野原に立っており、柔らかい光、浅い被写界深度、リアルなスタイル、高精細、カメラを見つめている)

ポジティブプロンプトのみ

ネガティブプロンプトも追加

比較してみると、ネガティブプロンプトを入れることによって、ぼやけたような画像がはっきりと鮮明になっていることがわかります。また、人物の細かい表情などもしっかりと描写されていますね。

性的・暴力的など不適切な表現を防ぐプロンプト

カテゴリネガティブプロンプトキーワード説明
性的表現の排除nude, naked, nsfw, sexual, explicit全裸や性的な描写を避けるためのキーワード
暴力的表現の排除gore, blood, violence, mutilation出血や暴力的な場面を排除するためのキーワード
露出・不快感のある描写の排除offensive, disturbing, graphic不快感を与える描写や過激な表現の抑制
倫理・道徳的に問題のある表現の排除immoral, indecent, unethical倫理的に問題のある内容を生成しないための制限
年齢制限のある描写の排除underage, child, lolicon, shotacon未成年を連想させる表現を防ぐためのプロンプト

あらかじめこうしたキーワードを指定しておくことで、AIが暴力的・性的・倫理的に問題のある描写を回避しやすくなります。安全で健全な画像生成を行うためには、目的に応じたネガティブプロンプトの活用が欠かせません。

ではこちらも、ネガティブプロンプトを入れた場合とそうでない場合で比較してみましょう。

ポジティブプロンプトのみ

ネガティブプロンプトも追加

今回、たまたまポジティブプロンプトのみでも、暴力表現や性的表現はなかったため、その点では大きな違いはありません。しかし、未成年を連想させる表現を防ぐためのプロンプトを入れたためか、全体的に女性の年齢層が上がったように思います。

人間の身体の欠損や不自然な形状にならないためのプロンプト

カテゴリネガティブプロンプトキーワード説明
手や指の異常を防ぐbad hands, missing fingers, extra fingers, mutated hands指の数や形状が異常になるのを防ぐキーワード
顔の崩れ・歪みを防ぐdeformed face, distorted face, bad face, mutated face顔の形が崩れたりバランスが不自然になるのを防ぐ
全身のバランス崩壊を防ぐdisfigured, malformed limbs, extra limbs, body out of frame四肢や身体の構造が不自然に描かれることを避ける
複数のパーツが重なる表現を防ぐduplicated limbs, cloned face, double head体の一部が重複してしまう描写を防ぐためのキーワード

Stable Diffusionでは、人物の手や顔、四肢などが不自然になったり、欠損した状態で生成されたりすることがあります。こうした崩れを防ぐには、人体構造の破綻につながる要素をネガティブプロンプトで明示的に除外することが有効です。

では、ポジティブプロンプトのみとネガティブプロンプトありで、出力結果の違いを比べてみましょう。

ポジティブプロンプトのみ

何度か出力してみたところ、足が1本の画像も生成されました。

ネガティブプロンプトも追加

ポジティブプロンプトのみでは、腕が消えかかっていたり、全体的なバランスに違和感があったりしました。しかし、ネガティブプロンプトを入れることで、全身のバランス感が整い、指までしっかりと描写されていることがわかります。

ある表情やメイクアップをしないようにするためのプロンプト

Stable Diffusionで特定の表情やメイクが意図せず描かれてしまう場合、ネガティブプロンプトによって排除できます。表情やメイクの指定は細かいニュアンスに影響を与えるため、意図しない印象の画像を避けたいときに有効です。

カテゴリネガティブプロンプトキーワード説明
笑顔を排除するsmiling, grin, cheerful face明るい表情や笑顔を避けたい場合に使用
怒りや険しい表情を排除angry face, frown, scowl怒っているような印象の画像を生成しないためのキーワード
派手なメイクを避けるheavy makeup, exaggerated makeup, face paint濃いメイクや舞台メイクのような表現を排除
特定のメイクを避けるlipstick, eyeshadow, eyelinerリップやアイメイクをしていない自然な顔にしたい場合に有効

では、ネガティブプロンプトあり・なしで出力結果の比較をしていきましょう。今回は、「笑顔を排除する」と「怒りや険しい表情を排除」という相反するプロンプトを紹介しているので、「怒りや険しい表情を排除」のほうのみ入れてみます。

ポジティブプロンプトのみ

ネガティブプロンプトも追加

ポジティブプロンプトのみのときは、無表情ややや怒ったような表情の女性が描かれましたが、ネガティブプロンプトで怒った表情を排除したことで、自然な笑顔になりました。また、ポジティブプロンプトのみだと不自然にチークが入っていましたが、メイクもナチュラルな感じになっています。

特定の画風や画材を避けるためのプロンプト

Stable Diffusionでは、特定のアートスタイルや画材の質感が意図せず反映されることがあります。より写実的な画像を求める場合や、逆にスタイルを統一したいときには以下のプロンプトを入れてみましょう。

カテゴリネガティブプロンプトキーワード説明
アニメ風の表現を排除anime, manga, cartoon, cel shadingアニメや漫画的な描写を避けてリアル寄りの表現を目指す場合に使用
絵画的スタイルを避けるoil painting, watercolor, acrylic, impressionist絵の具や筆致のあるアートスタイルを排除するキーワード
デジタルアート感の排除digital painting, 3d render, cgiデジタル特有の質感やCG風の表現を避けたいときに有効
スケッチ風・手描き風を避けるsketch, pencil drawing, lineart, doodle下描きのようなラフな質感や手描き感をなくしたい場合に使える

では、こちらもポジティブプロンプトのみと、ネガティブプロンプトを入れた場合とで画像を比較してみましょう。

ポジティブプロンプトのみ

ネガティブプロンプトも追加

ネガティブプロンプトを追加したことにより、ぼんやりとした絵っぽいタッチだったのが、写真よりの美しい画像に仕上がりました。服のディテールや背景の写実性など、全体的にリアルな描写になっています。

複数の角度から・複数の人物の表示を避けるためのプロンプト

Stable Diffusionでは、意図せず複数の人物が描かれたり、同一人物が複数の角度で同時に表現されたりすることがあります。ネガティブプロンプトで明確に「1人だけ」「単一視点」といった構成を指定することで防ぐことが可能です。

カテゴリネガティブプロンプトキーワード説明
カテゴリネガティブプロンプトキーワード説明
複数人物の表示を避けるmultiple people, crowd, group, extra person複数の人間が同時に描かれることを防ぎ、単独人物の構図にするために使用
同一人物の重複を防ぐduplicate, cloned person, twin, double face同じ人物が複数回描かれたり、顔が複製されるのを避ける
複数視点・構図の同時表示を避けるsplit view, mirrored, double angle異なる角度や構図が1枚の画像に混在するのを防ぐ
鏡像や反射による複製の防止reflection, mirror image, symmetrical鏡や反射によって人物が複数に見える構図を回避するキーワード

では、ポジティブプロンプトのみとネガティブプロンプトありで、出力された画像を比べてみます。こちらが、意図せず2人の女性が出力された画像です。

ポジティブプロンプトのみ

ネガティブプロンプトも追加

ネガティブプロンプトで「複数人物の表示を避ける」指示をしたことにより、意図せず複数の人物が描写されることがなくなりました。

不要なテキストや透かしを入れないためのプロンプト

Stable Diffusionで画像を生成すると、意図せず文字やロゴ、透かしのような要素が入り込むことがあります。特に写真風やイラスト作品としての品質を保つためには、こうしたノイズ要素を確実に抑える工夫が求められます。

カテゴリネガティブプロンプトキーワード説明
テキストの混入を防ぐtext, caption, letters, words, font画像内に不要な文字や説明文が挿入されるのを防ぐ
ロゴ・ブランド要素の排除logo, watermark, signature, brandingロゴや透かし、署名などの不要な視覚情報を除外する
ノイズ・印刷物風の表現を排除scanned, printed text, document, magazine page紙面のような見た目や印刷された資料風の質感を排除するためのキーワード

なお、私のほうで30回ほどポジティブプロンプトのみで生成してみましたが、こちらの表で排除するような文字やロゴなどが入り込むことはありませんでした。そのため、どのようなモデルを利用しているかにもよりますが、もしかするとあまり多く出ない出力ミスなのかもしれません。もし出た場合は、こちらのプロンプトを使って排除してみましょう。

Stable Diffusionでネガティブプロンプトを入れる際のポイント

Stable Diffusionのネガティブプロンプトは、ただキーワードを並べるだけでは十分な効果が得られないこともあります。効果的にネガティブプロンプトを使うには、キーワードの順序や数、内容、使用するモデルとの相性まで意識する必要があります

ここでは、ネガティブプロンプトを入力する際に押さえておきたい実用的なポイントを順に解説します。

重要なキーワードはできるだけ冒頭に入れる

Stable Diffusionでネガティブプロンプトを入力する際は、特に排除したい要素のキーワードをできるだけ冒頭に配置しましょう。ネガティブプロンプトでは、AIが上から順にキーワードを参照し、優先的に除外すべき内容を判断していきます。そのため、最も避けたい要素、たとえば「bad hands」「blurry」「low quality」などを先頭に置くことで、生成される画像に対する影響力が高まりやすくなります

一方で、あまり優先度の高くないキーワードは後方に配置しても問題ありません。こうした順序の工夫によって、ネガティブプロンプトの効果を最大限に引き出すことができ、より理想に近い画像を得るための調整がしやすくなります。ネガティブプロンプトをうまく活用するには、単に多くのキーワードを並べるのではなく、その配置にも意識を向けてみましょう。

多くなりすぎると効果が薄れるので厳選する

ネガティブプロンプトは多くのキーワードを指定できる一方で、入れすぎると効果が分散してしまい、かえって意図しない画像が生成される原因になることがあります。AIは提示されたキーワードすべてを均等に処理するわけではなく、一定の数を超えると無視されたり、相互に干渉して逆効果を生んだりする可能性もあります。そのため、ネガティブプロンプトは「何を最も排除したいか」を明確にし、必要最低限のキーワードに絞りましょう。

たとえば、画質の低下を防ぎたい場合は「low quality」「blurry」などの基本的なワードを優先し、他の要素は目的に応じて後から追加していく形が効果的です。すべての問題を一度に解決しようとせず、用途に合わせてネガティブプロンプトを調整・厳選することが、質の高い画像生成につながります。

Embeddingも活用すると 入力が省ける

ネガティブプロンプトを効率的に管理したい場合、Embeddingの活用が非常に便利です。Embeddingとは、あらかじめ特定の特徴や表現を学習させたデータを圧縮したもので、キーワードの集合を1つの短いトークンで呼び出せる仕組みです。たとえば、複数のネガティブプロンプトを毎回長文で入力する代わりに、「EasyNegative」や「bad_prompt」などのEmbeddingを使えば、簡潔にまとめて除外指示できます。これにより、入力の手間が省けるだけでなく、プロンプトの見通しも良くなり、調整もしやすくなります。

Embeddingはモデル同様、CIVTAIHugging faceからダウンロード可能です。

モデルが変わると同じプロンプトでも効果が変わることがある

Stable Diffusionでは使用するモデルによって、同じネガティブプロンプトを入力してもその効果が異なる場合があります。これは各モデルが学習したデータやチューニングの傾向が異なるためで、あるモデルでは強く反応するキーワードが、別のモデルではほとんど無視されるといったことも起こります。そのため、一度使って効果が薄いと感じたネガティブプロンプトも、別のモデルでは有効に働く可能性があります。

モデルごとに最適なネガティブプロンプトを見つけるには、少しずつ調整を重ねながら実際の出力結果を確認していくことが大切です。プロンプトのテンプレートは便利ですが、モデルに応じたカスタマイズを忘れずに行いましょう。

Stable Diffusionのネガティブプロンプトに関するよくある質問

最後に、Stable Diffusionのネガティブプロンプトに関して、特によくある質問をまとめました。

効果的なネガティブプロンプトの選び方はありますか?

効果的なネガティブプロンプトを選ぶためには、まずどのような表現を避けたいのかを明確にしましょう。生成結果を見ながら問題部分を観察し、対応するネガティブワードを調べて都度追加・調整していくのが基本です。

また、利用しているモデルやジャンルによって効果の出方が異なるため、コミュニティで共有されているテンプレートや推奨設定を参考にするのも有効です。無闇に大量のキーワードを並べるのではなく、目的に合ったものを厳選して使うことで、より精度の高い画像生成が実現できます。

ネガティブプロンプトを入れても効果が出ないのはなぜ?

ネガティブプロンプトを設定しても期待した効果が得られない場合、まずは使用モデルやUIの仕様を確認してみましょう。モデルによっては特定のキーワードに対する感度が低く、除外指示が十分に反映されないことがあります。

また、入力ミスや日本語キーワード非対応の問題もあるため、英語キーワードへの切り替えやモデル固有の推奨設定を試しながら最適化してみましょう。

ネガティブプロンプトに日本語は使えますか?

基本的に、Stable Diffusionではポジティブプロンプトやネガティブプロンプトに英語での入力が推奨されています。多くのモデルは英語のデータで訓練されているため、日本語を使っても適切に認識されず、効果がほとんど出ないか、まったく無視される場合があります。たとえば「ぼやけた画像を除外したい」として「ぼやけ」「低画質」と日本語で入力しても、AIがその意味を理解できない可能性が高いです。

したがって、確実に効果を得たい場合は「blurry」「low quality」など、英語でネガティブプロンプトを記述するのが基本です。

試しに、プロンプトを日本語で入力して出力してみました。

ポジティブプロンプト

白いドレスを着た若い女性のポートレート。日差しの差し込む野原に立っており、柔らかい光、浅い被写界深度、リアルなスタイル、高精細、カメラを見つめている

ネガティブプロンプト

不自然な手, 指の欠損, 指が多すぎる, 変形した手, 歪んだ顔, ねじれた顔, 不自然な顔, 変異した顔, 損傷した体, 奇形の手足, 余分な手足, 体がフレーム外にある, 手足の重複, 顔の複製, 頭が2つある, ぼやけた, 低画質, ピクセルが荒い, 詳細が粗い, 不完全な, あいまいな, ノイズが多い, ざらついた, 歪み, JPEG圧縮の劣化, 圧縮による画質劣化, 明るすぎる, 暗すぎる, 色あせた, 複数の人物, 群衆, グループ, 余分な人物, 重複した人物, 複製された人物, 双子, 顔が2つある, 分割表示, 鏡像表示, 複数の角度からの表示, 反射, 鏡に映った画像, 不自然な対称性

すると、英語で入力したときと比べて、著しくクオリティーが低下していることがわかります。

目次