Geminiの画像生成を徹底解剖!画像が生成できない理由も解説

Gemini画像生成

Geminiの画像生成は、生成AIが生み出す画像のなかでも高品質なものでありながら、さらに無料で利用できる点が評価されています。「プロンプトが日本語で分かりやすい」や「スピードが早くて、あっという間に画像が生成される」など、Geminiの画像生成では日本語プロンプトでの指示や、生成までのスピードの速さが評価のポイントであるようです。

Geminiの画像生成についてさまざまな角度から情報を集め、詳しく解説します。また、Geminiでは特定のプロンプトに対する画像が生成できない問題についてもご紹介します。

目次

Geminiで画像を生成してみよう

まずは実際にGeminiで画像を生成してみましょう。例えば「相撲取りのイラストを作って」と依頼すると、次のような力士が土俵の上に勇ましく立っているイラストが生成されます。

このようにGeminiでは、日本語の短いプロンプトだけの指示で簡単にイラストや画像を作成することができますので、とても便利です。また、この画像の生成にかかった時間は約10秒程度で、とてもスピーディで高品質な画像生成と言えるでしょう。

Geminiの画像生成の使い方・プロンプト

Geminiの画像生成のためのプロンプトについて具体的に解説していきます。

基本的な画像生成の指示「〇〇のイラストを生成して」

まず、基本的な画像作成としては「〇〇のイラストを生成して」などという単純なプロンプトでもGeminiでは情報を受け取って、画像を作成してくれます。例えば、次の画像は「青い空と白い雲のイラストを生成して」と依頼したものです。

「〇〇、そして〇〇のイラストを生成して」

次に、新たな情報を追加することによって、画像内の要素を増やすこともできます。例えば、先ほどのプロンプトに対して「青い空と白い雲、そして草原のイラストを生成して」というプロンプトにすれば、次のようなイラストとなります。しっかりと草原が追加されましたね。思い通りに指示を受け入れてくれると嬉しいです。

画風を指定して「△△風の〇〇のイラストを生成して」

さらに、Geminiの画像生成では、イラストの画風について指示を与えることもできます。具体的には次のような画風の指示が可能です。

  • 写実画: 現実の世界をできる限り忠実に再現しようとする画風
  • 印象派: 光と色の効果を最も重視しつつ、対象をぼかすように描く画風
  • 抽象画: 具象的な形状にこだわらず、感情や概念などを表現する画風。
  • ポップアート: 大衆文化や広告を取り入れた、鮮やかで平面的な画風

例えば、具体的なプロンプトとしては「ポップアートの画風で猫のイラストを作成して」と指示を出すと、次のようなイラストが生成されます。もしもイラストレーターなどに依頼すると少なくとも1万円は必要そうなイラストが、わずか10秒程度で生成されました。

さらに複雑なプロンプトで画像生成するには?

Geminiの画像生成は無料で使用できますので、思い切ってさまざまなプロンプトによる指示を出してみることが、Geminiを使いこなすための近道です。是非、色んなプロンプトで画像生成を試してみましょう。

例えば「孤独そうなロボットが街を見下ろしている様子を描いた浮世絵風の画像を生成して」というプロンプトでは、次のような画像が生成されました。とても複雑なプロンプトによる依頼のように感じますが、十分に内容を理解してGeminiの画像生成が行われました。

Geminiの画像生成ができない問題

Geminiの画像生成は非常にハイレベルで便利なサービスですが、実はリリース後には色んな問題を引き起こし、2024年11月現在、「人物の画像が生成できない」という状態になっています。ただし、既に紹介した「相撲取りのイラスト」のように一部のイラストについて対応してる場合もあります。

例えば「走っている日本人のイラストを作って」や「食事をしている家族の写真を作って」という指示に対しては、「まもなく Gemini Advanced で人物の画像生成を利用できるようになります。」などのメッセージが返され、画像生成ができない状態が続いています。

GoogleのGeminiで人物の画像やイラストが生成できない理由

Googleでは2024年初めにGeminiでの画像生成への対応がリリースされました。画像生成のImagen3を搭載することによってGemini上で高品質な画像が生成できるようになったことが大々的に報じられましたが、実際に利用したユーザーからは「白人の画像が生成できない」や「黒人の画像ばかりが生成される」などと言った悪い評判が数多く出てきました。

当時、実際にプロンプトで「ノルウェーのバイキングたちの画像を生成して」や「ニューヨークを歩く人々の様子を描いた画像を生成して」などの指示を出しても、すべての登場人物が黒人男性となっており、ひとりも白人が登場しないイラストが生成されました。白人の画像が生成できないことに違和感を持った方は数多くいました。

これによって、Googleに対しては人種差別であるとの批判が殺到することとなり、人種差別問題にはナイーブなアメリカで問題となり、Googleは人物を描く画像の生成を停止しました。数週間程度での対応を目指すとの報道もありましたが、現実的には10か月以上が経っても未だに人物は生成できない状態が続いています。

Geminiの画像生成が優れている3つのポイント

Geminiの画像生成では人物の画像が生成できないという問題がありますが、それを加味してもやはり無料で高品質な画像生成ができることは大きなメリットで、さらに次の3つのポイントが優れています。

情報を含んだプロンプトに強い

Googleが持つ情報との連携に強みを持つGeminiでは、画像生成でも情報を活かした画像生成のプロンプトに強みがあります。画像生成の専用AIではありませんので、芸術性などでは他の生成AIに負けてしまう部分もありますが、情報に強いことはGeminiで画像生成を行う大きな理由となるでしょう。

例えば、「日本地図のイラストを描いて」というプロンプトに対しては、次のような画像が生成されました。単純な日本地図のイラストであるように感じてしまいますが、正確に日本地図の情報を理解してイラストに仕上げていることは、生成AIの世界では意外と凄いことです。

ただし、画像を詳しく見てみると、日本と大陸の間には見たことがない島々が存在しており、日本地図以外の部分には誤りが確認できます。つまり、Geminiの画像生成では「日本地図」という情報をしっかりと読み取って、それに対応したイラストを生成していることの証拠でもあります。さらに詳しく、朝鮮半島やユーラシア大陸に関する情報についてもプロンプトに含めば、もっと正確な地図のイラストが生成できることでしょう。

プロンプトの文脈理解の正確さ

さきほど紹介した「孤独そうなロボットが街を見下ろしている様子を描いた浮世絵風の画像を生成して」といった長文かつ複雑なプロンプトに対しても、Geminiでは内容を十分に理解して画像を生成しました。イラストレーターさんに同じ内容の依頼をしても、文脈を理解してもらえずに苦労することもあるかと思いますので、Geminiの文脈理解の正確さは人間を上回っている部分もあります。

さらに文脈表現を難しくして「砂糖菓子のような家が並ぶ、メルヘンチックな街のイラストを作成して」というプロンプトを提示してみると、このような画像が生成されました。

「砂糖菓子」「メルヘン」「家」「街」などといったプロンプトに含まれるすべての要素をくみとってイラストが生成されていることが確認できます。ただし、残念ながら街を描いたイラストであるのにも関わらず、この中には人物は一切含まれていないので、少し残念な気持ちになるのがGeminiの現状でもあります。

細かな指示にも的確に反応する

文脈の理解とともに、一度生成されたイラストの修正についても指示を的確に読み取って即座に修正したイラストを生成してくれることもGeminiの特徴のひとつでしょう。さきほどの砂糖菓子の街のイラストの生成後に続けて「上空から街を見下ろす構図にして欲しいです」というプロンプトを入力したところ、次のような画像が仕上がりました。

まさに期待した通りの俯瞰のイラストが仕上がり、さらに何人かの子供たちが街を歩いている様子が見えます。人物の画像が生成できないGeminiですが、プロンプト次第では個人や人種などが特定できないイラストについては少しずつ生成ができるようになっているようです。

この記事の最初に出したイラストのように「相撲取り」とプロンプトに含むことで力士のイラストが生成できるケースもあり、人物がすべて排除されるわけでもありません。

【まとめ】Geminiの画像生成は、人物への対応に期待

Geminiでの画像生成について、具体的なプロンプトなどを数多く紹介しながら特徴を解説させていただきました。また、現在のGeminiでは人物を含む画像が生成できない問題についても触れ、その経緯についても解説させていただきました。

Geminiは、Google社による開発であるため、機能について最新のAI技術を積極的に盛り込んだサービス提供が魅力です。また、Googleが持つ情報や文脈を読み取る能力をフル活用していることも魅力のひとつでしょう。検索エンジンの運営で蓄積されたノウハウは、画像生成においても十分に活かされています。

今後のGeminiの画像生成では、他のAIツールとの連携や、音声や動画とコラボした画像の生成などの技術開発が期待されており、今後も進化するGeminiの画像生成をチェックしておく必要がありそうです。人物の画像が生成できない問題にも早く対応が完了すると良いですね。

この記事を書いた人

AIの総合情報サイト「AInformation」は、AIに関する専門的な情報やサービス・プロダクトを解説、紹介するWebメディアです。AIの専門家集団の編集部がAIの活用法、最新ニュースやトレンド情報を分かりやすく発信しています。

目次