Genimiの画像生成は、高品質な画像を生み出せることで評価の高い「Imagen3」を活用して、さまざまなタイプの写真や画像が生成できる機能です。簡単なプロンプトだけで画像が生成できるだけでなく、詳細なプロンプトによって細かな条件を満たした画像を作り出すこともできます。
画像生成だけに特化した生成AIと比べても十分なレベルの画像が生み出せるGeminiについて、画像生成の手順とコツを中心に、理想の画像を生成するための方法を解説します。
Geminiの画像生成の特徴
Geminiの画像生成は、Googleが開発した高性能な大規模言語モデル(LLM)の性能と、多彩かつ豊かな表現ができる画像生成AIであるImagen3によって、品質の高い写真や画像を生み出すことが特徴です。簡易なプロンプトから直感的に画像を生成できることがGeminiの強みでしょう。
Imagenは、Googleが2022年に開発中であることを公表した画像生成AIで、さまざまな画像をデータベースに記憶させることによって新たな画像を生み出す仕組みです。技術的には、画像を非常に細かなマス目に分解して、マス目のパターンを数値情報として記憶しています。Goolgeは画像生成AIにも力を入れており、3世代目のAIとしてImagen3が最新モデルとしてGemini上で動いています。
これまでにいくつもの画像生成AIを試してきましたが、日本語で使える利便性や、短いフレーズ(「明るい雰囲気の街並み」など)からの画像生成能力などではImagen3が最も優れています。細かな内容を指定して詳細なプロンプトで動かす場合には、他にも多くの画像生成AIの選択肢がありますが、気軽に画像生成するならImagen3搭載のGeminiが便利でしょう。
Geminiの画像生成のための環境
Geminiの画像生成を行うための環境について、3つのポイントを解説します。
- Geminiの画像生成は、ウェブサイト上のGeminiのみ
- 人物を含んだ画像の生成は、有料プランのみ
- 18歳以上の年齢制限がある
Geminiの画像生成は現状、ウェブサイト上のみで利用可能です。つまり、パソコンやスマホでGeminiにアクセスすることで利用できますが、スマホの公式アプリでは画像生成できません。スマホでGeminiを使って画像生成するには、ChromeなどのウェブブラウザでGeminiにアクセスしてください。
また、人物を含んだ画像を生成するには、有料プランであるGemini Advancedへの加入が必要です。また、Advancedへの加入後であっても、日本語プロンプトでは人物は生成できませんので、英語でプロンプトを入力してください。Geminiの画像生成では2024年初旬に「人種差別だ」という指摘から社会問題となった事件が発生したため、人物を含んだ画像への対応について他の生成AIよりも慎重に開発が進められています。
なお、Geminiの規約と同様に、画像生成についても18歳以上(18禁)の規約があることにも注意が必要です。
Geminiで画像生成する手順
Geminiの画像生成は、普段からGeminiを使っているのとまったく同じアクションによって実行できます。プロンプトを入力する画面で、「描いて」や「画像を作って」などの指示をすれば、自動的にImagen3が起動して画像生成が行われます。
極めてシンプルなプロンプトとして「パンダを描いて」とだけ入力しても、こんな風に画像が生成されます。
画像生成に役立つプロンプト文言集
実際にGeminiで画像生成をしてみると、もう少し具体的な指示を出したいと感じる時があります。どのようなプロンプトを書けばよいのか分からない場合に役立つように、画像生成のためのプロンプトの文言集を作成しました。思い通りの画像が生成できるように参考にしてください。
カテゴリ | 説明 | プロンプトの具体例 |
---|---|---|
画風 | 作品の雰囲気や表現技法 | フォトリアルな、アニメ風の、水彩画タッチの、油絵のような、版画風の、イラスト調の、漫画チックな、水墨画風の、ポップな、抽象的な |
構図 | 被写体の配置や画面の構成 | クローズアップで、ロングショットで、俯瞰で、仰角で、横構図で、縦構図で、対称に、非対称に、黄金比で、三分法で |
光源 | 光の当たり方 | 自然光で、人工光で、スポットライトを当てて、逆光で、影を強調して、コントラストを強く、明るく、暗く |
色 | 色彩 | パステルカラーで、原色で、暖色系で、寒色系で、モノクロで、セピアで、赤を基調に、青を強調して |
背景 | 背景の状況や雰囲気 | 部屋の中で、街中で、自然の中で、宇宙で、抽象的な背景で、渋谷の街並みを背景に、東京の夜景を背景に |
時間帯 | 時間帯や季節 | 朝日に照らされて、夕焼けの中で、夜空に、春らしい、夏の風景、秋の紅葉、冬の雪景色、午前2時に、午後5時に |
雰囲気 | 作品全体の雰囲気 | 幻想的な、夢幻的な、神秘的な、温かい雰囲気で、冷たい雰囲気で、寂しい雰囲気で、賑やかな雰囲気で、楽しい雰囲気で、悲しい雰囲気で、怒りの、恐怖の |
その他 | その他の要素 | 滑らかなテクスチャで、金属の質感で、動いている、笑っている、怒っている、ゴシックなスタイルで、スチームパンクな雰囲気で、モネのようなタッチで |
ここで紹介した文言を組み合わせることによって、Imagen3がユーザーの意図を読み取りやすくなります。また、これらの文言を参考にしながら、自分なりの言葉でプロンプトを作成することによって、オリジナルの画像が生成できるようになりますので、色んなパターンを試してみてください。
生成された画像のダウンロード方法
Geminiによって生成された画像は、ダウンロードしてパソコンなどに保存することができます。画像の上にカーソルをあてると、右上にダウンロードボタンと「フルサイズでダウンロード」というラベルが出現します。ボタンをクリックすると自動的に画像がパソコンなどのローカルに保存されます。
ダウンロードした画像のファイルサイズをチェックすると、「2048px × 2048px」の正方形で、ウェブで使用するには十分な大きさの画像です。現在のところ、Geminiでは正方形以外の画像は作れませんので、使用目的に応じてトリミングをして横長や縦長の画像として使用してください。
著作権に関する注意点
Geminiの画像生成によって作り出した画像は、第三者の著作権やプライバシーに抵触する可能性があるとGoogleは公式に伝えています。AIによる画像生成では、インターネット等で閲覧可能な写真や絵画などをデータベースに記憶させることで新しい画像を作り出すため、著作権などを侵害する可能性を排除できません。
このため、Geminiで生成した画像を一般公開したり、印刷物などに使用する場合には、自分自身で著作権について確認しなければなりません。また、職場や学校などから発行されたGoogleアカウントでログインしてGeminiを使用している場合には、さらに細かな利用規約が設定されています。
Imagen3で生成した画像の著作権については、Google公式のアナウンスも確認してください。
画像とコンテンツの同時生成
Geminiを使った画像生成の上級編として、画像とコンテンツを同時に生成することもできます。例えば、Geminiにショートストーリーの執筆を依頼して、挿入画像やイメージ画像を同時に生成するように指示するようなケースです。
具体的なプロンプトと、実際に生成されたGeminiの画面をご紹介します。
プロンプト「勇者パンダマン(パンダを擬人化したヒーロー)が、動物園にいる動物たちを仲間に従えながら冒険をして、最後に悪の組織であるコアラ帝国の国王コアラ大王を退治してハッピーエンドとなるストーリーを作成して、挿入画像も描いてください。」
Geminiがパンダマンが主人公の文章を生成し、Imagen3がストーリーに合わせた挿入画像を生成しています。この方法を応用することによって、既にストーリーの原稿がある場合には、Geminiに原稿を提供して、挿入画像のみを生成してもらうということも可能です。
Geminiの画像生成の注意点
Geminiの画像生成でエラーが発生したり、画像が出力されないケースがあります。Geminiを使いながら「どうして画像が出ないんだ」とガッカリしてしまいますが、原因を把握して改善すれば画像が生成されます。頻繁に発生する画像生成エラーについて、まとめてご紹介します。
Googleの規約に違反している画像
Googleでは生成AIの開発を進めながらも、安全なAIの活用に力を入れています。このため、生成された画像が社会に悪影響を及ぼすものである可能性を探知すると、画像生成を中止したり、画像の表示を削除します。特に、暴力や性的表現について厳しく監視されていますので、禁止されているカテゴリについてはGeminiでの画像生成は諦めてください。
また、会社や学校で発行されたGoogleアカウントを使用している場合には、それぞれの組織ごとに追加の規約を設けている可能性があります。この場合にも同じく、特定のカテゴリの画像生成が行われません。
Geminiのカスタマイズ機能Gemとの併用は不可
「Geminiで画像が生成できない」という話題が定期的にSNS等で出てきますが、そのなかにはGeminiのカスタマイズ機能であるGemの使用時の口コミであるケースがあります。Geminiの画像生成は現在、Gem上では動かすことができません。つまり、GemではImagen3が動きません。
Gemは、Geminiを特定分野の専門家として振舞わせることができる便利な機能ですが、画像生成との併用はできません。
Geminiの画像生成まとめ
Geminiの画像生成の特徴は、Googleが独自開発した画像生成AIであるImagen3が使用でき、Geminiの文脈理解能力を活かして簡単なプロンプトでも画像が生み出せることです。使ってみると「こんな簡単にできるの?」と驚くことも多いです。指示を出している自分自身が具体的なイメージを持っておらず、曖昧なプロンプトで指示をしても、Geminiは少しの情報から画像生成をしてくれます。
画像生成に役立つプロンプトの文言集なども上手く活用しながら、Geminiでの画像生成を楽しんでください。