ChatGPTを提供するOpenAI社が開発した動画生成AI「Sora」は、簡単な指示文(プロンプト)でも質の高い動画が生み出せることで、SNSを中心として話題になっているAIツールです。
文章生成AIのChatGPT、画像生成AIのDALL-Eに続いて登場したSora AIは、短い文章からもユーザーの意図をくみとって、リアルな動画や、アニメーション、レトロ風動画、未来感やスピード感のある動画を作ることができます。
この記事では、Sora AIの使い方の基本から、指示文(プロンプト)の工夫するポイント、思い通りの動画を出力するためのコツまでを、実際に生成した動画を数多く掲載しながら、詳しく解説します。
Sora AIとは?
Sora AIとは、ChatGPTと同じくOpenAIが開発した生成AIで、動画生成AIに特化して開発が行われています。専門的なスキルがなくても、テキストや画像、既存の動画から新たな動画を生成することができるので、誰でも簡単に高品質な動画を作成することが可能です。
一般向けのリリースは2024年12月9日で、高画質な動画が作れることが評価されています。しかし、動画生成に特化したその他の生成AIサービスと比較すると、動画のクオリティに見劣りする部分が多く、「Open AI社は、他の動画生成AIに追いつけるのだろうか」と不安に感じるユーザーの声も多く見られます。
Sora AIの仕組み
Soraは高度な機械学習モデルを活用して、テキストや画像から動画を生成します。入力された指示文(プロンプト)を解析し、そのイメージを動画として具現化するプロセスでは、物理法則や自然な動きを考慮しています。さらに、既存の動画素材を提供することによって新しい要素を追加したり、スタイルを変更したりすることで、新しい動画を作り出すこともできます。
OpenAIが開発したChatGPTの大規模言語モデルと、独自開発された画像認識技術の組み合わせによって、Sora AIは機能しています。
Sora AIのスペック
Sora AIはChatGPTのサブスクリプションと連携しているため、利用するためにはChatGPTの有料プランの契約が必要です。また、有料プランの種類に応じて、Sora AIのスペックが異なります。
ChatGPT Plusプラン | ChatGPT Proプラン | |
---|---|---|
月額料金 | 20ドル | 200ドル |
動画の解像度 | 最大720ピクセル | 最大1080ピクセル |
動画の秒数 | 最長5秒 | 最長20秒 |
透かし(クレジット表記) | あり | 無し |
その他の機能 | 早く生成できる |
現在のところ、Sora AI単体のプランはありません。ChatGPTのいずれかのプランに加入することによって、Sora AIを使用できます。
Sora AIができること
将来的には企業の広告や、文字の入ったPRビデオなどの制作にも対応すると期待されているSora AIは、現在のところ、次のようなことができます。
- イメージ映像を作る
- 未来の街を描いた映像を作る
- 美しい風景の映像を作る
- 簡単なアニメーションを作る
イメージを文章で伝えるだけで映像を生み出せることから、世界中のクリエイターたちが日々、創意工夫をしながらSora AIの力を引き出そうと努力しています。
Sora AIができないこと
驚くべき性能のSora AIですが、まだまだユーザーが期待する全ての機能がそなわっているわけではありません。Sora AIができないことをまとめてご紹介します。
- 4K以上の超高解像度出力
- 20秒を超える長時間の動画生成
- 複雑な編集
- 製品・サービス紹介
- リアルタイムでの動画処理
- 音声やBGMの自動生成
SNSなどでは、音声やBGMの付いた動画の生成を望む声や、4Kの高解像度の動画の生成を期待するコメントもありますが、これらの機能は今後のOpenAI社の開発に期待したいところです。
Sora AIと他サービスの比較表
他の動画生成AIと、Sora AIを比較すると次の表のようになります。
動画生成AIを比較 | Sora AI | Runway | Pika | Hailuo |
---|---|---|---|---|
最大解像度 | 1080p | 4K | 720p | 1080p |
最大の長さ | 20秒 | 30秒 | 15秒 | 25秒 |
月額料金 | $20-200 | $35-350 | $10-100 | $15-120 |
プリセット数 | 5 | 15以上 | 5以上 | 8以上 |
商用利用 | 〇 | 〇 | △ | 〇 |
動画生成AIの代表的なツールであるRunwayは、現在のところ、すべてのスペックでSora AIを上回っています。解像度や動画の長さに加えて、プロンプトの指示を理解して動画を生成する能力についてもRunwayの方が性能が良いとSNSなどでは評価されています。
Sora AIの使い方
Sora AIを起動させて、実際に動画を作るところまでの流れを解説します。
- ChatGPTにログイン
- ChatGPTの左サイドバーから「Sora」を選択
新しい画面が開き、次の画像のようにSora AIのプロンプト入力画面が表示されます。
- 画面下の入力フォームにプロンプトを入力
- 下記の説明を参照して、生成オプションを選択
生成オプションの機能を、左から順番に表にまとめました。
ファイルの追加 | 画像や動画をSora AIに提供します |
---|---|
プリセットの追加 | 5種類のプリセットから選択します |
縦横比の選択 | 動画の縦横比を3種類(16:9、1:1、9:16)から選択します |
解像度の選択 | 解像度を3種類(480ピクセル、720ピクセル、1080ピクセル)から選択します |
動画の長さの選択 | 動画の長さを4種類(5秒、10秒、15秒、20秒)から選択します |
1度に生成する動画の数 | 生成する動画の数を、1本、2本、4本から選べます |
- Enterキーを押して生成
- 次のように、動画の生成が開始されるので待機
ここでは、どのような動画ができるのかと軽い気持ちで「テスト」とだけプロンプトを入力して見たところ、おそらくテスト勉強をしている男の子の動画が作られました。
以下の項目では、実際にプロンプトを入力して生成したサンプル動画を20枚以上まとめて掲載しました。説明と合わせて動画を見ていただくと、Sora AIでどのような動画ができるのかを確認していただけます。
思い通りの動画を生成するコツ
実際にSora AIで動画を作ってみると、思うような動画ができずに残念に思うケースも少なくありません。ここでは、思い通りの動画を生成するためのコツとして「プロンプトを工夫する」「プリセットを活用する」「英語に翻訳して指示する」の3つをご紹介します。
それぞれ、実際にSora AIで生成した動画を数多く掲載していますので、皆さんの作品作りの参考にしてください。
プロンプトを工夫する
プロンプトは動画生成でもっとも重要なポイントです。指示をするプロンプトの違いによって、生成される動画には大きな違いが生まれます。
ここでは「走っているクルマの運転席からの景色」というプロンプトで作成したこの動画をベースとして、さまざまなプロンプトの工夫をしてみます。
要素を足してみる
まずは、ベースの動画に対して、さまざまな要素を足してみましょう。
具体的な描写を追加
まずは、動いているクルマですので、どのような走り方をしているのかを具体的に描写して「猛スピードで激しく揺れながら走っているクルマの運転席からの景色」としてみました。周りの景色は流れ、スピード感が表現される動画になっています。
環境設定の詳細化
続いて、環境に関する描写として天候や場所の情報を追加して「雨の日の田舎町を走っているクルマの運転席からの景色」としてみました。天気が曇り空になり、クルマのワイパーが動き出しました。
アクションやムードの指定
アクションやムードの要素を追加して「ゆったりとハンドルを動かしながら走っているクルマの運転席からの景色」としてみましょう。カーブを曲がりながら、少しよそ見をしている映像が出来上がりました。
要素を引いてみる
プロンプトは要素を追加するだけでなく、要素を引くことによっても思い通りの動画に近づけることができます。
不要な要素の除外
映像の中から不要な要素を取り除くために「窓の縁が映っていない走っているクルマの運転席からの景色」として、窓の縁取りが無い状態の動画を期待して生成してみました。狙い通りに窓枠が無くなり、すっきりとした映像になりました。
シンプルな表現への絞り込み
シンプルな表現にすることによって、意外と思い通りの動画になることがありますので「クルマからの景色」として動画を作ってみました。
ネガティブプロンプトの活用
不必要な要素を取り除くためのプロンプトの記述法をネガティブプロンプトと言います。数多くのネガティブプロンプトを付け加えて「自然がない、空がない、ビルや建物もない、人もいない、光もない、ライトの明かりしかない走っているクルマの運転席からの景色」で動画を作ってみます。
クルマのライトによって照らされた部分以外には、何もない動画が出来上がりました。
プリセットを活用する
Sora AIには、動画の雰囲気を事前にセットした「プリセット」と呼ばれる動画スタイルが5つ用意されています。ここでは「猫が部屋の中で走り回っている様子」という同じプロンプトで、それぞれのプリセットで動画を生成しました。
まず、こちらは何もプリセットを使用せずに生成した動画です。
Balloon World(バルーンワールド)
バルーンアートをイメージした動画が出力されるプリセットです。生成した動画では、部屋のソファが風船になり、そのなかを猫が楽しそうに走り回っていますね。
Stop Motion(ストップモーション)
クレイアニメーションのような独特な動きを表現するプリセットです。生成した動画ではクレイアニメの質感があり、おもちゃのような猫が走り回っています。
Archival(アーカイブ風)
ビンテージフィルムのような風合いを再現して、歴史的な場面や懐かしい雰囲気の表現に効果的なプリセットです。生成した動画でも、どこか懐かしさのある動画ができました。
Film Noir(フィルムノアール)
モノクロの映像美と劇的な陰影を演出して、ミステリアスな雰囲気や緊張感のある場面を作り出すプリセットです。レトロな映画のような雰囲気の動画を生成することができました。
Cardboard & Papercraft(段ボールとクラフト)
手作り感のある温かな質感を表現していて、NHKの教育コンテンツのような雰囲気の動画が作れるプリセットです。生成した動画でも、猫が段ボールのクラフト作品のようになっています。
英語に翻訳して指示する
一般的にSora AIは「英語の方が美しい動画が作れる」と言われています。このため、普段は日本語で指示文(プロンプト)を入力している場合でも、思うような動画ができないときには英語に翻訳したプロンプトを使用すると、美しい動画が生成される可能性があります。
日本語と英語のプロンプトで作られた動画の違いを比較するために、同じプロンプトで作った日本語と英語の動画を続けて3パターン、ご紹介します。
日本語と英語の比較1
日本語:「静かな森の中を歩く鹿」
英語:”A deer walking gracefully through a peaceful forest at dawn”
日本語と英語の比較2
日本語:「海辺で遊ぶ子供たち」
英語:”Children playing joyfully on a sunny beach”
日本語と英語の比較3
日本語:「雨上がりの街並み」
英語:”City streets glistening after rain”
Sora AIの活用事例
ここまでのプロンプトやコツを活かしながら、実際にSora AIで生成した動画の活用方法を4つご紹介します。
動物のイメージ映像を作る
Sora AIを使用することで、自然や動物を使ったイメージ映像を作ることができます。ただし、オフィスなどの人工物の生成では、まだ不得意な部分も多いので注意してください。
使用したプロンプト
Adorable animals of all kinds—puppies, kittens, rabbits, and more—appear one by one, joyfully playing together in a sunny, grassy meadow filled with laughter and fun.
未来の街を描いた映像を作る
未来感のある街並みを描くことは、Sora AIが得意とするところです。特にネオンを使って、スピード感のある映像作品は数多く作られています。この動画では、未来の東京の街を描いてみました。
使用したプロンプト
A futuristic Tokyo with sleek skyscrapers glowing in neon lights, elevated highways weaving through the city, autonomous vehicles, and robotic assistants bustling among a vibrant, tech-infused urban landscape.
美しい風景の動画を作る
草原を赤い車が走っている風景を細かく描写して、英語のプロンプトで指示をすることで、このような動画を生成することができました。将来的には何千万円をかけて作られているようなクルマのCMが、生成AIによって作られるようになるかもしれません。
使用したプロンプト
A vast and serene plain stretches endlessly, covered in lush green grass gently swaying in the breeze. The sky above is a vivid blue, with the golden sun casting warm, soft light across the landscape. In the distance, a red car glides smoothly along a winding road, adding a subtle motion to the tranquil scenery. The atmosphere is peaceful, with the rustling of grass and faint chirping of birds harmonizing with the gentle wind. The scene captures the perfect balance of stillness and movement, evoking a sense of calm and connection to nature.
簡単なアニメ動画を作る
子供向けの楽しいアニメーションを作ろうと試行錯誤した結果、バルーンのプリセットを使って、こんな動画が出来上がりました。後半は風船がはじけたのか大変なことになっていますが、複数の動画をつなぎ合わせることによって楽しいアニメーションを作れるようになるかもしれません。
使用したプロンプト
猿が象の上に乗って歩いていく短編アニメ
Sora AIの商用利用と著作権
Sora AIで生成された動画コンテンツは、商用利用が可能です。また、生成された動画の所有権はユーザーに帰属しますので、安心して利用することができます。ただし、ChatGPT Plusプランの場合には、クレジットの透かしが入るため、商用利用には不向きである場合が多いかもしれません。
また、Sora AIの動画を作成するために使用したプロンプトを含めて著作物として著作権を主張したい場合には、専門家によるアドバイスや代理のもと、適切な手続きが必要です。
さらに、Sora AIが画像を生成するために参考にしている動画データの中には、著作権のあるものが多く含まれているため、元の著作物と似ていることで著作権侵害を訴えられる可能性があります。このため、実際に商用利用する際には、他社の権利を侵害していないことを確認するようにしてください。