Gemini Liveは、Googleが開発した日本語対応の対話型AIです。Googleの生成AI「Gemini」の新機能として、AIとの自然な会話によって情報やアドバイスが受けられるようになりました。
これまでチャットでの文字による会話が中心だった生成AIは、ChatGPTの「高度な音声モード(Advanced Voice Mode)」の登場によって、音声による利用が可能になりました。Gemini Liveは、ChatGPTの数か月遅れる形でリリースされた対話型AIとなります。
Gemini Liveの使い方や基本機能、ChatGPTとの比較、さらにはGoogleの描く未来について徹底的に解説します。
Gemini Liveとは?使い勝手や基本機能を紹介
Gemini Liveとは、スマートフォンやタブレットで利用できるGoogleが開発した対話型AIのことです。2024年8月にアメリカでリリースされ、10月初旬には日本語にも対応しました。現在はAndroid OSのスマートフォンのみで、Geminiアプリをダウンロードすることで利用可能です。
AIとの自然な会話ができる
Gemini Liveの魅力は、何と言ってもAIとの自然な会話ができることです。Googleの会話機能と言えば「OK Google」でおなじみのGoogleアシスタントが2016年頃から提供されています。このため、Gemini Liveは、Googleアシスタントの進化版と説明されることも多いです。
Gemini Liveが会話レベルでGoogleアシスタントよりも圧倒的に優れている点は、インターラプトモードと呼ばれる機能です。インターラプトモードとは、Gemini LiveのAIが回答している途中でも、話に割り込んで次の質問ができます。まるで友だちと会話しているように話を進められることで、Googleアシスタントよりも自然な会話のレベルが進化していることが実感できます。
Gemini Liveの声は10種類から選べる
Gemini Liveの声は、男女含めて10種類から選択することができます。Googleアシスタントでは、赤(女性)とオレンジ(男性)の2種類のみでしたので、大幅にグレードアップしています。
選べる声は次の10種類です。なお、Googleでは音声に対して性別を明記していませんので、こちらの表では「男性風」「女性風」のGeminiの声を、男性あるいは女性と記載しています。
Geminiの音声 | 性別 | 声の特徴 | 音域 |
---|---|---|---|
Capella(カペラ) | 女性 | 穏やかな声 | 高音 |
Vega(ベガ) | 女性 | 明るい声 | 高音 |
Lyra(ライラ) | 女性 | 明るい声 | 高音 |
Orion(オリオン) | 男性 | 明るい声 | 低音 |
Dipper(ディッパー) | 男性 | 落ち着いた声 | 低音 |
Eclipse(エクリプス) | 女性 | 元気な声 | 中音 |
Ursa(ウルサ) | 女性 | 表現豊かな声 | 中音 |
Orbit(オービット) | 男性 | 元気な声 | 低音 |
Nova(ノバ) | 男性 | 表現豊かな声 | 中音 |
Pegasus(ペガサス) | 男性 | 落ち着いた声 | 低音 |
AIとの会話は文字で記録される
Gemini Liveを実際に使ってみて便利だと感じるのは、音声によって会話した内容は全て、文字で記録されていることです。つまり、全ての会話が文字起こしされます。気軽にAIと雑談した内容が文字として残りますので、聞き逃した内容を文章で確認したり、あとから振り返って情報を深掘りすることもできます。
また、Gemini AIも前の会話を記憶していますので、一度別の話に逸れた会話を元に戻して、前の会話を継続させることができます。このような継続した会話ができる点も、Googleアシスタントとは圧倒的に異なります。
Gemini Liveが画像や映像にも対応予定
スマートフォンでGemini Liveを起動させると、現段階では画面の8割から9割を意味不明な画像(模様)が占めています。音声での対話であるため、画面の表示は特に気になりませんが、今後のGemini Liveのアップデートによって、ここに画像や映像が表示されることになります。また、ユーザー側から画像や映像を提示して、AIが感想などを返す機能も搭載される予定です。
いわゆるマルチモーダル機能と呼ばれる機能で、音声、画像、映像などに対応することがGemini Liveのひとつの特徴です。今後、近い将来には画像や映像に対応するアップデートが行われる予定です。
Gemini Live利用を開始する方法と注意点
これからGemini Liveを使い始める方のために、利用を開始するまでの流れと、さらに利用時に注意するべきことを解説します。
用意するものや条件
Gemini Liveの利用にあたっては、次のものを用意してください。
- Android OSのスマートフォンまたはタブレット
- Geminiモバイルアプリ(Google Playからダウンロード)
- 個人のGoogleアカウント
- 利用者は18歳以上であること
Gemini Liveは現状、Android OSのみで起動するためiPhoneでは使用できないことは既に説明しました。また、Androidデバイスであっても、全ての機能が一気に公開されるのではなく、順番に利用可能なユーザー数を増やしていく方法が採られています。このため、新機能が登場しても、すぐには利用できない可能性がありますのでご注意ください。
なお、iPhoneでの利用開始については、iOS向けのGeminiアプリの公開後すぐに始まるとの情報が、英語メディアを中心に数多く見られます。
Geminiアプリのダウンロードと設定
Android利用者は、Google Playから「Gemini」アプリをダウンロードして、インストールすることでGemini Liveを使用できるようになります。
まず、Geminiアプリのインストール後には、GoogleアシスタントからGeminiへの切り替えの確認が行われます。つまり、これまでGoogleアシスタントが行ってきた機能の一部が、Gemini Liveへと切り替わります。
次に、Gemini Liveを始めるためには、アプリ右下にあるGemini Liveマーク(縦3本線にキラリのマーク)をタップします。最初の利用では「GeminiとLiveを開始」というガイダンスが表示されます。プライバシーに関する案内もこちらで確認が行われます。
最後に、Geminiの音声を選択する画面となります。右にスライドしながら、10種類の声のなかからお好みの音声を選んでください。
プライバシーに関する注意点
AIとの会話ができるGemini Liveですが、会話の内容や位置情報などが記録され、Google社に送信されていることには注意が必要です。これはLiveに限らず、Geminiを使用する全ての活動で共通のプライバシーポリシーによるもので、情報はアプリ開発や機械学習などに活用されます。
また、現在のところGemini Liveの使用は18歳以上であることが利用条件となっています。生成AIによって生み出される音声が、18歳以下の子供にとって相応しくない内容になる可能性があるためです。お子様のご利用については十分にご注意ください。
その他のGemini Live使用にあたっての禁止事項などは、Google公式の利用規約にてご確認ください。
Gemini LiveとChatGPTを徹底比較
対話型AIとしてGemini Liveと比較されるのが、ChatGPTの「高度な音声モード(Advanced Voice Mode)」です。2つの対話型AIをいくつかの条件で比較してみましょう。
対話型AI比較 | Gemini Live | ChatGPT |
---|---|---|
開発者 | OpenAI | |
利用料金 | 無料 | 有料 |
対応スマホ | Android | Android、iPhone |
声の種類 | 10種類 | 9種類 |
会話割り込み | 可能 | 可能 |
会話内容の記録 | あり | あり |
リアルタイムの情報 | 対応 | 非対応 |
生成AIの開発競争ではOpenAI社のChatGPTが大きく先行しましたが、音声による会話ではGoogleアシスタントで経験の蓄積があるGoogleも負けていません。それぞれの特徴について、さらに詳しく解説します。
Gemini LiveはAndroidのみ対応
開発元がGoogleであるため、Gemini LiveはAndroid版のみの対応でサービスが開始されています。今後、iPhone向けにも対応されると思われますが、現在のところiPhone版のGemini Liveに関するリリース日などの情報はありません。
これに対してChatGPTでは、AndroidとiPhoneの両OSに対応していますので、世界の大半のユーザーが利用できるというメリットがあります。
Gemini Liveは「明日の天気」が聞ける
対話型AIで競っているGemini LiveとChatGPTを使い比べてみたとき、最も大きな違いは「明日の天気」や「最新のニュース」などの最新情報の質問にも答えるGemini Liveの優秀さに驚かされます。
例えば、「明日の新宿の天気」から始まり、「今からでも参加できるイベントの候補」を聞いたり、「イベントに関連するニュース」を調べてもらったり、最新の情報についても自然な会話が進められるGemini Liveは、まさに会話できるAIパートナーです。
ChatGPTの「高度な音声モード(Advanced Voice Mode)」は、あくまで学習済みのデータとの対話になるため、明日の天気や、最新のニュースなどにはアクセスできません。
Googleが描く未来と対話型AI開発
Googleアシスタントの進化版とも紹介されるGemini Liveですが、実はGoogle社内での位置づけは、Googleグラス開発のための技術の一部となっています。
Googleグラスとは、メガネ型のウェアラブルデバイスのことで、装着しながら街を歩くことで様々な情報を得ることができる機器です。つまり、歩きながらAIと会話をして、行き先やお店、天気などの情報が得られる未来をGoogleが目指していることが分かります。
このGoogleグラスの完成に向けた開発は「プロジェクト・アストラ(Project Astra)」と名付けられており、Gemini Liveはこのプロジェクトで開発された技術の一部が、一般向けに公開されたということになります。
【まとめ】Googleの対話型AI「Gemini Live」を活用しよう
Googleが開発した対話型AI「Gemini Live」は、話の途中でも割り込めるインターラプト機能や、10種類の音声の選択、リアルタイムの情報の取得などによって、AIとの自然な会話ができるようになりました。ChatGPTの「高度な音声モード(Advanced Voice Mode)」と比べても、全ての項目において上回っているように感じます。
将来的にはGoogleグラスに搭載される可能性が高い機能を、Gemini Liveを使用することで先行して利用することができます。また、今後も次々と新しい機能のアップデートが期待されています。
「会話できるAIパートナー」であるGemini Liveを是非、日常生活などで活用してみてください。