生成AIの登場で、「これまで人の手で行っていたさまざまなタスクを自動化できる」という認識が広まりつつあります。その活用シーンは今やビジネスや教育、医療の現場から日常生活に至るまで多岐に渡ります。
これから生成AIの導入を考えている方は、「生成AIのできること・できないことは何?」「実際の活用事例を知りたい」などと思っている人も多いでしょう。
この記事では、生成AI初心者の方向けに基礎知識から初心者でも扱いやすいAIサービス、実際の活用事例まで紹介します。
生成AIとは?
生成AIを導入する前に、まずは「生成AIとは何か?」ついて知っておきましょう。そもそもAIが意味するのは「人工知能」です。その技術は、約70年も前から発展し続けてきました。
ここ数年の間で著しい進化を遂げた「生成AI」とこれまでのAIはどこが違うのかを踏まえつつ、生成AIの仕組みや代表的なサービスを紹介します。
これまでの技術と生成AIとの比較
これまでのAIと近年の生成AIとの違いは、簡単に言えば「AIが自ら新しいコンテンツを生み出せるかどうか」という点です。
<従来AIと生成AIの特徴を比較>
従来のAIの特徴 | 生成AIの特徴 |
人間が与えたデータを学習 限られた情報量の中での行為を自動化 | ディープラーニング(深層学習)でデータを自ら学習 新しいコンテンツを創造・提案する |
※ディープラーニングとは?:
AIの機械学習の一つで、人間の脳神経系に似た構造(人口ニューラルネットワーク)を使って、膨大なデータからその傾向や特徴をアウトプットする学習技術。
従来のAIは人間が与えたデータを学習し、そこから投げかけられた質問に忠実に回答をしたり結果を予測したりといった、あらかじめ決められた範囲内での行為を自動化するにとどまっていました。
一方で生成AIはその名の通り、自ら新しいコンテンツを作り上げることを得意としています。その裏側では、ディープラーニング(深層学習)と呼ばれる手法でAI自ら学習を重ね、その中からデータの特徴や関連性を掴むことで、より創造性のあるコンテンツを生成する仕組みが構築されています。
これまでのAIはどうしても学習するデータ量に制限があったため、一定の情報量の中でしか判断または判定するしかなかったのですが、情報を自ら深堀りして学習する生成AIの登場で、より創造的なアイデアをもとにコンテンツを作りあげられるようになりました。
生成AIの仕組み
生成AIがどのような仕組みで新たなコンテンツを生み出すのかについて解説します。まずはざっくりとした流れを見ていきましょう。
<生成AIの仕組み>
①データを学習 | テキスト、画像、音声などの大量なデータをAIモデルに学習させる(トレーニング) |
②パターン認識 | AIモデルが学習したデータからパターンや規則性をインプットする |
③生成 | パターンや規則性に基づいて新しいコンテンツをアウトプット(生成)する |
例えば、文章生成AIを例に考えてみます。AIモデルに大量の文章を学習させると、それをもとに自動で単語のつながりや文法・文章構成のアルゴリズムを理解していきます。そこから目的に沿って新たな文章を生成していく流れです。
生成AIには、それぞれ得意分野を持ったAIモデルが存在しています。次ではそのAIモデルに焦点を当てていきましょう。
生成AIの種類
生成AIが得意とする技術にはおもに5種類ありますが、まずはそれら技術を生み出している代表的なAIモデル3つを紹介します。
<生成AI技術を生み出す3つのAIモデル>
Googleが開発した自然言語処理モデルで、人間が使う言語をコンピュータに理解させる ➡文章生成、翻訳、質問応答など、さまざまなタスクで応用 | |
(Generative Adversarial Networks) | GAN2つのニューラルネットワーク(生成器と識別器)を利用して、大量のデータから複雑なパターンを学習 ➡より質の高い画像、音声などを生成する |
VAE (variational autoencoder) | 膨大なデータに潜む特徴を見つけ、そこから未来を予測 ➡新しいデータやコンテンツを生成する |
これら3つのモデルがあることで、文章・画像・音声・チャットボットといった生成技術が可能になります。以下で詳しく見ていきましょう。
<生成AI技術おもな5種類>
テキストで質問や指示を投げかけると、その内容に応じた回答を自動で生成 | |
画像生成 | テキストで指示を投げかけると、そのイメージに沿ったオリジナル画像を生成 |
動画生成 | 参考にすべき画像やテキストを投げかけると、その指示や内容に沿ってイメージを膨らませ短い動画を生成 |
音声生成 | 音声やテキストを投げかけると、その特徴を学習して新たな音声データを生成 |
質問したい内容テキストで投げかけると、その内容に応じた返答を的確に返してくれ、さらに発展的なアイデアを提案 |
この他にも、翻訳や長文を要約することも可能です。また動画の内容を自動かつ瞬時にまとめることもできるので、これまで膨大な時間を要していた作業時間が大幅に削減されます。
生成AIができることについては、この記事の後半で活用事例と合わせてより詳しく解説しています。
生成AIの代表的なサービスと特徴
生成AIにはありとあらゆるサービスが誕生しています。そこから比較的、初心者でも扱いやすい生成AIツールを3つに絞って紹介します。それぞれの特徴を踏まえつつ見ていきましょう。
<ChatGPT・Gemini・Copilot比較表>
Chat GPT | Gemini | Copilot | |
開発元 | Open AI | Microsoft・GitHub | |
言語モデル | GPT-3.5・GPT-4 | GeminiPro・ GeminiUltra | Codex |
自然な文章生 幅広い分野に対応 世界No.1のシェア | マルチモーダル処理 創造的なアイデア 高度な推論 | コーディング支援 デバッグ処理 Microsoft×Open AIが実装 | |
カスタマーサポート コンテンツ作成 翻訳 学習サポート アイデア出し | 創造的なコンテンツ作成 データ分析 研究開発 マーケティング 発展的なアイデア出し | ソフトウェア開発 Webサイト制作 データ分析 | |
※2 | コンテキストウィンドウGPT-3.5:8,000 トークン GPT-4:32,000トークン | Gemini Pro:100万トークン Gemini Ultra:- | ー |
日本語対応 | |||
料金 | 無料版:あり 有料版:月額約3,137円※1 | 無料版あり 有料版:月額2,900円 | 無料版あり 有料版:月額3,200円 |
※1:2024年1月現在の価格です。
※2:一度に処理できる情報の量のことです。
ChatGPT|世界No.1シェア
ChatGPTは今や、生成AIのNo.1シェアを誇るサービスとして多くの方が使用しています。アメリカのスタートアップ企業(Open AI社)が2022年にリリースすると、瞬く間に広まっていきました。
本に例えると25万冊分の情報を事前に学習しているため、まるで人間と会話しているようなナチュラルな受け答えができるのが魅力です。ユーザーの質問に対する回答や文章の要約、翻訳を得意としています。
Gemini|マルチモーダル機能
Geminiは、文章・画像・動画・音声を理解できる知能を意味する「マルチモーダル機能」を備えていると話題の生成AIサービスです。そのため世界No.1シェアを誇るChat GPTに勝るのではとも言われています。
中でもGemini最高言語モデル(Gemini ultra)は、ありとあらゆる分野の専門家よりも上回るパフォーマンスを発揮したと公表されました。
開発元がGoogleということもあり、拡張機能をオンにすればGoogle WorkspaceやGoogleマップ、Googleホテルなど多様なアプリとの連携が行えるので、より簡単かつスピーディーに知りたい情報が得られます。
Copilot|Microsoft×OpenAIが実装
Copilotは、MicrosoftとOpenAIが共同開発したプログラミングに特化した生成AIツールです。
コードを自動的に補完することを得意としているので、コード作成の質の向上が期待できます。コーディング速度も向上するため、大幅な作業時間の短縮が図れます。
またバグの早期発見やコードの改善を提案してくれるなど、プログラマーにとってはアシスタント的な役割を担ってくれるでしょう。
生成AIのできること・できないこと
生成AIはまだまだ発展途上の技術です。そのため当然ながら、できること・できないことがあります。以下で詳しく見ていきます。
<生成AIのできること・できないこと>
できること | できないこと | ||
テキスト作成 | 小説、詩、評論、記事、レポート、メールなどの文章を作成 翻訳、要約、校正 プログラミング チャットボットとの自然な会話 | 人間のような思考・行動 | 人間のように、感情を理解すること、共感することが難しい |
画像生成 | 写真、イラスト、絵画、デザインなどを生成 画像の編集、変換、修復 | 学習データの限界 | どうしても学習できるデータ量には限りがあるため、未知の状況への対応ができない |
動画生成 | アニメーション、CG、映像編集 | 最新情報の反映 | 学習するデータの更新にはコストがかかるため、頻繁に更新できない |
音声認識・生成 | 音声合成、音楽生成、効果音作成 | 物理的的な作業 | ネットワーク上でのタスクは行えるが、現実世界での作業はできない |
生成AIは多くの情報を事前に学習し、それをもとにユーザーのリクエストに沿った答えを導き出していきます。学習する内容や量は、かつてのAIとは比べ物にならないほどに進化を遂げているため、さまざまな分野でのタスク処理能力は人間よりも優れています。
その一方で、AIに学習させる行為には、膨大な時間やコストがかかるため常に最新情報を更新し続けていくことが難しい点が挙げられます。人間の感情においても学習させることが難しい領域なため、生成AIが人間の気持ちを理解し共感することも難しいです。
生成AIのできること・できないことをよく理解したうえで、一人ひとりにとって最適な活用の仕方を模索しましょう。
生成AIのシーン別活用事例
生成AIは実際にどのように活用されているのかについて、シーン別に紹介します。知識のない人でもすぐに取り入れられるよう、具体的なやり方もあわせて解説しているところもあるので参考にしてください。
ビジネス現場での活用事例
ビジネスシーンでの活用事例2つと、そのやり方の一例を紹介します。
会議の議事録を自動で作成する
会議の音声を録音さえしておけば、生成AIがそれらの文字起こしを自動でやってくれます。例えば、Geminiで議事録を作成する場合の具体的なやり方は以下です。
※Geminiの画面
- あらかじめZoomなどのツールで会議を録音しておく
- 録音した音声をGeminiにアップロードする
- Geminiに「この音声ファイルを文字に起こしてください。」といったプロンプトに入力する
- 文字起こしされたテキストが表示されたら、再度Geminiに「このテキストを議事録にまとめてください。」といったプロンプトを入力する
- 必要であれば、Geminiに「議事録に発言者名を追加してください。」または「要点を箇条書きにしてください。」などといった細かい指示を入力する
Geminiでは音声をアップロードしたあと、文字起こしをするよう指示すると瞬時にテキスト化してくれます。必要に応じて要点を箇条書きにまとめることや、そこから会議に出られなかった人のために情報をシェアすることも簡単です。
会議の最中の記録作業や終了後のアウトプットにかかっていた時間が大幅に削減されるため、作業効率が格段にアップします。
文章を図解に変換する
生成AIを使用すれば、文章で解説しているものをより分かりやすく図解にする作業も簡単です。伝えたいことを文字にすることはできても、それを図解にするのが苦手という人にはおすすめです。
以下では、ChatGPTと図解を作成するツール(SmartArt)を併用して作成する例を挙げています。
※ChatGPTで文章を要約後、パワーポイントで図解化
- 伝えたいことを文章でアウトプットする
- ChatGPTに上記のアウトプットした文章をコピペし、「以下の文章を階層を使って箇条書きにしてください。」といったプロンプトを入力する
- ChatGPT上に出てきた箇条書きを、パワーポイントにコピペする
- 右クリックで全文を選択して「SmartArt」をクリック後、好みのグラフィックを選択し図解化する
ChatGPTは文章を要約することが得意なので、まずは伝えたいことを殴り書きでも良いので書いてみましょう。そこからパワーポイントなどのほかツールを併用することで、図解や表の作成が簡単かつスピーディーに行えます。
教育現場での活用事例
教育現場での活用法も多岐に渡ります。生成AIの一番の特徴である「自然な会話が可能」なことを活かして、子どものやる気や探求心を引き出すサポートをしてくれます。
<教育現場での活用事例>
調べものの深堀に活用 | あるテーマについて、生成AIと対話をする中でその特徴などの仮説を立て、どんどん深堀していきながら探求心を育くむ |
授業後の振り返りに活用 | 授業で習ったことを生成AIと会話しながら振り返ることで、今回の学活かしていくためにはどうすべきかについて考える |
自由研究のアイデア出し | 何かテーマを決めて、どんな研究ができそうか生成AIにアイデア出してもらい、より発展的な研究につなげる |
生徒が自由に使えるチャットボットを設置 | 子どもが使える安心・安全なプラットフォームを設置して、子どもの積極的に学ぶ姿勢を育てる |
校務のさまざまなタスクに活用 | 教師が作成するさまざまな資料や教材のたたき台を作成して、作業効率をアップさせる |
生成AIを子どものときから使用することで一つの事柄について仮説を立て、そこからどんどん深堀していくといった積極的に学ぶ力を育てることができます。
教師の立場で見ても、生成AIを導入したほうが膨大な事務作業に時間を取られることが減るというメリットがあります。子どもとの時間が増え、よりきめ細やかなフォローができるようになるでしょう。
日常生活での活用事例
普段の生活の中でも生成AIにおける活用事例はさまざまです。日常的に使える活用法を2つ紹介します。
旅行行程を作成する
ChatGPTのチャットボット機能を使って、旅行行程を提案してもらうことが可能です。
例えば「北海道で3泊4日の旅行プランを作ってください。主に観光と食べ歩きがしたいです。予算は20万円くらいです。」といったプロンプトを入力します。すると、以下のように1日目〜4日目までの工程を瞬時に作成してくれます。
※ChatGPTの画面
※画像配置の関係により、3日目〜4日目は省略しています。
最後には旅行行程だけでなく、予算感として大体の予算の内訳が提示されているので、ざっくりとした旅行の内容を把握できます。
Geminiで以上のように旅行行程を調べると、ホテル検索後そのまま予約もできる仕組みになっているので、別サイトで調べ直す手間も省けます。
オリジナル画像を作成する
生成AIに会話をする感覚で、例えば「ユニコーンに乗った女の子の画像を作成してください。」といったプロンプトを入力すると、以下のような画像を瞬時に作成してくれます。
左画像:「ユニコーンに乗った女の子の画像を作成してください。」と入力
右画像:「森の中で赤くて長い髪でシンプルな白いドレスを着た少女が、大きな羽根を持つ白いユニコーンに乗っている画像を作成してください。」と入力
※Gemini Advancedを使用
基本的に入力したプロンプトに忠実にしたがって画像を作成してくれるのですが、イメージと違った場合は、右画像のようにさらに細かく指示すると作成し直してくれます。
生成AIの危険性と注意点
生成AIは革新的でとても便利な技術ですが、使い方を誤ると危険が伴うということを頭に入れておく必要があります。主な危険性としては以下です。
- 偽情報を鵜吞みにする
- 偏見が拡散する
- 著作権を侵害する
- プライバシーを侵害する
- 犯罪などに悪用される
生成AIはインターネット上にある膨大な情報を学習しているのですが、そのネットに上がっている内容が確かな情報なのかという判断まではできません。場合によっては、事実とは異なる情報を提示することもあるでしょう。
また、学習データが少ない分野や複雑な事柄に関しても、誤った情報を生成する可能性が高いです。ユーザーが入力したプロンプトの意図を上手く汲み取れず、的外れな回答を返す場合もあります。
これらの不安要素があるのですが、私たち人間が見極める力を養いつつ、「何事も疑ってかかる」というスタンスで使用していくことがAI社会を生きていくうえで必須の能力となるでしょう。
生成AIで今後の未来はどう変わる?
ビジネスの現場では、AIが単純作業やデータ分析を担うようになり、人間は以前より創造的な仕事に集中できるようになります。例えば、膨大なアンケート結果をまとめることをAIに任せておけば、今後はどう改善していくかの議論に集中することができるようになり、より質の高いパフォーマンスが可能になります。
日常生活の場では、自然な会話に近いやり取りで自分の好みの音楽が見つけられたり、旅行行程をより短い時間で作成したり、生成AIを使用するユーザーの数だけ活用の幅が広がっていくでしょう。
医療の現場でも近い将来、AIが画像から病名を診断できるようになるとも言われています。これまで人間がやってきた数々の作業をAIに任せられる時代がすぐそこに待っています。