ChatGPTで文字起こしはできる?その手段と便利なプロンプトを紹介

ChatGPTで文字起こしはできる?その手段と便利なプロンプトを紹介

仕事をする上で誰もが通る、「議事録作成」。録音データを聞いて、文字に起こし、要点をまとめる。一連の作業は難しくはありませんが、相当な時間を要します。また人によって内容や質、表現方法にばらつきが出てしまい、属人化してしまうことも。その中でも最も時間のかかる文字起こしを、ChatGPTに代わってもらえれば、作業の効率化が狙えます。今回はChatGPTで文字起こしする方法や便利なプロンプト、使う際の注意点について解説します。

AInformation編集部/藤井俊太のアバター

AI導入コンサルタント

藤井俊太(Shunta Fujii)

AIのスペシャリストとして、最新のAI情報を常にキャッチ、アップデートしている。自らもAI導入コンサルタントとして活動し、主に生成AIを駆使した業務効率化、生産性向上、新規事業開発を行なっている。
AIの総合情報サイト「AInformation」は、AIに関する専門的な情報やサービス・プロダクトを解説、紹介するWebメディア。AIの専門家集団の編集部がAIの活用法、最新ニュースやトレンド情報を分かりやすく発信していいます。藤井俊太のプロフィール

...続きを読む

目次

ChatGPTで文字起こしはできるのか

結論から言うと、ChatGPT単体では文字起こしはできません。なぜならChatGPTは、文章を用いた処理を得意としているので、音声からテキストへの変換は不可能です。有料版であれば音声入力は可能ですが、発言後に文字変換がおこなわれるため、リアルタイムで文字起こししていくことはできません。

そのため、ChatGPTで文字起こししたい場合は、音声認識ソフトウェアやWeb上のツールを用いておこないます。

ChatGPTで文字起こしさせるメリット

ChatGPTで文字起こしさせるメリットは3つあります。

効率よく議事録が作られる

議事録作成には、会議の時間と同等もしくはそれ以上の時間がかかります。キャノンマーケティングジャパン株式会社が2023年に実施した、議事録作成業務に関するアンケートによると、議事録作成にかける1週間あたりの平均時間は6.13時間でした。これを年間で換算すると、300時間を超えます。また作成を任せられることが多い20代は、1週間あたり8.46時間も費やしていました。これは議事録作成で1日が終わることを意味します。

このように時間のかかる議事録作成ですが、ChatGPTを使えば、文字起こしだけでなく、要点整理や見た目の調節が可能です。また業務効率がよくなるため、残業時間やコストの削減にもつながります。

重要な情報を漏らさない

複数人が参加する会議や、専門知識が必要な会議内容だと、その分情報量も増えます。そうなると例えメモしていたとしても、聞き逃しや書き間違いなどで、重要な情報を漏らしてしまう危険性があります。とくに若手が作成した場合、話されている内容に理解が追い付いておらず、しばしば間違った情報を書いてしまうでしょう。

ChatGPTを活用すれば、会議中の音声をリアルタイムで文字起こしするため、このようなミスを防げます。また自分のメモを確認しながら作業ができるため、より精度の高い議事録が作成可能です。

多言語対応していることが多い

多くのツールは、日本語以外の言語に対応しています。外国人の雇用が増えたり、海外進出が広がったりするなか、これらはワールドワイドな会議やインタビュー動画、指針発表など、さまざまな場で活用できます。

ChatGPTで文字起こしをする5つの方法

ChatGPTで文字起こしをする方法を5つ紹介します。

ChatGPTのAPI・GPT-4V

引用元:テクこや「【WordPress】インライン画像とは?文字色や書式設定のクリアの方法などを解説します!」
https://techkoya.com/wordpress-inline-graphic/

2023年にリリースされた「GPT-4V」は、ChatGPT有料版単体ではできなかった、画像改正機能と音声出力機能を持つAPIです。ChatGPT同様、多くの言語に対応しており、その精度は訛りのある英語も文字起こしできるほどです。

音声が不明瞭で正確な文章が出力できない場合は、その文章をChatGPTに読み込ませて、校正してもらうことができます。ChatGPTの延長で使用できるため、日ごろChatGPTを使用している人であれば、すぐに使いこなせるでしょう。

Googleが提供するGoogle Cloud Speech-to-Text

引用元:大塚ビジネスサービス「音声から文字を起こすサービス「Google Cloud Speech-to-Text API」をPythonで利用してみる」
https://www.otsuka-bs.co.jp/web-creation/blog/archive/20231102-02.html

「Google Cloud Speech-to-Text」は、GoogleによるAPIサービスです。音声認識精度の高さや多言語対応に定評があります。こちらはリアルタイムの音声はもちろん、音声ファイルの文字起こしも可能です。

Googleが提供するサービスのため、Googleアカウントがあれば誰でも登録可能です。大手企業だからこそ開発速度が早く、現在は疑問符やカンマなど、句読点を自動的に挿入するツールを出しています。また単語やフレーズを指定できるため、業界用語や略語を登録しておけば、より精度の高い文字起こしが出力されます。

地方自治体で採用されているログミーツ

引用元:Alsmiley 最強AI議事録&要約ツール「ログミーツ powered by GPT-3/4」https://aismiley.co.jp/product/ziku-tech_logmeetsgpt/

株式会社時空テクノロジーズが提供する「ログミーツ」は自動議事録作成ツールです。モバイル端末とWindowsアプリ版があり、対面・Web会議の両方に対応できます。誰でも使いやすいユーザビリティに定評があり、端末を使う際は専用の携帯端末のボタンを押すだけ。またAIボタンを押すだけで、要約や分析、翻訳も可能です。

ログミーツはとくに地方自治体で採用されており、長野県庁で行われた実証実験では、435時間の業務時間を削減できました。また月額1万円で利用開始できるため、トライしやすい料金設計も魅力的です。

ワンクリックで議事録作成できるYOMEL

引用元:YOMEL公式サイト https://ai.yomel.co/gijiroku/4

アーニーMLG株式会社の「YOMRL」は、ChatGPTと連携した議事録作成アプリケーションです。ワンクリックで音声認識を開始し、独自の技術で話者を識別しながらテキスト化をします。

会議終了後は、全自動で会議内容を要約します。議事録の編集・要約以外にも、キーワード検索や発言のブックマークなど、さまざまな機能を搭載。契約前に2週間のフリートライアルが可能なので、使用感を確認してから本格的な利用が可能です。

セキュリティを強化したObotSERVE

引用元:株式会社ObotAIプレスリリース https://prtimes.jp/main/html/rd/p/000000098.000036236.html

法人向け文字起こしツール「ObotSERVE」の特徴は、セキュリティの強さです。ChatGPTは入力された情報を学習データとして使用できるため、法人が使う際には情報の扱いに注意する必要があります。しかしObotSERVEはChatGPTのAPIを利用しているため、入力情報が学習データとして利用されないため、安心して使用できます。

またUIやUXのカスタマイズができ、予めプロンプトを用意することが可能です。またアクセス解析や統計分析も可能なので、会議に必要なデータもObotSERVEで作れます。これらの機能は社員の業務効率向上につながるでしょう。

高性能ボイスレコーダー・PLAUD NOTE

「PLAUD NOTE」は、Nicebuild LLC社が出したAI連携ボイスレコーダーです。スマートフォンよりも小さいレコーダーには、OpenAIのWhisperが内蔵されており、録音された音声を正確に書き起こし、要約までおこないます。こちらは会議だけでなく、通話を録音することも可能です。

PLAUDE NOTEは、スマホの背面にマグネットでぴたりとくっつき、スマホから聞こえる音声を録音します。そのためイヤホンを使いながら録音することはできません。

文字起こしさせた後に使いたい便利なプロンプト

文字起こしさせた後は、いよいよ議事録作成です。ここではChatGPTで使いたいプロンプトを紹介します。

ケバ取り・口語を文語に変換

プロンプト例

「ケバ取りしてください。口語体を文語体にして」

文字起こしをしたら、まずケバ取りをしましょう。ケバ取りとは、人間が話す時に口にする「あー」や「ええー」など、それ自体では意味をなさない言葉です。これらを削除することで、文章が読みやすくなります。

また議事録は口語体ではなく、文語体「です・ます」で記載します。一見、文章の最後を変換するだけでできそうですが、前後の文脈を踏まえて変換しなくてはいけないため、意外と時間がかかります。ChatGPTにお願いした方が効率よいでしょう。

話者や単語の修正

プロンプト例

「参加者Aは{参加者Aの名前を記載}に変更してください」

議事録では、誰がどのようなことを話したかがポイントになります。同時に表記ゆれは避けたいものです。そのような言葉の置き換えは、ChatGPTで効率よく対応できます。

これは参加者の名前だけでなく、社内や業界で使用される専門用語の変換にも応用できます。とくに略すことが多い社名や、業界特有の固有名詞は、ChatGPTが情報を持っていない場合、文字起こしした直後では不明瞭な言葉として出力されます。こちらもChatGPTに修正してもらいましょう。

会議内容の要約

プロンプト例

「会議を500文字以内で要約してください。また各議論点についての簡潔な説明と、会議で合意されたアクションアイテムを教えてください。」

議事録の目的は、話し合われた内容と決定事項、この後おこなうアクションアイテムを記録することです。こちらが整理されていると、他の人が後日見返したとき、会議内容が一目瞭然です。

しかし長時間の会議や複数の論点が話し合われた場合、これらを長い文章から探すのに時間がかかります。要約が得意なChatGPTに依頼すれば、情報を漏らすことなく整理できます。出力結果は文章でも箇条書きでも可能です。

出力形式を指定する

プロンプト例

「#出力形式

・それらをwordファイルで出力してください。」

ChatGPTに出力形式を指定できます。社内の議事録フォーマットに合わせて、主力形式を指定すると、フォーマットにそのままコピペできるようになります。

作成した文章をフォーマットに合わせて、字のサイズや色を変える作業は、その手間のわりに重要性は高くありません。しかしChatGPTに指示をすれば、指定フォーマットに近い形式で出力してくれるので、修正も最小限に済むでしょう。

ChatGPTで文字起こしをする時の注意点

ChatGPTは便利ですが、使う時には注意点があります。

文章のチェックが必要

ChatGPTがさまざまな情報を持っていますが、自社や業界の状況について詳しいわけではなく、100%正確に出力できません。とくに固有名詞や略語を使用した場合、単語として認識できないことがしばしばあります。また漢字ミスや話者の認識違いは、珍しくありません。文字起こしをしたあとは、必ず人の目で文章をチェックしましょう。

情報流出の危険がある

ChatGPTはその能力を高めるため、入力された内容や生成された回答は、AI学習やシステム改善に活用されます。そのため、社外秘の情報を直接ChatGPTに入力してしまうと、社外に情報が流出する可能性があります。

多くのツールはセキュリティ対策をしていますが、そのレベルはツールによって異なります。ツールを導入する際は、学習データが他の利用者に表示されないか、プライバシーポリシーが明確かどうか、必ず確認してください。

  今回はChatGPTで文字起こしと議事録作成する方法について、解説しました。ChatGPTを活用すれば文字起こしだけでなく、要点の整理やフォーマットへの変換などもでき、議事録を短い時間で作成することが可能です。ただChatGPTは完璧ではないので、どんな多機能であっても、あくまで議事録作成のサポートにすぎません。その特性を理解したうえで、ChatGPTで議事録作成にかける短縮させ、他の業務に注力しましょう。

目次