中国のAIスタートアップが開発したDeepSeekが、ChatGPTを上回る性能を持っているとSNSをはじめ多くのメディアで話題になっています。その一方では「本当にChatGPTよりも凄いの?」や「中国の生成AIって怖くない?」などと疑いや不安の声が多く聞こえてきます。
DeepSeekの実力を検証するために、ChatGPTと長文の執筆や要約、英会話、メールの返信文、画像の生成などの項目について同じプロンプトで出力結果を比較してみました。
DeepSeekとは
DeepSeekとは、中国の浙江省杭州市に拠点を置くAIスタートアップDeepSeek(深度求索)社によって開発された生成AI(大規模言語モデル)です。僅か560万ドル(約8億9000万円)で開発された低コストなAIでありながら、世界で競争できる性能を持っています。
中国語だけでなく日本語や英語を含む100以上の言語で使用可能で、ChatGPTと同じくPCやスマホからチャットで利用できることに加えて、オープンソースのプログラムをローカル環境にダウンロードして使用することも出来るのが特徴です。
DeepSeekとChatGPTを比較
低コストで開発された中国製のDeepSeekが、これまで生成AIの雄として業界の先頭を走り続けてきたChatGPTを脅かそうとしています。
まずは、基本的なスペックについて表にまとめましたので、ご確認ください。
DeepSeek R1 | OpenAI O1 | |
---|---|---|
主な機能 | 論理推論数学的問題解決リアルタイム意思決定画像生成(Janus-Pro-7B) | テキスト生成一般的な自然言語処理プロジェクト機能タスク機能画像生成(DALL-E)動画生成(Sora) |
オープンソース | 可能 | 不可 |
コスト効率 | 非常に高い(OpenAI O1の約2%のコスト) | 高額 |
推論スピード | 1.8秒/クエリ | 3.5秒/クエリ |
トークン数 | 128k | 32k |
良い点 | 高い推論能力低コスト | 高い安定性幅広い対応能力 |
問題点 | タイムアウトの発生 | 高コスト |
それぞれの機能について詳しく比較して解説します。
DeepSeekの主な機能
DeepSeekの生成AIツールとしての主な機能としては、推理能力や数学的問題解決が挙げられますが、ユーザーとして実感しやすいのはリアルタイムの検索です。最新情報を入手しながら出力を行いますので、Perplexityに似た部分があります。
一方のChatGPTは、AIエージェント機能である「Operator」を最新機能としてアメリカでの提供が開始されましたが、これまでにもプロジェクト機能やタスク機能などがあり、生成AIの能力を引き出すための周辺機能が数多くあります。
オープンソース
DeepSeekが世間を驚かせているのは、無料のオープンソースとして提供されていることです。ユーザーは、ご自身のローカル環境にDeepSeekをダウンロードして、自由に使用することができます。
ChatGPTも無料で使用できるプランがありますが、ユーザー数の増加と共に無料で使用できる量の制限が厳しくなっていますので、自由度高く無料で使用することはできません。
推論スピード
DeepSeekは推論スピードの速さを売りのひとつとしています。ただし、この記事の執筆時点では多くのユーザーがアクセスしており、スピードは決して速くありません。文章を書きだすまでのスピードでは、圧倒的にChatGPTのほうが速いです。
スペックについて比較しても現実との乖離が大きい部分も数多くあります。そのため、実際に使ってみて、出力結果について確認する方が大切です。
DeepSeekとChatGPTの回答を同じプロンプトで比較
DeepSeekの性能を実感するために、ChatGPTに全く同じプロンプトを入力して、実際に出力された文章を比較してみました。
文章生成の比較
まずは、DeepSeekとChatGPTの基本機能である「文章生成」について、3つのタイプの文章を生成して比較してみました。
説明文
まずは説明する文章について比較します。プロンプトは「生成AIについて、300文字で説明してください。」です。
DeepSeekの文章生成
DeepSeekは、これまでのAIと生成AIの違いから始まり、文章・画像などの生成AIの具体名、そして、生成AIの使用に関するリスクにまで言及した内容になっています。ただし、DeepSeekは日本語の文字のカウントは苦手なようで、指定の300文字を大きく超えて、539文字の文章になっています。
ChatGPTの文章生成
ChatGPTでも含まれる要素は同じで、生成AIの説明から始まり、具体的なツール名、そして問題点までを含んだ文章になっています。文字数は244文字で、DeepSeekと比べれば指定の文字数に近いです。
メールの返信文
届いたメールへの返信文も、生成AIに依頼したい文章のひとつです。
以下の文章への返信文を依頼しています。
—————————-
鈴木様
こんにちは。
先日はありがとうございました。
次は、いつミーティングしましょうか?
山本
—————————-
DeepSeekのメールの返信文
とても分かりやすく、読みやすいフォーマットのメールの返信文が出力されました。候補日については空欄になっており、リモート対応でも可能であることにも言及しています。このまま日付などを入力するだけで返信できそうです。
ChatGPTのメールの返信文
DeepSeekの返信文と比較してみると、シンプルな文章になっています。届いたメールの温度感に合わせると、この程度の返信文のほうが適しているようにも感じます。
童話の創作
プロンプトは「しっかりと運動をした方が良いというメッセージを込めて、子供向けの童話を創作してください。文章の長さは500文字程度にしてください。」です。
DeepSeekの童話の創作
本ばかり読んでいるウサギのピョンタに、縄跳びをすればプレゼントが貰えるという設定を加えて、最後には「動くと世界が広がる」というメッセージを伝える内容になっています。
ChatGPTの童話の創作
ChatGPTでは、なまけて過ごしているクマのトロに、運動をすると育つ種が差し出され、最後には「運動するって、こんなに素敵なことが起きるんだ」というメッセージを伝えています。
どちらも似たようなストーリー展開の童話が創作されました。DeepSeekでは最後に読者に対してメッセージを伝える形になっており、一方のChatGPTでは童話らしく「おしまい」で終わっているという違いがありますが、どちらも依頼した内容にそった出力がされました。
文章要約の比較
日本国憲法の全文を貼り付けて「要約して」と依頼したところ、次のような結果になりました。
DeepSeekの文章要約
DeepSeekの要約では、各章ごとにいくつかの要点をピックアップして、出典となる条についてもカッコ書きで記述されています。
ChatGPTの文章要約
ChatGPTでは、前文を「概要」としてまとめた後に、それぞれの章について一行に収まる程度の短い文章での要約が加えられています。
英文要約の比較
DeepSeekとChatGPTで、Apple創業者のスティーブジョブスの有名な演説の全文を提供して「スティーブジョブスの演説の全文を要約して、日本語で3つの箇条書きにしてください。」と依頼してみました。
DeepSeekの英文要約
DeepSeekの要約では、3つの箇条書きの中にさらに2つずつの箇条書きによって文章が出力されました。文章は非常に読みやすく、出版物にそのまま掲載しても問題がないような日本語のクオリティです。
ChatGPTの英文要約
ChatGPTの要約もまた、スタイルは異なるものの読みやすく、要点をしっかりとまとめてくれています。各見出しごとにサブタイトルのような文言があることで、深く理解することができそうです。
トランプ大統領の演説の要約
DeepSeekとChatGPTで、トランプ大統領の就任スピーチの全文を提供して「トランプ大統領の演説の全文を要約して、日本語で3つの箇条書きにしてください。」と依頼したところ、
DeepSeekの演説の要約
DeepSeekでは、残念ながらトランプ大統領の演説の要約は、サービスの対象外のようです。これに限らず、DeepSeekは国際的な問題や、中国政府に関わることなどの政治的な問題については、対応を断られることが多く、非常に不便です。
ChatGPTの演説の要約
ChatGPTでは、依頼を断られることはなく、要点を3つにまとめて分かりやすく解説してくれました。ちなみに、ChatGPTに中国の政府首脳の演説の全文の要約を依頼してみても、やはり断られることなく分かりやすい要約が出力されました。
情報調査と提案の比較
DeepSeekとChatGPTに対して「東京から富士山までの行き方を教えてください」というプロンプトを入れてみると、次のような結果が出ました。
DeepSeekの情報調査と提案
DeepSeekの回答では、まず最初に「時間重視」や「手軽で安価」などのタイプ別の項目が示されました。上の画像は「時間重視・景色を楽しむ場合」の例です。
所要時間や料金、この行き方を選んだ場合のメリットなどが示されています。
ChatGPTの情報調査と提案
ChatGPTの場合には少し事務的で、電車とバスによる移動手段についてはDeepSeekと同じですが、この情報だけでは現地まで辿り着けなさそうです。
このような詳しい情報の調査を伴うケースでは、DeepSeek R1のリアルタイム検索機能が明らかに良い結果を示しました。