【DeepSeek】業界を震撼させた中国発LLM!特徴・危険性・リスク徹底解説

DeepSeekとは?

「DeepSeek」は、中国・杭州の同名企業がリリースしたLLM(大規模言語モデル)です。

高性能かつ低コストな特徴などから、「中国からChatGPTに匹敵するLLMが登場した」と話題になりました。

生成AIの王者・ChatGPTの性能と同等、もしくは超える性能を誇り、日本語にも完全に対応しています。

2025年1月15日に登場したスマホアプリ版は、日米のアプリストアでダウンロード数1位を獲得しており、その人気ぶりが伺えますね。

また、最新モデル「R1」の高い性能と効率性は株式市場にも影響を与え、Nvidia、Alphabet(Googleの親会社)、Meta、Oracleなど、AIに多額の投資をしている企業の株価が、DeepSeekの最新モデル発表のニュースを受けて大幅に下落しました。(※1)

一般の人々もDeepSeekに注目しはじめており、今後、生成AI開発競争の主戦場は中国に移る可能性も捨てきれません。

参考記事
※1:【NVIDIA株の時価総額90兆円を吹き飛ばした】中国の生成AI「DeepSeek」は何がスゴい?

DeepSeekの良い特徴5つ

世間で色々と言われているDeepSeekですが、まずは良い特徴を5つご紹介します。

  • 完全無料
  • ChatGPTと似た機能・性能を提供
  • GPT-4o超えのLLM「DeepSeek V3」を搭載
  • o1並みのLLM「DeepSeek R1」も搭載
  • 日本語にも対応

1つずつ詳しくみていきましょう。

完全無料

DeepSeekが搭載するLLMには、トレーニング時・生成時の演算コストを抑える新技術が採用されています。

そのためか、ブラウザ版とスマホアプリ版についてはなんと、完全無料で利用が可能です。

次項で解説しますが、DeepSeekはChatGPTと同等、またはそれ以上の性能を持っているため、有料版ChatGPTへの登録を迷っていた方にとっては朗報と言えますね!

ChatGPTと同等以上の性能を提供

ブラウザ版・スマホアプリ版DeepSeekは以下のとおり、ChatGPTと似たような機能と性能を持っています。

DeepSeekの機能
  • ファイルアップロード:画像・PDFのアップロードに対応
  • DeepThink:OpenAI o1並みのLLM「DeepSeek R1」が回答を提供(1日50回まで)
  • Search:Web上の最新情報をブラウジングして、DeepSeek V3が回答を生成

GPTsやCanvasのような便利機能はまだありませんが、いずれは実装されると思います。

無料で一昔前のChatGPT Plus並みに使えるのは魅力的ですよね。

GPT-4o超えのLLM「DeepSeek V3」を搭載

DeepSeekでは、通常のチャット時とWebブラウジング時に「DeepSeek V3」というLLMが利用可能です。

こちらはなんと、GPT-4oやClaude 3.5 Sonnetに匹敵する性能を誇ります。

DeepSeek V3の具体的なスペックは、以下の画像を参照してください。

DeepSeek V3の特徴
  • 様々なベンチマークで、GPT-4oやClaude 3.5 Sonnetを上回るスコアを記録
    • 推論(MMLU-Pro / GPQA-Diamond)やデバッグ(SWE-bench Verified)でGPT4-oに圧勝
    • 数学(MATH 500 / AIME 2024)やコーディング(Codeforces)ではClaude 3.5 Sonnetにも圧勝
  • 革新的な技術でコスト削減・性能向上を実現
    • Multi-head Latent Attention(MLA):キーとバリューを圧縮して高速化・省メモリ化を実現
    • DeepSeekMoEアーキテクチャ:MoE(Mixture-of-Experts)よりも細かく、タスク別で処理を最適化
    • Multi-Token Prediction(MTP):直後の単語に加え、文章の全体像も事前に予測して回答を最適化 …etc.
  • 蒸留により、通常のLLMでありながらDeepSeek R1(後述)の推論能力を一部継承
  • 日本語にも対応

文章からソースコードまで、十分なクオリティのものが無料・無制限で生成できるというのは素晴らしいですね!

このあたりがライバルにない強みで、業界が震撼している部分でもあります。

o1並みのLLM「DeepSeek R1」も搭載

ブラウザ版・スマホアプリ版DeepSeekは、推論モデルの力で複雑な問題の解決にあたる機能「DeepThink」も完備しています。

このDeepThinkに採用されているのは「DeepSeek R1」という推論モデルで、こちらは以下のとおりOpenAI o1に同等とも言える性能を誇ります。

DeepSeek R1の特徴
  • 各種ベンチマークで正式リリース版OpenAI o1に匹敵するスコアを記録
    • 推論(GPQA-Diamond / MMLU)
    • 数学(AIME 2024 / MATH 500)
    • コーディング(Codeforces / SWE-bench Verified)
  • 大規模な強化学習(RL)と最小限の教師ありファインチューニング(SFT)で高性能を実現
    • 推論能力の向上自体はRLのみで実現
    • 思考過程の例をSFTで学習させることで推論の無限ループや破綻を防止
  • Webブラウザ版 / スマホアプリ版の「DeepThink」機能では1日50回まで無料で利用可能
  • 日本語にも対応

DeepSeekの「DeepThink」については、利用回数の制限こそありますが、OpenAI o1並みの問題解決能力が完全無料で利用可能です。

日本語にも対応

DeepSeekは、スマホアプリ版・ブラウザ版ともに日本語に対応しています。

チャット欄に日本語で入力すれば日本語での回答が返ってきますが、UIを日本語に変更することはできません。

また、DeepSeekは中国生まれのLLMだけあって、しばしば日本語の回答を返してくれないことも。

そんな時には、以下の投稿で紹介されている「英語で考えて日本語で回答すること」という一文をプロンプトに含めることで、安定して日本語の回答が得られるようなので、ぜひ試してみてください。

DeepSeekの悪い特徴・危険性4つ

おそらくみなさんが最も気になっているであろう、DeepSeekの悪い特徴・危険性を4つご紹介します。

  • ほぼ確実な情報漏洩リスク
  • 中国の検閲は確実
  • キーロガーを使用
  • ユーザーデータを中国で保管

1つずつ詳しく見ていきましょう。

ほぼ確実な情報漏洩リスク

DeepSeekの利用規約には、ブラウザ版・スマホアプリ版・API版のすべてで、個人情報を収集・保持することが明記されています。

具体的な内容は以下のとおりです。

DeepSeekのユーザーデータ関係の規約

  • 各種ユーザーデータを中国本土のサーバーにて保持
  • メールアドレス・プロンプトに加え、IPアドレス・デバイス識別子・クッキー等も取得
  • アカウント削除後も特定のユーザーデータは残存
  • 「国家情報法」等、中国本土の法律が適用
    (ユーザーデータが中国当局に開示される可能性も)
DeepSeek Privacy Policyより抜粋
【中国】国家情報法の制定より抜粋

見てわかる通り、実質的にプライバシーが全くない状態です。

企業はもちろんのこと、個人での業務利用もしないほうがいいでしょう。

中国の検閲は確実

DeepSeekがほかのAIと異なるのは、ユーザーに対して検閲するコンテンツの範囲です。

ほかのチャットボットと同様に、DeepThinkも不適切、攻撃的、または危険と見なされるプロンプトには応答しないはずです。

しかし、DeepSeekは中国企業であるため「国家権力の転覆や社会主義体制の打倒を扇動する内容」や「国家の安全や利益を脅かし、国のイメージを損なう内容」を検閲すると「The Guardian」は報じています。(※2)

そのため、1989年の天安門事件や習近平国家主席が「くまのプーさん」にたとえられる理由について尋ねても「申し訳ありませんが、その内容は私の対応範囲を超えています。別の話題について話しましょう。」といった回答が返ってくるはずです。

DeepSeekでは特定のトピックについて、以下のとおり検閲がかかるようになっています。

DeepSeek独自の検閲
  • 中国当局に批判的な内容は回答不可
  • 尖閣諸島や台湾の扱いについては中国側の見解が適用
  • 歴史上の出来事についても同上

先述のとおり、個人情報も収集されていますので、中国に旅行・出張の予定がある方はプロンプトに気をつけたほうがよいかもしれません。

台湾ではすでに、様々なリスクが拭えないという理由からDeepSeekの使用が全面禁止となりました。(※3)

参考記事
※2:We tried out DeepSeek. It worked well, until we asked it about Tiananmen Square and Taiwan

※3:台湾、中国企業「ディープシーク」のAI使用を禁止 公的機関対象に

キーロガーを使用

実は、DeepSeekはユーザーが送信するテキストだけでなく、キーストロークのパターンやリズムも追跡しています。

POINT

【キーロガー(Keylogger)とは?】

コンピュータやスマートフォンなどのデバイスにおけるキーボードやタッチパネルの操作を記録するソフトウェアまたはハードウェアのこと。

記録された情報は、テキストファイルや画像ファイルとして保存されたり、ネットワークを通じて攻撃者の元へ送信される。

つまり、DeepSeekを使用している時は、キーボードを操作するたびにユーザーが入力する内容だけでなく、「どのように」入力するかも分析されているということです。

キーロガーで記録した情報は外部に送信され、さまざまな不正に使用されるリスクがあります。

テキスト入力、音声入力、プロンプト、ファイル、フィードバック、またはDeepSeekとのすべてのやり取りが、開発元によって保存されていることは、必ずしも特殊なことではありません。

他の生成AIも同様に、モデルの学習のためにユーザーの会話データを収集しています。

ここではっきりしておきたいのは、「DeepSeekに何を共有しているか」をしっかりと認識するべきということです。

DeepSeekがデータを収集するのは「良いこと」ではありませんが、そうする企業は決してDeepSeekだけではありません。

しかし、個人情報や会話内容だけでなく、キーロガーまですべてを収集・保持・分析するDeepSeekは、その常識の範囲を超えていると言えます。

顧客データは中国で保管

さらに懸念すべきは、DeepSeekが収集したデータの保存方法です。

プライバシーポリシーによれば、DeepSeekはすべての情報を中国のサーバーに保存しています。

これは、アメリカ政府がTikTok禁止を推進した理由の一部でもありました。

また、DeepSeekがデータを保持する期間に関しては「必要な限り」としか記載されておらず、具体的な期限は設けられていません。

これはMetaがユーザーデータを扱う方法と同様ですが、ほかの企業では時間制限を設けているところもあります。

OpenAIにも「必要な限りデータを保持する」という類似の条項がありますが、30日後には一時的なチャットがサーバーから削除されると述べています。(※4)

一方、Googleはデータを最大3年間保存するとしています。(※5)

大手テクノロジー企業がプライバシーに配慮していないことは周知の事実であり、生成AIも例外ではありませんが、ある程度の節度は保たれているはずです。

その点においても、DeepSeekはプライバシーを重視する人々にとっては使いにくい生成AIと言えるでしょう。

それでも、プライバシーをある程度守りながら試してみたい場合は、Appleアカウントでのサインインがおすすめです。

なぜかというと、iCloud+の機能の一つである「メールを非公開」を活用して、ランダムなメールアドレスを生成し実際のメールアドレスへの転送が可能になるからです。

ただし、DeepSeekにメールアドレスを見えなくしても、それ以外の情報は全て収集・保持されていることや、ユーザーのすべての入力パターンを記録していることは覚えておいてくださいね。 

参考記事

DeepSeekの始め方・使い方

現在、DeepSeekはiOSAndroidのスマホアプリ版、またはブラウザ版でも利用可能です。

アプリを使って、メールアドレスや電話番号、パスワードを入力するか、GoogleアカウントやAppleアカウントで接続することで、アカウントを登録できます。

チャットボットの使い心地は、みなさんがこれまで試したほかの生成AIボットとほとんど同じです。

DeepSeekには、テキストでプロンプトを入力して回答を得るだけでなく、画像やドキュメントをアップロードして解析してもらったり、ライブカメラの映像を共有したりする機能もあります。

さらに、DeepSeekには「DeepThink」という推論モデルが搭載されており、OpenAI o1と同様に質問やプロンプトを深く考察することで、より詳細で正確な結果を提供してくれます。

API版DeepSeekの料金体系

DeepSeekでは、アプリに高性能LLMが組み込めるAPIも登場しています。

API版は、入出力の量に応じて料金が発生する従量課金制です。

モデル別の料金は以下の画像を参考にしてください。

ブラウザ版・スマホアプリ版とは違い料金が発生しますので、注意してくださいね。

DeepSeekの商用利用・ライセンスについて

DeepSeekの各モデルについては、生成物とモデル本体の両方で商用利用が可能です。

DeepSeekの商用利用・ライセンスは以下を参照してください。

  • DeepSeekの生成コンテンツの著作権はユーザーに帰属
  • 生成コンテンツは個人利用や商用利用のほか、研究・製品開発・AIモデルの訓練にも使用可
  • モデル自体には「MITライセンス」が適用
  • モデルの複製・改変・統合も、無償かつ無制限で可能
  • 他ユーザーへの提供時には、DeepSeekの著作権表示&許可表示の明記が必要
DeepSeek Terms of Useより抜粋

ただし、「悪い特徴・危険性」でも触れたように、DeepSeekはユーザーのありとあらゆる全ての情報を収集・保持・分析しています。

こういったセキュリティリスクの観点からも、DeepSeekの社内利用は控えたほうがいいでしょう。

DeepSeekのよくある質問

最後に、DeepSeekでよくあるお悩み・質問にお答えしていきます。

無料で使える?

DeepSeekには4種類の提供形態がありますが、そのうち下記においては完全無料で利用が可能です。

  • Webブラウザ版
  • スマホアプリ版(iOS / Android)
  • Hugging Face版

API版DeepSeekでは、入出力の量に応じて料金が発生(従量課金制)します。

日本語にも対応している?

DeepSeekに搭載されるLLM(DeepSeek V3 / R1)自体は、日本語に対応しています。

ただし、UIや一部機能は日本語未対応です。また、回答に英語や中国語が含まれる場合もあります。

安全性・危険性は?

DeepSeekは、利用規約でユーザーのメールアドレス / プロンプト / IPアドレス / クッキーといったあらゆる情報を収集することを明示しています。加えて、収集されたユーザーの情報はアカウント削除後も残り続けるとのことなので、プライバシー面での安全性は皆無と言えるでしょう。

「プロンプトに社外秘・機密情報・個人情報は含めない」等の対策を徹底するか、もしくは業務には利用しないほうがいいかもしれません。

さいごに

この記事では、業界の勢力図を大きく変える旋風を巻き起こした中国生まれの高性能LLM「DeepSeek」について、特徴や使い方、危険性をご紹介しました。

DeepSeekには、一般ユーザー向けのノーコードで使えるブラウザ版・スマホアプリ版と、開発者向けのAPI版・Hugging Face版とがあります。

DeepSeekはプライバシー問題や検閲等、注意すべき点も多々あります。

ですが、無料でChatGPT Plus級のLLMが使えるというのは、圧倒的なアドバンテージと言えるでしょう。

危険性やリスクをしっかりと踏まえたうえで、DeepSeekをうまく活用しましょう!

最後まで読んでいただきありがとうございました。

Similar Posts