近頃、急速に注目を集めている中国のAIスタートアップ「Deep Seek」について、速報解説をお届けします。創業からわずか2年ほどで世界トップクラスの大規模言語モデル(LLM)と肩を並べる性能を持つ「Deep Seek R1」をリリースし、AI業界や投資家を中心に大きな話題となっています。
1. DeepSeek とは何者?
DeepSeek(ディープシーク)は、中国で設立されたAIスタートアップです。
- 創業2年ほどの新興企業
- 創業者は40歳前後の元ヘッジファンド出身と噂される人物
これまでもLLMを複数リリースしてきましたが、トップレベルの性能とは見なされていませんでした。しかし今回リリースされた「DeepSeek R1」が、OpenAI(GPT-4)やGoogle(PaLM)と同等 とも言われる性能をアピールし、一気に世界の注目を集めています。
2. 話題のポイント:トップレベル性能を “開発費9億円” で実現
コストの常識を破壊
大規模言語モデルをトップレベルに引き上げるには、通常数百億円〜数千億円規模の資金が必要と考えられてきました。ところがDeep Seekは、約9億円という比較的少額の開発費でモデルを仕上げたと公表。これは業界の常識をくつがえす内容です。
さらにAPI利用コストも大幅に下げることができ、最大95〜97%安価とされています。仮にこれが本当なら、AI開発や運用コストの常識を大きく変える「価格破壊」と言っても過言ではありません。
NVIDIA株価への衝撃
このニュースを受け、GPU(グラフィックス・プロセッサ)最大手であるNVIDIAの株価が急落 したことも話題になりました。理由としては「NVIDIAのハイエンドGPUが“絶対に”必要というわけではなくなりそうだ」という観測が広がったためです。
3. DeepSeek の技術的特徴・3つの工夫
DeepSeekが、これまでよりはるかに小さなコストで高性能モデルを作り上げた背景には、いくつかの工夫があります。大きく分けると次の3点です。
- 計算精度の使い分け(省電力&安価なチップ活用)
- 通常、学習時には数値を極めて高精度で扱うために高性能GPUが求められます。
- DeepSeekは「重要な演算だけ高精度にし、それ以外は低精度に切り替える」など、精度に応じた計算手法を開発。
- これにより、最新GPUをフルに使わなくても十分な性能を引き出せるといいます。
- Mixture of Experts(専門家を必要な時だけ動かす)
- 大規模言語モデルは「複数の専門領域を持つサブモデルの集合」のような構造を持つことがあります。
- 通常は入力があるたびサブモデルすべてが動く設計が多いのですが、DeepSeekは必要な専門家だけを呼び出して演算させる仕組みを構築。
- その結果、計算量が削減され、学習時のコストが減るとされています。
- データ収集コストの削減(プロセス評価の簡素化)
- ChatGPT等で使われる「Chain-of-Thought(思考プロセス)に対して報酬を与える学習」には、膨大なアノテーションが必要でした。
- DeepSeekでは「結果の正誤のみを評価し、そのプロセスはモデルに任せる」手法を導入。
- アノテーションの手間を大幅に省きながら、実用レベルの性能を確保しているようです。
これらの工夫で、一見すると高精度を犠牲にする点もあるように見えますが、得られる効率性によって総合性能はトップレベルを維持できる という主張です。
4. OpenAI・Google・NVIDIA への影響は?
OpenAI・Google はピンチなのか?
「OpenAIやGoogleはピンチか?」という問いに対しては、多くの専門家が「すぐにそうはならない」と見ています。なぜならDeepSeekが採用した技術は既存の研究領域で方向性が示唆されていたものでもあるからです。しかも、これらの技術はオープンソースで公開されているため、OpenAIやGoogleも取り入れることは十分可能です。
ただし、DeepSeekが一気に知名度を高めたことは大きなインパクトです。今後「Deep Seek vs OpenAI」といった構図が認知レベルでも加速していくかもしれません。
NVIDIA はどうなる?
NVIDIAの株価下落は「ハイエンドGPUが必須とは限らないかもしれない」という市場の動揺が一因です。しかし、
- 今後もAIの高度化(AGI・ASIの実現など)を目指すなら高性能GPUの需要は大きい
- AI市場そのものが拡大している
といった背景から、GPUの需要が急激に消えるわけではない との見方が一般的です。一部では「大規模開発=NVIDIAの最新GPU」という固定観念が揺らいだため、株式市場が一時的に反応したと考えられています。
5. なぜオープンソース公開を選んだのか
DeepSeekは、トップクラスのモデルをオープンソースという形で公開しています。理由としては、認知度向上を最優先 した可能性が高いと言われています。
- 技術的な優位性がすぐにコモディティ化しやすい分野
- ならば先に「完全オープン」で存在感を世界中に示した方が有利
- オープンソースにすることで、企業や研究者が自社サーバーで動かしやすくなり、結果的にエコシステムが拡大する
LinuxがWindowsに対抗したり、その他オープンソースソフトウェアがエコシステムを生み出したりした構造と似ている面があります。
6. 中国発スタートアップとしての今後の展開
世界各国への広がり
中国企業ということで、一部ユーザーや企業はデータの取り扱いを警戒する声があります。ただ、DeepSeekは「モデル本体」もオープンソースで公開しているため、クラウドAPIを使わずとも自社サーバーで安全に動かせる 選択肢があるのは大きなポイントでしょう。
国家安全保障的な意味合い
LMは検索エンジンに次ぐ「情報の入口」になり得る技術なので、国家が重視する分野の一つです。中国政府としては、自国発のモデルが世界で広く使われるようになれば、国際的な影響力が高まる と考える可能性があります。
今のところ、Deep Seekのアプリは各国のストアでも使える状態です(利用規約には注意が必要ですが)。今後は各国の規制強化や技術的・政治的な背景で状況が変化する可能性もあるでしょう。
7. まとめ
- Deep Seek は、中国で創業2年のAIスタートアップ。大規模言語モデル「R1」で、トップクラス性能と大幅なコスト削減をアピールし話題沸騰。
- 開発費9億円、APIコスト95〜97%オフ は業界の常識を大きく揺るがし、NVIDIA株価にも影響。
- 技術的には既存の研究を高度に実装した形だが、オープンソース化と認知度拡大戦略 によって一気に世界の注目を集めた。
- OpenAIやGoogle は即座に脅かされることはないが、認知・技術競争はさらに激しくなる見通し。
- 中国発スタートアップとして、国際政治・経済面での影響も要注目。
今後もAIの進化は続き、米中を中心に熾烈な競争が繰り広げられていくと考えられます。Deep Seekの動向からは目が離せません。新しい情報が入り次第、また速報でお伝えしていきます。


コメント