DeepSeek V4を作ったのは誰?モデルの背後にある企業とチーム

DeepSeek V4を開発したのは、幻方科技(High-Flyer)が設立した杭州深度求索人工智能です。企業の歴史、チーム、AGI研究への哲学を詳しく解説します。

by Framia

DeepSeek V4を作ったのは誰?モデルの背後にある企業とチーム

DeepSeek V4は、DeepSeek(正式名称:杭州深度求索人工智能有限公司)の作品です。中国のAI研究企業であり、世界のAI開発において最も影響力のある存在の一つとなっています。ここでは、その組織の全容、歴史、そしてこの世界屈指のオープンウェイトAIモデルを生み出した哲学についてご紹介します。


DeepSeek:企業概要

正式名称: 杭州深度求索人工智能有限公司
設立: 2023年
本社: 中国・杭州(複数都市に研究拠点あり)
親会社: High-Flyer Capital Management(中国を代表するクオンツヘッジファンド)
ミッション: 人工汎用知能(AGI)を目指したAI研究の推進

DeepSeekは、中国で最も成功した定量投資会社の一つであるHigh-Flyer Capital Managementの子会社として設立されました。High-Flyerの創設者たちは早い段階で、基盤となるAI能力の構築が戦略的にも商業的にも重要であると見抜き、明確な研究ミッションを持つ、十分な資金を有する専門のAI研究所を設立することが最善の方法だと判断しました。


歴史と主要なマイルストーン

マイルストーン
2023年 DeepSeekがHigh-FlyerのAI研究子会社として設立
2024年1月 DeepSeek-Coder リリース — 競争力のあるコードモデル
2024年5月 DeepSeek-V2 リリース — 初の主要MoEフラッグシップ
2024年11月 DeepSeek-V3 リリース — 世界クラスのオープンソースLLM
2025年1月 DeepSeek-R1 リリース — 業界に衝撃を与えたオープンソース推論モデル
2025年 DeepSeek-V3.2 リリース — V3の改良版
2026年3月9日 DeepSeek-V4-Lite リリース(200Bプレビュー)
2026年4月24日 DeepSeek-V4-Pro & V4-Flash リリース — 現在のフラッグシップ

DeepSeekの軌跡は非常に一貫しており、主要なリリースのたびに、OpenAI・Google・Anthropicの最先端モデルに匹敵するか、それを上回る成果を、報告されているトレーニングコストのわずかな割合で実現してきました。


チームと研究文化

DeepSeekは研究ファースト文化で知られています。多くのAIラボが製品ローンチや収益成長を優先するのとは異なり、DeepSeekのチームは以下の点で際立っています:

  • モデルリリースに合わせて詳細な技術レポートを公開
  • 許容的なライセンス(MIT)でウェイトをオープンソース化
  • 他のラボが発展させられるアーキテクチャの革新を共有
  • 短期的な商業最適化よりもAGI研究への長期的コミットメントを明示

DeepSeek V4の技術レポート(HuggingFaceで入手可能)は、ハイブリッドアテンションアーキテクチャ、mHC、Muonオプティマイザー、トレーニングパイプラインを詳述した本格的な学術文書であり、マーケティングパンフレットではありません。

チームの公式コミュニケーションチャンネル:

  • Twitter/X: @deepseek_ai
  • GitHub: github.com/deepseek-ai
  • HuggingFace: huggingface.co/deepseek-ai
  • お問い合わせ: service@deepseek.com

DeepSeekの哲学:長期主義とAGI

DeepSeekは公式コミュニケーションにおいて、長期主義の哲学を明示的に掲げています。短期的な指標よりも長期的な価値を最大化する研究開発の選択を優先するものです。

V4発表からの引用:「私たちは長期主義を貫き、AGIという究極の目標に向かって着実に前進し続けます。」

これは以下の具体的な形で現れています:

  1. すべてをオープンソース化: モデルウェイトを収益化するのではなく、MITライセンスで無償提供することで、エコシステムの成長と優秀な人材の獲得が長期的により価値があると考えています
  2. 研究の透明性: 詳細な技術レポートを公開することで、競合他社にDeepSeekの革新を知らせることになっても、分野全体の発展に貢献します
  3. 効率性へのフォーカス: DeepSeekは計算効率のフロンティアを継続的に押し広げており、強力なAIをより安価にすることが最大の貢献だと考えています

トレーニングインフラ:ハードウェアの独立性

DeepSeek V4の特筆すべき点の一つは、そのハードウェア環境です。DeepSeekはV4のトレーニングにHuawei Ascend 950PR GPU(中国製AIアクセラレーター)を使用しており、NVIDIA A100やH100は使用していません。これは、実際の必要性(米国の輸出規制により中国企業はNVIDIAの最先端チップへのアクセスが制限されている)と、国内AI能力の開発という戦略的意図の両方を反映しています。

AscendハードウェアでトレーニングされたモデルがCodeforces 3206のレーティングを達成し、LiveCodeBenchでトップに立つという事実は、世界クラスのAIトレーニングがNVIDIAの最先端チップなしでも実現できることを示しています。

ローカル推論については、DeepSeek V4は標準的なNVIDIAハードウェアでもよく動作します。プロフェッショナルな展開にはH100エコシステム、小規模な用途には量子化を使用したNVIDIAコンシューマーGPUが活用できます。


より広いAIエコシステムとのDeepSeekの関係

DeepSeekはグローバルなAIエコシステムとさまざまな形でコラボレーションし、影響を与えています:

  • 西側ツールとの統合: V4はClaude Code、OpenClaw、OpenCodeとネイティブ互換
  • HuggingFaceパートナーシップ: すべてのモデルはオープンウェイトモデル配布のデファクトスタンダードであるHuggingFaceを通じて配布
  • API互換性: V4のAPIはOpenAIとAnthropicの両フォーマットに対応しており、西側モデルのドロップイン代替として使用可能
  • コミュニティエンゲージメント: DeepSeekはGitHubのIssues、HuggingFaceのディスカッション、ソーシャルメディアを通じてオープンソースコミュニティと積極的に交流

DeepSeekに関する注目すべき事実

  • DeepSeekは一貫して西側AI業界を驚かせる成果を上げてきました。2025年1月のR1は最大の衝撃をもたらし、劇的に低い報告されているトレーニングコストでフロンティアの推論能力を実証しました
  • DeepSeekはAI企業として際立った透明性を持っており、技術レポートを公開し、トレーニングの詳細を共有し、研究者と直接コミュニケーションを取っています
  • すべての公式ニュースとアップデートは公式アカウントを通じて配信されます。DeepSeekはユーザーに対し、DeepSeekのニュースは公式チャンネルのみを信頼するよう明示的に警告しています

DeepSeek V4への接続

Framia.proでAIアプリケーションを開発している場合でも、独自の製品を開発している場合でも、DeepSeek V4は今日から以下を通じてアクセス可能です:

  • API: api.deepseek.com(DeepSeek APIキーを使用)
  • Webチャット: chat.deepseek.com
  • オープンウェイト: huggingface.co/deepseek-ai
  • ドキュメント: api-docs.deepseek.com

まとめ

DeepSeekは世界で最も重要なAIラボの一つです。それは中国企業だからではなく、その研究文化、長期的思考、そしてオープンサイエンスへのコミットメントの直接的な産物です。DeepSeek V4は、真剣な計算リソース、研究の深さ、そして人類の利益のためにAIを進歩させるという真のコミットメントを持つチームが、短期的な商業的制約なしに構築した時に何が生まれるかを、これまで以上に明確に示しています。