Wer hat DeepSeek V4 entwickelt? Das Unternehmen und Team hinter dem Modell

DeepSeek V4 wurde von Hangzhou DeepSeek AI entwickelt – einem Forschungslabor, das von High-Flyer Capital gegründet wurde. Erfahren Sie alles über das Unternehmen, das Team und die Philosophie.

by Framia

Wer hat DeepSeek V4 entwickelt? Das Unternehmen und Team hinter dem Modell

DeepSeek V4 ist das Werk von DeepSeek — offiziell Hangzhou DeepSeek Artificial Intelligence Co., Ltd. — einem chinesischen KI-Forschungsunternehmen, das zu einem der einflussreichsten Akteure in der globalen KI-Entwicklung geworden ist. Hier erfahren Sie alles über die Organisation, ihre Geschichte und die Philosophie, die zur Entwicklung eines der leistungsfähigsten Open-Weight-KI-Modelle der Welt geführt hat.


DeepSeek: Das Unternehmen

Vollständiger Name: Hangzhou DeepSeek Artificial Intelligence Co., Ltd.
Gegründet: 2023
Hauptsitz: Hangzhou, China (mit Forschungsstandorten in mehreren Städten)
Muttergesellschaft: High-Flyer Capital Management (ein führender chinesischer Quant-Hedgefonds)
Mission: KI-Forschung in Richtung Artificial General Intelligence (AGI) voranzutreiben

DeepSeek wurde als Tochtergesellschaft von High-Flyer Capital Management gegründet, einem der erfolgreichsten quantitativen Investmentunternehmen Chinas. Die Gründer von High-Flyer erkannten früh, dass der Aufbau grundlegender KI-Fähigkeiten sowohl strategisch als auch kommerziell wichtig ist — und dass der beste Weg dazu die Schaffung eines dedizierten, gut finanzierten KI-Forschungslabors mit einem klaren Forschungsauftrag sei.


Geschichte und wichtige Meilensteine

Jahr Meilenstein
2023 DeepSeek als KI-Forschungstochter von High-Flyer gegründet
2024 (Jan) DeepSeek-Coder veröffentlicht — wettbewerbsfähiges Code-Modell
2024 (Mai) DeepSeek-V2 veröffentlicht — erstes großes MoE-Flaggschiff
2024 (Nov) DeepSeek-V3 veröffentlicht — weltklasse Open-Source-LLM
2025 (Jan) DeepSeek-R1 veröffentlicht — Open-Source-Reasoning-Modell, das die Branche schockierte
2025 DeepSeek-V3.2 veröffentlicht — verbesserte Version von V3
2026 (9. März) DeepSeek-V4-Lite veröffentlicht (200B-Vorschau)
2026 (24. Apr) DeepSeek-V4-Pro & V4-Flash veröffentlicht — aktuelles Flaggschiff

DeepSeeks Entwicklung war bemerkenswert konsequent: Jede große Veröffentlichung hat die führenden Modelle von OpenAI, Google und Anthropic erreicht oder übertroffen — zu einem Bruchteil der gemeldeten Trainingskosten.


Das Team und die Forschungskultur

DeepSeek zeichnet sich durch eine Forschung-zuerst-Kultur aus. Im Gegensatz zu vielen KI-Labors, die Produkteinführungen und Umsatzwachstum priorisieren, ist DeepSeeks Team bekannt für:

  • Veröffentlichung detaillierter technischer Berichte parallel zu Modell-Releases
  • Open-Sourcing der Gewichte unter permissiven Lizenzen (MIT)
  • Teilen von Architekturinnovationen, auf denen andere Labs aufbauen können
  • Explizites Bekenntnis zu langfristiger AGI-Forschung statt kurzfristiger kommerzieller Optimierung

Der technische Bericht zu DeepSeek V4 (auf HuggingFace verfügbar) ist ein gründliches wissenschaftliches Dokument, das die hybride Aufmerksamkeitsarchitektur, mHC, den Muon-Optimizer und die Trainingspipeline beschreibt — kein Marketingprospekt.

Das Team pflegt offizielle Kommunikationskanäle über:

  • Twitter/X: @deepseek_ai
  • GitHub: github.com/deepseek-ai
  • HuggingFace: huggingface.co/deepseek-ai
  • Kontakt: service@deepseek.com

DeepSeeks Philosophie: Langfristdenken und AGI

In seinen offiziellen Kommunikationen bekennt sich DeepSeek ausdrücklich zu einer Philosophie des Langfristdenkens — Priorität für Forschungs- und Entwicklungsentscheidungen, die langfristigen Wert gegenüber kurzfristigen Kennzahlen maximieren.

Aus der V4-Ankündigung: „Wir bleiben dem Langfristdenken verpflichtet und schreiten stetig auf unser ultimatives Ziel der AGI zu."

Dies zeigt sich auf mehrere spezifische Weisen:

  1. Alles Open-Sourcen: Anstatt Modellgewichte zu monetarisieren, gibt DeepSeek sie unter MIT heraus — in der Überzeugung, dass Ökosystemwachstum und Talentgewinnung langfristig wertvoller sind
  2. Forschungstransparenz: Die Veröffentlichung detaillierter technischer Berichte fördert den Fortschritt des gesamten Feldes, auch wenn dies Konkurrenten Einblick in DeepSeeks Innovationen gibt
  3. Effizienzfokus: DeepSeek drängt konsequent die Grenzen der Recheneffizienz, in der Überzeugung, dass leistungsstarke KI günstiger zu machen der wirkungsvollste Beitrag ist

Trainingsinfrastruktur: Hardware-Unabhängigkeit

Ein besonders bemerkenswerter Aspekt von DeepSeek V4 ist sein Hardware-Kontext. DeepSeek trainierte V4 auf Huawei Ascend 950PR GPUs — chinesisch hergestellten KI-Beschleunigern — anstatt auf NVIDIA A100s oder H100s. Dies spiegelt sowohl praktische Notwendigkeit (US-Exportbeschränkungen begrenzen den Zugang chinesischer Unternehmen zu NVIDIAs fortschrittlichsten Chips) als auch strategische Absicht (Entwicklung inländischer KI-Kapazitäten) wider.

Die Tatsache, dass V4-Pro — trainiert auf Ascend-Hardware — eine Codeforces-Bewertung von 3206 erreicht und bei LiveCodeBench führt, zeigt, dass weltklasse KI-Training nun ohne NVIDIAs fortschrittlichste Chips möglich ist.

Für lokale Inferenz läuft DeepSeek V4 jedoch gut auf Standard-NVIDIA-Hardware — das H100-Ökosystem für professionelle Deployments und NVIDIA-Consumer-GPUs (mit Quantisierung) für kleinere Anwendungsfälle.


DeepSeeks Verhältnis zum breiteren KI-Ökosystem

DeepSeek arbeitet mit dem globalen KI-Ökosystem zusammen und beeinflusst es auf verschiedene Weisen:

  • Integration in westliche Tools: V4 ist nativ kompatibel mit Claude Code, OpenClaw und OpenCode
  • HuggingFace-Partnerschaft: Alle Modelle werden über HuggingFace vertrieben, dem De-facto-Standard für die Verteilung von Open-Weight-Modellen
  • API-Kompatibilität: V4s API unterstützt sowohl das OpenAI- als auch das Anthropic-Format und ist damit ein direkter Ersatz für westliche Modelle
  • Community-Engagement: DeepSeek engagiert sich aktiv mit Open-Source-Communities über GitHub Issues, HuggingFace-Diskussionen und soziale Medien

Bemerkenswerte Fakten über DeepSeek

  • DeepSeek hat konsistent Ergebnisse erzielt, die die westliche KI-Branche überraschten — wobei R1 im Januar 2025 wohl der bedeutendste Schock war, der Frontier-Reasoning-Fähigkeiten zu dramatisch niedrigeren gemeldeten Trainingskosten demonstrierte
  • DeepSeek operiert mit bemerkenswerter Transparenz für ein KI-Unternehmen — es veröffentlicht technische Berichte, teilt Trainingsdetails und kommuniziert direkt mit Forschern
  • Alle offiziellen Neuigkeiten und Updates kommen über ihre offiziellen Konten — DeepSeek warnt Nutzer ausdrücklich, sich für DeepSeek-Neuigkeiten nur auf offizielle Kanäle zu verlassen

Mit DeepSeek V4 verbinden

Ob Sie KI-Anwendungen auf Framia.pro entwickeln oder eigene Produkte erstellen — DeepSeek V4 ist heute zugänglich über:

  • API: api.deepseek.com (mit Ihrem DeepSeek-API-Schlüssel)
  • Web-Chat: chat.deepseek.com
  • Offene Gewichte: huggingface.co/deepseek-ai
  • Dokumentation: api-docs.deepseek.com

Fazit

DeepSeek ist eines der folgenreichsten KI-Labore der Welt — nicht trotz seiner chinesischen Herkunft, sondern als direktes Ergebnis seiner Forschungskultur, seines langfristigen Denkens und seines Engagements für offene Wissenschaft. DeepSeek V4 ist der bisher deutlichste Ausdruck dessen, was entsteht, wenn ein Team mit ernsthaften Rechenressourcen, Forschungstiefe und einem echten Engagement für die Weiterentwicklung von KI zum Wohle der Menschheit ohne kurzfristige kommerzielle Einschränkungen entwickelt.