Qui a créé DeepSeek V4 ? L'entreprise et l'équipe derrière le modèle
DeepSeek V4 est l'œuvre de DeepSeek — officiellement Hangzhou DeepSeek Artificial Intelligence Co., Ltd. — une entreprise chinoise de recherche en IA qui est devenue l'un des acteurs les plus influents du développement mondial de l'intelligence artificielle. Voici un aperçu complet de l'organisation, de son histoire et de la philosophie qui a conduit à la création de l'un des modèles d'IA open-weight les plus performants au monde.
DeepSeek : L'entreprise
Nom complet : Hangzhou DeepSeek Artificial Intelligence Co., Ltd.
Fondée : 2023
Siège social : Hangzhou, Chine (avec des opérations de recherche dans plusieurs villes)
Société mère : High-Flyer Capital Management (l'un des principaux fonds spéculatifs quantitatifs de Chine)
Mission : Faire progresser la recherche en IA vers l'Intelligence Artificielle Générale (AGI)
DeepSeek a été fondée en tant que filiale de High-Flyer Capital Management, l'une des sociétés d'investissement quantitatif les plus performantes de Chine. Les fondateurs de High-Flyer ont compris très tôt que la construction de capacités d'IA fondamentales était à la fois stratégiquement et commercialement importante — et que la meilleure façon d'y parvenir était de créer un laboratoire de recherche en IA dédié, bien financé, avec une mission de recherche explicite.
Histoire et jalons clés
| Année | Jalon |
|---|---|
| 2023 | DeepSeek fondée en tant que filiale de recherche en IA de High-Flyer |
| 2024 (janv.) | DeepSeek-Coder publié — modèle de code compétitif |
| 2024 (mai) | DeepSeek-V2 publié — premier grand modèle MoE phare |
| 2024 (nov.) | DeepSeek-V3 publié — LLM open-source de classe mondiale |
| 2025 (janv.) | DeepSeek-R1 publié — modèle de raisonnement open-source qui a bouleversé l'industrie |
| 2025 | DeepSeek-V3.2 publié — version améliorée de V3 |
| 2026 (9 mars) | DeepSeek-V4-Lite publié (aperçu 200B) |
| 2026 (24 avr.) | DeepSeek-V4-Pro & V4-Flash publiés — modèle phare actuel |
La trajectoire de DeepSeek a été remarquablement cohérente : chaque grande publication a atteint ou dépassé les modèles leaders d'OpenAI, Google et Anthropic — pour une fraction des coûts de formation annoncés.
L'équipe et la culture de recherche
DeepSeek se distingue par sa culture axée sur la recherche. Contrairement à de nombreux laboratoires d'IA qui privilégient les lancements de produits et la croissance des revenus, l'équipe de DeepSeek est reconnue pour :
- Publier des rapports techniques détaillés en parallèle des publications de modèles
- Mettre en open-source les poids sous des licences permissives (MIT)
- Partager des innovations architecturales sur lesquelles d'autres laboratoires peuvent s'appuyer
- Affirmer explicitement un engagement à long terme envers la recherche AGI plutôt qu'une optimisation commerciale à court terme
Le rapport technique de DeepSeek V4 (disponible sur HuggingFace) est un document académique approfondi détaillant l'architecture d'attention hybride, le mHC, l'optimiseur Muon et le pipeline d'entraînement — pas une brochure marketing.
L'équipe maintient des canaux de communication officiels via :
- Twitter/X : @deepseek_ai
- GitHub : github.com/deepseek-ai
- HuggingFace : huggingface.co/deepseek-ai
- Contact : service@deepseek.com
La philosophie de DeepSeek : Longterminisme et AGI
Dans ses communications officielles, DeepSeek adopte explicitement une philosophie de longterminisme — privilégiant les choix de recherche et de développement qui maximisent la valeur à long terme plutôt que les métriques à court terme.
Extrait de l'annonce V4 : « Nous restons fidèles au longterminisme, avançant régulièrement vers notre objectif ultime qu'est l'AGI. »
Cela se manifeste de plusieurs façons concrètes :
- Tout mettre en open-source : Plutôt que de monétiser les poids des modèles, DeepSeek les distribue sous licence MIT — pari que la croissance de l'écosystème et l'attraction des talents sont plus précieuses à long terme
- Transparence de la recherche : La publication de rapports techniques détaillés fait progresser le domaine, même si cela donne aux concurrents un aperçu des innovations de DeepSeek
- Focalisation sur l'efficacité : DeepSeek repousse constamment les frontières de l'efficacité computationnelle, convaincue que rendre l'IA puissante moins coûteuse est la contribution la plus efficace possible
Infrastructure d'entraînement : Indépendance matérielle
Un aspect particulièrement remarquable de DeepSeek V4 est son contexte matériel. DeepSeek a entraîné V4 sur des GPU Huawei Ascend 950PR — des accélérateurs d'IA fabriqués en Chine — plutôt que sur des NVIDIA A100 ou H100. Cela reflète à la fois une nécessité pratique (les restrictions américaines à l'exportation limitent l'accès des entreprises chinoises aux puces les plus avancées de NVIDIA) et une intention stratégique (développer des capacités d'IA nationales).
Le fait que V4-Pro — entraîné sur du matériel Ascend — atteigne une note Codeforces de 3206 et soit en tête sur LiveCodeBench démontre que l'entraînement d'IA de classe mondiale est désormais réalisable sans les puces les plus avancées de NVIDIA.
Pour l'inférence locale, DeepSeek V4 fonctionne néanmoins très bien sur du matériel NVIDIA standard — l'écosystème H100 pour les déploiements professionnels et les GPU grand public NVIDIA (avec quantification) pour les usages à plus petite échelle.
La relation de DeepSeek avec l'écosystème IA global
DeepSeek collabore avec l'écosystème mondial de l'IA et l'influence de plusieurs façons :
- Intégration avec les outils occidentaux : V4 est nativement compatible avec Claude Code, OpenClaw et OpenCode
- Partenariat HuggingFace : Tous les modèles sont distribués via HuggingFace, le standard de facto pour la distribution de modèles open-weight
- Compatibilité API : L'API de V4 est compatible avec les formats OpenAI et Anthropic, en faisant un remplacement direct des modèles occidentaux
- Engagement communautaire : DeepSeek s'engage activement avec les communautés open-source via les issues GitHub, les discussions HuggingFace et les réseaux sociaux
Faits notables sur DeepSeek
- DeepSeek a régulièrement obtenu des résultats qui ont surpris l'industrie occidentale de l'IA — avec R1 en janvier 2025 comme choc sans doute le plus significatif, démontrant des capacités de raisonnement frontier à des coûts d'entraînement annoncés considérablement inférieurs
- DeepSeek fonctionne avec une transparence remarquable pour une entreprise d'IA — publiant des rapports techniques, partageant des détails d'entraînement et communiquant directement avec les chercheurs
- Toutes les actualités et mises à jour officielles passent par leurs comptes officiels — DeepSeek avertit explicitement les utilisateurs de ne s'appuyer que sur les canaux officiels pour les informations concernant DeepSeek
Se connecter avec DeepSeek V4
Que vous développiez des applications IA sur Framia.pro ou que vous créiez vos propres produits, DeepSeek V4 est accessible dès aujourd'hui via :
- API : api.deepseek.com (avec votre clé API DeepSeek)
- Chat web : chat.deepseek.com
- Poids ouverts : huggingface.co/deepseek-ai
- Documentation : api-docs.deepseek.com
Conclusion
DeepSeek est l'un des laboratoires d'IA les plus influents au monde — non pas malgré ses origines chinoises, mais comme produit direct de sa culture de recherche, de sa vision à long terme et de son engagement envers la science ouverte. DeepSeek V4 est l'expression la plus claire à ce jour de ce qui se produit lorsqu'une équipe disposant de ressources de calcul sérieuses, d'une profondeur de recherche et d'un véritable engagement à faire progresser l'IA au bénéfice de l'humanité construit sans contraintes commerciales à court terme.