¿Quién creó DeepSeek V4? La empresa y el equipo detrás del modelo

DeepSeek V4 fue creado por Hangzhou DeepSeek AI, un laboratorio fundado por High-Flyer Capital. Descubre la empresa, el equipo y la filosofía detrás de este modelo de IA.

by Framia

¿Quién creó DeepSeek V4? La empresa y el equipo detrás del modelo

DeepSeek V4 es obra de DeepSeek — formalmente Hangzhou DeepSeek Artificial Intelligence Co., Ltd. — una empresa china de investigación en IA que se ha convertido en uno de los actores más influyentes del desarrollo global de la inteligencia artificial. A continuación, presentamos una visión completa de la organización, su historia y la filosofía que ha impulsado la creación de uno de los modelos de IA de pesos abiertos más capaces del mundo.


DeepSeek: La empresa

Nombre completo: Hangzhou DeepSeek Artificial Intelligence Co., Ltd. Fundada: 2023 Sede: Hangzhou, China (con operaciones de investigación en varias ciudades) Empresa matriz: High-Flyer Capital Management (uno de los principales fondos de cobertura cuantitativos de China) Misión: Impulsar la investigación en IA hacia la Inteligencia Artificial General (AGI)

DeepSeek fue fundada como filial de High-Flyer Capital Management, una de las empresas de inversión cuantitativa más exitosas de China. Los fundadores de High-Flyer comprendieron desde temprano que construir capacidades fundamentales de IA era estratégica y comercialmente crucial — y que la mejor forma de lograrlo era crear un laboratorio de investigación en IA dedicado, bien financiado, con una misión de investigación explícita.


Historia e hitos clave

Año Hito
2023 DeepSeek fundada como filial de investigación en IA de High-Flyer
2024 (ene.) DeepSeek-Coder publicado — modelo de código competitivo
2024 (may.) DeepSeek-V2 publicado — primer gran modelo insignia MoE
2024 (nov.) DeepSeek-V3 publicado — LLM de código abierto de clase mundial
2025 (ene.) DeepSeek-R1 publicado — modelo de razonamiento open-source que sacudió la industria
2025 DeepSeek-V3.2 publicado — versión mejorada de V3
2026 (9 mar.) DeepSeek-V4-Lite publicado (vista previa de 200B)
2026 (24 abr.) DeepSeek-V4-Pro & V4-Flash publicados — modelo insignia actual

La trayectoria de DeepSeek ha sido notablemente consistente: cada gran lanzamiento ha igualado o superado los modelos líderes de OpenAI, Google y Anthropic — a una fracción del coste de entrenamiento declarado.


El equipo y la cultura de investigación

DeepSeek destaca por su cultura orientada a la investigación. A diferencia de muchos laboratorios de IA que priorizan los lanzamientos de productos y el crecimiento de ingresos, el equipo de DeepSeek es reconocido por:

  • Publicar informes técnicos detallados junto con cada lanzamiento de modelo
  • Liberar pesos en código abierto bajo licencias permisivas (MIT)
  • Compartir innovaciones arquitectónicas sobre las que otros laboratorios pueden construir
  • Declarar explícitamente un compromiso a largo plazo con la investigación en AGI por encima de la optimización comercial a corto plazo

El informe técnico de DeepSeek V4 (disponible en HuggingFace) es un documento académico exhaustivo que detalla la Arquitectura de Atención Híbrida, mHC, el optimizador Muon y el pipeline de entrenamiento — no un folleto de marketing.

El equipo mantiene canales de comunicación oficiales a través de:

  • Twitter/X: @deepseek_ai
  • GitHub: github.com/deepseek-ai
  • HuggingFace: huggingface.co/deepseek-ai
  • Contacto: service@deepseek.com

La filosofía de DeepSeek: Largoplacismo y AGI

En sus comunicaciones oficiales, DeepSeek adopta explícitamente una filosofía de largoplacismo — priorizando decisiones de investigación y desarrollo que maximizan el valor a largo plazo por encima de las métricas a corto plazo.

Del anuncio de V4: «Seguimos comprometidos con el largoplacismo, avanzando de manera constante hacia nuestro objetivo final: la AGI.»

Esto se manifiesta de varias maneras concretas:

  1. Código abierto para todo: En lugar de monetizar los pesos del modelo, DeepSeek los distribuye bajo MIT — apostando por que el crecimiento del ecosistema y la atracción del talento son más valiosos a largo plazo
  2. Transparencia en la investigación: La publicación de informes técnicos detallados impulsa el avance del campo, aunque brinde a los competidores información sobre las innovaciones de DeepSeek
  3. Foco en la eficiencia: DeepSeek empuja constantemente la frontera de la eficiencia computacional, convencida de que hacer que la IA potente sea más asequible es la contribución de mayor impacto

Infraestructura de entrenamiento: Independencia del hardware

Uno de los aspectos más destacados de DeepSeek V4 es su contexto de hardware. DeepSeek entrenó V4 en GPU Huawei Ascend 950PR — aceleradoras de IA fabricadas en China — en lugar de NVIDIA A100 o H100. Esto refleja tanto una necesidad práctica (las restricciones de exportación de EE. UU. limitan el acceso de las empresas chinas a los chips más avanzados de NVIDIA) como una intención estratégica (desarrollar capacidades de IA domésticas).

El hecho de que V4-Pro — entrenado en hardware Ascend — alcance una puntuación de 3206 en Codeforces y lidere en LiveCodeBench demuestra que el entrenamiento de IA de clase mundial ya es posible sin los chips más avanzados de NVIDIA.

Para la inferencia local, sin embargo, DeepSeek V4 funciona perfectamente con hardware NVIDIA estándar — el ecosistema H100 para implementaciones profesionales y GPU de consumo NVIDIA (con cuantización) para usos de menor escala.


La relación de DeepSeek con el ecosistema global de IA

DeepSeek colabora con el ecosistema global de IA y lo influye de varias maneras:

  • Integración con herramientas occidentales: V4 es nativamente compatible con Claude Code, OpenClaw y OpenCode
  • Asociación con HuggingFace: Todos los modelos se distribuyen a través de HuggingFace, el estándar de facto para la distribución de modelos de pesos abiertos
  • Compatibilidad de API: La API de V4 es compatible con los formatos de OpenAI y Anthropic, convirtiéndolo en un sustituto directo de los modelos occidentales
  • Participación comunitaria: DeepSeek se involucra activamente con las comunidades de código abierto a través de issues en GitHub, discusiones en HuggingFace y redes sociales

Datos destacados sobre DeepSeek

  • DeepSeek ha logrado de forma consistente resultados que han sorprendido a la industria occidental de la IA — siendo R1 en enero de 2025 probablemente el mayor impacto, al demostrar capacidades de razonamiento de vanguardia con costes de entrenamiento declarados significativamente menores
  • DeepSeek opera con una transparencia notable para una empresa de IA — publicando informes técnicos, compartiendo detalles de entrenamiento y comunicándose directamente con investigadores
  • Todas las noticias y actualizaciones oficiales se publican a través de sus cuentas oficiales — DeepSeek advierte explícitamente a los usuarios que confíen únicamente en los canales oficiales para obtener información sobre DeepSeek

Cómo conectar con DeepSeek V4

Tanto si desarrollas aplicaciones de IA en Framia.pro como si creas tus propios productos, DeepSeek V4 es accesible hoy mismo a través de:

  • API: api.deepseek.com (usando tu clave API de DeepSeek)
  • Chat web: chat.deepseek.com
  • Pesos abiertos: huggingface.co/deepseek-ai
  • Documentación: api-docs.deepseek.com

Conclusión

DeepSeek es uno de los laboratorios de IA más importantes del mundo — no a pesar de ser chino, sino como resultado directo de su cultura de investigación, su visión a largo plazo y su compromiso con la ciencia abierta. DeepSeek V4 es la expresión más clara hasta la fecha de lo que ocurre cuando un equipo con recursos computacionales serios, profundidad investigadora y un compromiso genuino de avanzar en la IA para el beneficio de la humanidad construye sin restricciones comerciales a corto plazo.