Кто создал DeepSeek V4? Компания и команда, стоящие за моделью

DeepSeek V4 создан компанией Hangzhou DeepSeek AI — исследовательской лабораторией, основанной High-Flyer Capital. Узнайте об истории компании, команде и философии.

by Framia

Кто создал DeepSeek V4? Компания и команда, стоящие за моделью

DeepSeek V4 — это работа DeepSeek — официально Hangzhou DeepSeek Artificial Intelligence Co., Ltd. — китайской компании в области исследований ИИ, ставшей одним из самых влиятельных игроков в мировом развитии искусственного интеллекта. Перед вами полный обзор организации, её истории и философии, которая привела к созданию одной из самых мощных моделей ИИ с открытыми весами в мире.


DeepSeek: Компания

Полное название: Hangzhou DeepSeek Artificial Intelligence Co., Ltd. Основана: 2023 Штаб-квартира: Ханчжоу, Китай (с исследовательскими подразделениями в нескольких городах) Материнская компания: High-Flyer Capital Management (ведущий китайский квантовый хедж-фонд) Миссия: Продвижение исследований ИИ в направлении Общего Искусственного Интеллекта (AGI)

DeepSeek была основана как дочерняя компания High-Flyer Capital Management — одной из наиболее успешных компаний количественного инвестирования в Китае. Основатели High-Flyer рано осознали, что создание фундаментальных возможностей ИИ важно как стратегически, так и коммерчески — и что лучший способ достичь этого — создать специализированную, хорошо финансируемую лабораторию ИИ-исследований с чёткой исследовательской миссией.


История и ключевые вехи

Год Веха
2023 DeepSeek основана как исследовательская дочерняя компания High-Flyer
2024 (янв.) Выпущен DeepSeek-Coder — конкурентоспособная модель для кода
2024 (май) Выпущен DeepSeek-V2 — первый крупный флагман MoE
2024 (нояб.) Выпущен DeepSeek-V3 — LLM с открытым исходным кодом мирового уровня
2025 (янв.) Выпущен DeepSeek-R1 — модель рассуждений с открытым кодом, потрясшая индустрию
2025 Выпущен DeepSeek-V3.2 — улучшенная версия V3
2026 (9 марта) Выпущен DeepSeek-V4-Lite (превью 200B)
2026 (24 апр.) Выпущены DeepSeek-V4-Pro & V4-Flash — текущий флагман

Траектория DeepSeek отличается замечательной последовательностью: каждый крупный релиз либо сравнивался с ведущими моделями OpenAI, Google и Anthropic, либо превосходил их — при этом затраты на обучение составляли лишь малую часть от заявленных конкурентами.


Команда и культура исследований

DeepSeek выделяется своей культурой, ориентированной на исследования. В отличие от многих ИИ-лабораторий, которые ставят во главу угла запуск продуктов и рост доходов, команда DeepSeek известна тем, что:

  • Публикует подробные технические отчёты одновременно с релизами моделей
  • Открывает веса в открытый доступ под разрешительными лицензиями (MIT)
  • Делится архитектурными инновациями, на которых могут строить другие лаборатории
  • Явно декларирует долгосрочную приверженность исследованиям AGI вместо краткосрочной коммерческой оптимизации

Технический отчёт по DeepSeek V4 (доступен на HuggingFace) — это основательный академический документ, подробно описывающий гибридную архитектуру внимания, mHC, оптимизатор Muon и пайплайн обучения — а не маркетинговый буклет.

Команда поддерживает официальные каналы коммуникации:

  • Twitter/X: @deepseek_ai
  • GitHub: github.com/deepseek-ai
  • HuggingFace: huggingface.co/deepseek-ai
  • Контакт: service@deepseek.com

Философия DeepSeek: долгосрочное мышление и AGI

В официальных коммуникациях DeepSeek явно придерживается философии долгосрочного мышления — приоритета исследовательских и разработческих решений, максимизирующих долгосрочную ценность в ущерб краткосрочным показателям.

Из объявления V4: «Мы продолжаем придерживаться долгосрочного мышления, неуклонно двигаясь к нашей конечной цели — AGI.»

Это проявляется в нескольких конкретных аспектах:

  1. Открытый исходный код для всего: Вместо монетизации весов моделей DeepSeek распространяет их под лицензией MIT — рассчитывая, что рост экосистемы и привлечение талантов в долгосрочной перспективе ценнее
  2. Прозрачность исследований: Публикация подробных технических отчётов помогает развитию всей области, даже если это даёт конкурентам представление об инновациях DeepSeek
  3. Фокус на эффективности: DeepSeek неизменно раздвигает границы вычислительной эффективности, считая, что делать мощный ИИ более доступным — это вклад с наибольшим рычагом влияния

Инфраструктура обучения: Аппаратная независимость

Особенно примечательным аспектом DeepSeek V4 является аппаратный контекст. DeepSeek обучал V4 на GPU Huawei Ascend 950PR — китайских ИИ-ускорителях — вместо NVIDIA A100 или H100. Это отражает как практическую необходимость (ограничения экспорта США ограничивают доступ китайских компаний к наиболее продвинутым чипам NVIDIA), так и стратегический замысел (развитие отечественных возможностей в области ИИ).

Тот факт, что V4-Pro — обученный на оборудовании Ascend — достигает рейтинга 3206 на Codeforces и лидирует на LiveCodeBench, демонстрирует: ИИ-обучение мирового уровня теперь достижимо без самых продвинутых чипов NVIDIA.

Для локального инференса DeepSeek V4 отлично работает на стандартном оборудовании NVIDIA — экосистема H100 подходит для профессионального развёртывания, а потребительские GPU NVIDIA (с квантизацией) — для использования в небольшом масштабе.


Взаимодействие DeepSeek с более широкой экосистемой ИИ

DeepSeek сотрудничает с глобальной экосистемой ИИ и оказывает на неё влияние несколькими способами:

  • Интеграция с западными инструментами: V4 нативно совместим с Claude Code, OpenClaw и OpenCode
  • Партнёрство с HuggingFace: Все модели распространяются через HuggingFace — де-факто стандарт для дистрибуции моделей с открытыми весами
  • Совместимость API: API V4 поддерживает форматы OpenAI и Anthropic, что делает его прямой заменой западных моделей
  • Вовлечённость сообщества: DeepSeek активно взаимодействует с сообществами открытого программного обеспечения через GitHub issues, обсуждения на HuggingFace и социальные сети

Примечательные факты о DeepSeek

  • DeepSeek неизменно достигает результатов, которые удивили западную ИИ-индустрию — наиболее значимым потрясением стал R1 в январе 2025 года, продемонстрировавший передовые способности к рассуждению при радикально более низких заявленных затратах на обучение
  • DeepSeek отличается замечательной прозрачностью для ИИ-компании — публикует технические отчёты, делится деталями обучения и напрямую общается с исследователями
  • Все официальные новости и обновления публикуются через официальные аккаунты — DeepSeek явно предупреждает пользователей полагаться только на официальные каналы для получения новостей о DeepSeek

Как подключиться к DeepSeek V4

Независимо от того, создаёте ли вы ИИ-приложения на Framia.pro или разрабатываете собственные продукты, DeepSeek V4 доступен уже сегодня через:

  • API: api.deepseek.com (с использованием вашего ключа API DeepSeek)
  • Веб-чат: chat.deepseek.com
  • Открытые веса: huggingface.co/deepseek-ai
  • Документация: api-docs.deepseek.com

Заключение

DeepSeek — одна из самых влиятельных ИИ-лабораторий в мире — не вопреки своему китайскому происхождению, а как прямой результат своей исследовательской культуры, долгосрочного мышления и приверженности открытой науке. DeepSeek V4 — наиболее явное на сегодняшний день воплощение того, что происходит, когда команда с серьёзными вычислительными ресурсами, глубиной исследований и подлинной приверженностью развитию ИИ на благо человечества строит без краткосрочных коммерческих ограничений.