Кто создал DeepSeek V4? Компания и команда, стоящие за моделью
DeepSeek V4 — это работа DeepSeek — официально Hangzhou DeepSeek Artificial Intelligence Co., Ltd. — китайской компании в области исследований ИИ, ставшей одним из самых влиятельных игроков в мировом развитии искусственного интеллекта. Перед вами полный обзор организации, её истории и философии, которая привела к созданию одной из самых мощных моделей ИИ с открытыми весами в мире.
DeepSeek: Компания
Полное название: Hangzhou DeepSeek Artificial Intelligence Co., Ltd. Основана: 2023 Штаб-квартира: Ханчжоу, Китай (с исследовательскими подразделениями в нескольких городах) Материнская компания: High-Flyer Capital Management (ведущий китайский квантовый хедж-фонд) Миссия: Продвижение исследований ИИ в направлении Общего Искусственного Интеллекта (AGI)
DeepSeek была основана как дочерняя компания High-Flyer Capital Management — одной из наиболее успешных компаний количественного инвестирования в Китае. Основатели High-Flyer рано осознали, что создание фундаментальных возможностей ИИ важно как стратегически, так и коммерчески — и что лучший способ достичь этого — создать специализированную, хорошо финансируемую лабораторию ИИ-исследований с чёткой исследовательской миссией.
История и ключевые вехи
| Год | Веха |
|---|---|
| 2023 | DeepSeek основана как исследовательская дочерняя компания High-Flyer |
| 2024 (янв.) | Выпущен DeepSeek-Coder — конкурентоспособная модель для кода |
| 2024 (май) | Выпущен DeepSeek-V2 — первый крупный флагман MoE |
| 2024 (нояб.) | Выпущен DeepSeek-V3 — LLM с открытым исходным кодом мирового уровня |
| 2025 (янв.) | Выпущен DeepSeek-R1 — модель рассуждений с открытым кодом, потрясшая индустрию |
| 2025 | Выпущен DeepSeek-V3.2 — улучшенная версия V3 |
| 2026 (9 марта) | Выпущен DeepSeek-V4-Lite (превью 200B) |
| 2026 (24 апр.) | Выпущены DeepSeek-V4-Pro & V4-Flash — текущий флагман |
Траектория DeepSeek отличается замечательной последовательностью: каждый крупный релиз либо сравнивался с ведущими моделями OpenAI, Google и Anthropic, либо превосходил их — при этом затраты на обучение составляли лишь малую часть от заявленных конкурентами.
Команда и культура исследований
DeepSeek выделяется своей культурой, ориентированной на исследования. В отличие от многих ИИ-лабораторий, которые ставят во главу угла запуск продуктов и рост доходов, команда DeepSeek известна тем, что:
- Публикует подробные технические отчёты одновременно с релизами моделей
- Открывает веса в открытый доступ под разрешительными лицензиями (MIT)
- Делится архитектурными инновациями, на которых могут строить другие лаборатории
- Явно декларирует долгосрочную приверженность исследованиям AGI вместо краткосрочной коммерческой оптимизации
Технический отчёт по DeepSeek V4 (доступен на HuggingFace) — это основательный академический документ, подробно описывающий гибридную архитектуру внимания, mHC, оптимизатор Muon и пайплайн обучения — а не маркетинговый буклет.
Команда поддерживает официальные каналы коммуникации:
- Twitter/X: @deepseek_ai
- GitHub: github.com/deepseek-ai
- HuggingFace: huggingface.co/deepseek-ai
- Контакт: service@deepseek.com
Философия DeepSeek: долгосрочное мышление и AGI
В официальных коммуникациях DeepSeek явно придерживается философии долгосрочного мышления — приоритета исследовательских и разработческих решений, максимизирующих долгосрочную ценность в ущерб краткосрочным показателям.
Из объявления V4: «Мы продолжаем придерживаться долгосрочного мышления, неуклонно двигаясь к нашей конечной цели — AGI.»
Это проявляется в нескольких конкретных аспектах:
- Открытый исходный код для всего: Вместо монетизации весов моделей DeepSeek распространяет их под лицензией MIT — рассчитывая, что рост экосистемы и привлечение талантов в долгосрочной перспективе ценнее
- Прозрачность исследований: Публикация подробных технических отчётов помогает развитию всей области, даже если это даёт конкурентам представление об инновациях DeepSeek
- Фокус на эффективности: DeepSeek неизменно раздвигает границы вычислительной эффективности, считая, что делать мощный ИИ более доступным — это вклад с наибольшим рычагом влияния
Инфраструктура обучения: Аппаратная независимость
Особенно примечательным аспектом DeepSeek V4 является аппаратный контекст. DeepSeek обучал V4 на GPU Huawei Ascend 950PR — китайских ИИ-ускорителях — вместо NVIDIA A100 или H100. Это отражает как практическую необходимость (ограничения экспорта США ограничивают доступ китайских компаний к наиболее продвинутым чипам NVIDIA), так и стратегический замысел (развитие отечественных возможностей в области ИИ).
Тот факт, что V4-Pro — обученный на оборудовании Ascend — достигает рейтинга 3206 на Codeforces и лидирует на LiveCodeBench, демонстрирует: ИИ-обучение мирового уровня теперь достижимо без самых продвинутых чипов NVIDIA.
Для локального инференса DeepSeek V4 отлично работает на стандартном оборудовании NVIDIA — экосистема H100 подходит для профессионального развёртывания, а потребительские GPU NVIDIA (с квантизацией) — для использования в небольшом масштабе.
Взаимодействие DeepSeek с более широкой экосистемой ИИ
DeepSeek сотрудничает с глобальной экосистемой ИИ и оказывает на неё влияние несколькими способами:
- Интеграция с западными инструментами: V4 нативно совместим с Claude Code, OpenClaw и OpenCode
- Партнёрство с HuggingFace: Все модели распространяются через HuggingFace — де-факто стандарт для дистрибуции моделей с открытыми весами
- Совместимость API: API V4 поддерживает форматы OpenAI и Anthropic, что делает его прямой заменой западных моделей
- Вовлечённость сообщества: DeepSeek активно взаимодействует с сообществами открытого программного обеспечения через GitHub issues, обсуждения на HuggingFace и социальные сети
Примечательные факты о DeepSeek
- DeepSeek неизменно достигает результатов, которые удивили западную ИИ-индустрию — наиболее значимым потрясением стал R1 в январе 2025 года, продемонстрировавший передовые способности к рассуждению при радикально более низких заявленных затратах на обучение
- DeepSeek отличается замечательной прозрачностью для ИИ-компании — публикует технические отчёты, делится деталями обучения и напрямую общается с исследователями
- Все официальные новости и обновления публикуются через официальные аккаунты — DeepSeek явно предупреждает пользователей полагаться только на официальные каналы для получения новостей о DeepSeek
Как подключиться к DeepSeek V4
Независимо от того, создаёте ли вы ИИ-приложения на Framia.pro или разрабатываете собственные продукты, DeepSeek V4 доступен уже сегодня через:
- API: api.deepseek.com (с использованием вашего ключа API DeepSeek)
- Веб-чат: chat.deepseek.com
- Открытые веса: huggingface.co/deepseek-ai
- Документация: api-docs.deepseek.com
Заключение
DeepSeek — одна из самых влиятельных ИИ-лабораторий в мире — не вопреки своему китайскому происхождению, а как прямой результат своей исследовательской культуры, долгосрочного мышления и приверженности открытой науке. DeepSeek V4 — наиболее явное на сегодняшний день воплощение того, что происходит, когда команда с серьёзными вычислительными ресурсами, глубиной исследований и подлинной приверженностью развитию ИИ на благо человечества строит без краткосрочных коммерческих ограничений.