Государственные проектыДействующий бизнесИскусственный интеллектМировые рынкиЭксперты инвестиций

Почему китайский стартап DeepSeek потряс рынки?

Китайская модель ИИ работает на чипах меньшей мощности, нежели OpenAI и использует открытый код.

Фотоиллюстрация логотипа DeepSeek на экране смартфона.

Китайский стартап в сфере искусственного интеллекта потряс Кремниевую долину и Уолл-стрит, продемонстрировав модели ИИ, сопоставимые с моделями OpenAI, — при этом за гораздо меньшие деньги и энергетические затраты.

На прошлой неделе компания DeepSeek из Ханчжоу, которой чуть больше года, опубликовала результаты своей последней модели с открытым исходным кодом DeepSeek-R1. Она показала производительность, сопоставимую с моделями OpenAI, o1-mini и o1. По данным DeepSeek, обучение и разработка одной из последних моделей ИИ обошлись в 5,6 млн долларов. Между тем, американские конкуренты, такие как OpenAI и Meta, рекламируют траты десятков миллиардов на передовые чипы от Nvidia (NVDA).

Результаты спровоцировали глобальную распродажу акций технологических компаний: в понедельник утром, 27 января, упали фьючерсы на Nasdaq, Dow Jones Industrial Average и S&P500.

Вот что нужно знать о DeepSeek и его моделях ИИ.

Что такое DeepSeek?

Китайский стартап в сфере искусственного интеллекта был основан в 2023 году Ляном Вэньфэном, соучредителем китайского коллективного хедж-фонда в сфере искусственного интеллекта High-Flyer.

DeepSeek разрабатывает модели с открытым исходным кодом, что означает, что разработчики имеют доступ к ее программному обеспечению и могут работать над ним.

Что объявил DeepSeek?

На прошлой неделе компания DeepSeek представила свои языковые модели рассуждений первого поколения — DeepSeek-R1-Zero и DeepSeek-R1.

По словам DeepSeek, предыдущая модель была обучена с помощью крупномасштабного обучения с подкреплением и без контролируемой тонкой настройки. DeepSeek-R1-Zero «демонстрирует замечательные мыслительные способности», но имеет проблемы с «разборчивостью» и миксом языков.

Мобильное приложение для чат-бота DeepSeek на основе искусственного интеллекта, также называемое DeepSeek, взлетело на вершину загрузок App Store от Apple (AAPL), в то время как сайт DeepSeek испытывает сбои из-за наплыва новых пользователей. Стартап объявил в понедельник о «масштабных вредоносных атаках», что привело к временному ограничению регистрации пользователей.

Чат-бот работал на базе DeepSeek-V3, который, по словам DeepSeek, на момент выпуска в декабре по производительности был сопоставим с Llama 3.1 от Meta (признана экстремистской в России) и 4o от OpenAI.

В отличие от ChatGPT и других конкурентов-чатботов, DeepSeek объясняет свои «доводы перед тем, как отвечать на запросы. Однако разработанный в Китае чатбот не отвечает напрямую на подсказки по политически чувствительным темам, таким как президент Си Цзиньпин или Тайвань.

Как новая модель искусственного интеллекта DeepSeek соотносится с конкурентами, такими как OpenAI и Meta?

По данным DeepSeek, R1 показал сопоставимые результаты с моделями OpenAI и Meta на ведущих тестах, таких как AIME 2024, который проверяет математические способности, и Massive Multitask Language Understanding (MMLU), который оценивает общие знания.

В рейтинге Chatbot Arena, составленном сообществом, DeepSeek-R1 идет ниже моделей Gemini 2.0 Flash Thinking от Google и ChatGPT-4o. DeepSeek-V3 оказался чуть ниже моделей o1-preview и full o1 от OpenAI.

Meta, которая также разрабатывает модели с открытым исходным кодом, как сообщается, обеспокоена тем, что следующая версия ее флагманской Llama будет отставать от моделей DeepSeek. Специализированные группы исследователей Meta изучают модели DeepSeek в поисках способов улучшения следующей модели Llama, сообщает The Information.

Почему акции Nvidia и других технологических компаний падают?

В техническом отчете по своей модели V3 компания DeepSeek сообщила, что для обучения она использовала кластер из более чем 2000 графических процессоров (GPU) от Nvidia — это намного меньше десятков тысяч чипов, которые американские компании закупают для обучения моделей аналогичного размера.

Кажущаяся эффективной и конкурентоспособной модель DeepSeek может бросить вызов бизнесу Nvidia, которая опирается на спрос таких крупных компаний в сфере искусственного интеллекта, как OpenAI, Meta и Google, тратящих миллиарды долларов графические процессоры.

На прошлой неделе генеральный директор Meta Марк Цукерберг заявил, что технологический гигант планирует инвестировать от 60 до 65 миллиардов долларов в капитальные затраты на ИИ в 2025 году. Он добавил, что модель Llama 4 от Meta, как ожидается, «станет ведущей современной моделью» в этом году, и что компания планирует «создать инженера ИИ», который сможет вносить больше кода в ее научно-исследовательские и опытно-конструкторские работы.

Между тем OpenAI, SoftBank и Oracle недавно объявили о плане инфраструктуры ИИ стоимостью полтриллиона долларов с администрацией Трампа под названием Stargate. Новое совместное предприятие «намерено инвестировать 500 миллиардов долларов в течение следующих четырех лет в создание новой инфраструктуры ИИ для OpenAI в. Соединенных Штатах», — говорится в заявлении стартапа ИИ.

Какое значение может иметь DeepSeek для ограничений на использование чипов в США в будущем?

Помимо того, что успех DeepSeek вызывает вопросы о расходах на чипы для искусственного интеллекта, он также ставит под сомнение усилия США по ограничению ввоза в страну передовых чипов.

Перед тем как покинуть свой пост в начале этого месяца, администрация Байдена ввела еще больше мер, направленных на то, чтобы не допустить поставки чипов ИИ в Китай. Новые правила усиливают и развивают предыдущие меры экспортного контроля США, направленные на ограничение Китая от передовых полупроводников, которые могут использоваться для разработки ИИ и военных разработок. Согласно правилам, литейные и упаковочные компании, желающие экспортировать определенные чипы, подлежат более широкому лицензионному требованию, если не выполнены определенные условия.

США также опубликовали новые руководящие принципы, направленные на ограничение продаж чипов ИИ от американских фирм, включая Nvidia, определенным странам и компаниям. Новые меры экспортного контроля включают три уровня ограничений чипов, которые предоставляют дружественным странам полный доступ к чипам, произведенным в США, но добавляют новые ограничения для других.

Источник

Добавить комментарий

Кнопка «Наверх»