DeepSeek: искусственный интеллект, который сверг ChatGPT
Годовалый стартап из Китая покорил индустрию искусственного интеллекта, выпустив чатбота, который соперничает по производительности с ChatGPT и при этом потребляет в разы меньше энергии, охлаждения и затрат на обучение, чем системы OpenAI, Google и Anthropic. И если вы хотите знать больше о ИИ, который поднял на уши всю индустрию, то в этой статье вы можете прочитать о моделях Deepseek V3 и R1 и о том, почему эта компания может в корне изменить амбиции Америки в области ИИ. Что такое DeepSeek? DeepSeek (технически «Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.») — это китайский ИИ-стартап, который изначально был основан как ИИ-лаборатория для материнской компании High-Flyer в апреле 2023 года. В мае того же года DeepSeek была выделена в отдельную компанию (при этом High-Flyer осталась в качестве инвестора) и выпустила модель DeepSeek-V2. V2 по производительности не уступала другим ведущим китайским ИИ-компаниям, таким как ByteDance, Tencent и Baidu, но при этом имела гораздо меньшие операционные расходы. Вслед за этим компания выпустила V3 в декабре 2024 года. V3 — это модель с 671 миллиардом параметров, на обучение которой, как сообщается, ушло менее 2 месяцев. Более того, согласно недавнему анализу Джеффриса, «стоимость обучения DeepSeek составила всего 5,6 млн долларов США. Это ничтожная доля от сотен миллионов до миллиардов долларов, которые американские компании, такие как Google, Microsoft, xAI и OpenAI, потратили на обучение сво...