Alibaba Cloud выпустила ИИ-модель Qwen 2.5-Max по цене $30 за миллион токенов

Alibaba Cloud выпустила ИИ-модель Qwen 2.5-Max по цене $30 за миллион токенов

Китайский технологический гигант Alibaba Cloud представил новую версию своей языковой модели — Qwen 2.5-Max. Как заявили разработчики, она превосходит конкурентов, включая взорвавший рынок китайский чат-бот DeepSeek. Однако в отличие от него она совсем не бесплатна. Что ещё известно о возможностях новой модели? Что известно о новой модели Qwen 2.5-Max построена на архитектуре Mixture of Experts. Её обучили на массиве данных объёмом более 20 трлн токенов. Доступность: модель закрытая. Бесплатно попробовать можно только в их чате. Цена: использование Qwen 2.5-Max стоит в 30 раз дороже, чем DeepSeek V3: 1 млн токенов на вход (например, вопрос к ИИ) стоят $10, а 1 млн токенов на выход (ответ ИИ) — $30. Для сравнения: у DeepSeek аналогичные запросы обойдутся в $0.1–1 за 1 млн токенов. Что она умеет генерирует фото и видео; пишет тексты (имеет доступ к интернету); умеет писать код, в ней можно создавать даже игры; понимает русский язык. Сравнение с другими ИИ Alibaba утверждает, что Qwen 2.5-Max превосходит китайский чат-бот DeepSeek V3 и чат-бот Llama-3.1-405B (принадлежит Meta, признанной в России экстремистской и запрещённой) почти по всем показателям. Чем она лучше Производительность: Qwen 2.5-Max модель лучше справляется с задачами в тестах Arena-Hard (сложные вопросы), LiveBench (работа с динамичными данными) и GPQA-Diamond (понимание текста) и других. Обучение: её «тренировали» на 20 трлн единиц данных (токенов) и дорабатывали с помощью людей. Большое контекстное окно: модел...
12:17, 30.01.2025
Источник: secretmag.ru  
Рубрика: «Бизнес и Промышленность»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Qwen выпустила мощную нейросеть без режима рассуждений - она обходит ведущие американские моделиQwen выпустила мощную нейросеть без режима «рассуждений» - она обходит ведущие американские модели Новая ИИ-модель Qwen3-235B-A22B обошла в бенчмарках Claude 4. Среди ее возможностей - огро ...

Memereum превысил 21 миллион токенов, проданных в ходе предпродажи, новаторское страхование на основе блокчейна в Binance Smart ChainMemereum превысил 21 миллион токенов, проданных в ходе предпродажи, новаторское страхование на основе блокчейна в Binance Smart Chain [ПРЕСС-РЕЛИЗ – Монако, Монако, 10 июня 2024 г.] Memereum, новаторский токен Binance Smart ...

Xiaomi выпустила беспроводную мышь по цене шаурмыXiaomi выпустила беспроводную мышь по цене шаурмы Компания Xiaomi представила ультрабюджетную компьютерную мышь, которая будет продаваться п ...

TCL выпустила LED-телевизоры Crane 7 Pro QD-Mini по цене от 57 600 рублейTCL выпустила LED-телевизоры Crane 7 Pro QD-Mini по цене от 57 600 рублей Компания TCL анонсировала свою новую линейку LED-телевизоров Crane 7 Pro QD-Mini, которая ...

CHASPIK.SPB.RU Поиск в новостях