Inception Labs представила Mercury – первую диффузионную языковую модель

Inception Labs представила Mercury – первую диффузионную языковую модель

В четверг компания Inception Labs выпустила Mercury Coder – новую языковую модель ИИ, которая использует методы диффузии для генерации текста быстрее, чем обычные модели. В отличие от традиционных моделей, которые создают текст слово за словом (например ChatGPT), основанные на диффузии модели, такие как Mercury, одновременно производят целые ответы, преобразуя их из изначально замаскированного состояния в связный текст.Традиционные большие языковые модели строят текст слева направо, по одному токену за раз. Они используют технику, называемую «авторегрессия». Каждое слово должно ждать всех предыдущих слов, прежде чем появиться. Вдохновленные техниками из моделей генерации изображений, таких как Stable Diffusion, DALL-E и Midjourney, языковые модели диффузии текста, такие как LLaDA (разработанные исследователями из Университета Жэньминь и Ant Group) и Mercury, используют подход, основанный на маскировании. Эти модели начинают с полностью скрытого контента и постепенно раскрывают все части ответа одновременно.Согласно Inception Labs, их подход позволяет модели уточнять выходные данные и устранять ошибки, поскольку она не ограничивается рассмотрением только ранее сгенерированного текста. Эта параллельная обработка обеспечивает заявленную Mercury скорость генерации более 1000 токенов в секунду на графических процессорах NVIDIA H100. Эти модели диффузии поддерживают производительность быстрее или сопоставимую с обычными моделями аналогичного размера. Исследователи LLaDA сообщают, ч...
12:17, 03.03.2025
Источник: mobidevices.com  
Рубрика: «Гаджеты»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Microsoft представила малую языковую модель Phi-3-Silica для компьютеров Copilot Plus PCMicrosoft представила малую языковую модель Phi-3-Silica для компьютеров Copilot Plus PC Вслед за презентацией компактной ИИ-модели Phi-3-vision, компания Microsoft представила на ...

Microsoft представила языковую модель Phi Silica для Windows Copilot LibraryMicrosoft представила языковую модель Phi Silica для Windows Copilot Library На конференции разработчиков Build 2024 Microsoft представила новую компактную языковую мо ...

Build 2024: Microsoft представила компактную языковую модель Phi-3-visionBuild 2024: Microsoft представила компактную языковую модель Phi-3-vision Microsoft анонсировала мультимодальную компактную языковую модель Phi-3-vision, которая мо ...

Topaz Labs представила диффузную ИИ-модель, которая автоматически улучшает старые видеоTopaz Labs представила диффузную ИИ-модель, которая автоматически улучшает старые видео Компания Topaz Labs, специализирующая на разработке программного обеспечения для редактиро ...

CHASPIK.SPB.RU Поиск в новостях