NVIDIA Rubin CPX: более широкие контекстные окна для будущих ИИ-приложений

NVIDIA Rubin CPX: более широкие контекстные окна для будущих ИИ-приложений

С развитием ИИ от первых LLM и моделей с тонкой настройкой (fine-tuning) до архитектур Mixture-of-Experts (MoE), reasoning-моделей и, наконец, полноценных ИИ-агентов, запросы становятся всё более сложными. Они требуют всё больших контекстных окон, большего числа токенов и возросшей вычислительной мощности, что, в свою очередь, ведёт к росту энергопотребления. Современные модели ИИ уже сегодня нуждаются в контекстных окнах длиной до миллиона токенов. Примеры таких сценариев: корпоративные чат-боты и задачи суммаризации сессий на 256 000 токенов, работа с кодом объёмом 100 000+ строк или видеоредактирование в высоком разрешении и при большой продолжительности, где легко достигаются 1 000 000+ токенов. Инференс модели ИИ условно делится на две задачи: Context/Prefill — вычислительно сложная стадия, требующая высокой производительности ядер. Generation/Decode — в первую очередь ограничивается пропускной способностью памяти и нуждается в быстрых ......
16:17, 11.09.2025
Источник: www.hardwareluxx.ru  
Рубрика: «Наука и Технологии»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

NVIDIA представляет Blackwell Ultra, Rubin и Rubin UltraNVIDIA представляет Blackwell Ultra, Rubin и Rubin Ultra На пленарном докладе на выставке Computex в Тайбэе компания NVIDIA представила предварител ...

TSMC начала производство долгожданных видеокарт и процессоров NVIDIA Rubin и VeraTSMC начала производство долгожданных видеокарт и процессоров NVIDIA Rubin и Vera TSMC запустила производство ключевых чипов NVIDIA следующего поколения — графического проц ...

NVIDIA представила Vera Rubin  архитектуру графических процессоров нового поколенияNVIDIA представила Vera Rubin – архитектуру графических процессоров нового поколения На выставке Computex 2024 компания NVIDIA анонсировала архитектуру графического процессора ...

Этими продуктами Nvidia будет захватывать рынок через несколько лет. Компания рассказала о поколении GPU RubinЭтими продуктами Nvidia будет захватывать рынок через несколько лет. Компания рассказала о поколении GPU Rubin Nviida только что подтвердила, что следующая графическая архитектура будет называться в че ...

CHASPIK.SPB.RU Поиск в новостях