Новая техника улучшает возможности рассуждения больших языковых моделей

Новая техника улучшает возможности рассуждения больших языковых моделей

Большие языковые модели, подобные тем, которые используются в ChatGPT, показали впечатляющую производительность при выполнении таких задач, как составление юридических записок, анализ отзывов клиентов или перевод документов на разные языки. Эти модели машинного обучения обычно используют только естественный язык для обработки информации и ответов на запросы, что может затруднить выполнение задач, требующих числовых или символических рассуждений. Например, большая языковая модель может запоминать и произносить список последних президентов США и их дней рождения, но та же самая модель может потерпеть неудачу, если задать вопрос: «Какие президенты США, избранные после 1950 года, родились в среду?» (Ответ: Джимми Картер.) Исследователи из Массачусетского технологического института и других стран предложили новую технику, которая позволяет большим языковым моделям решать задачи естественного языка, математики и анализа данных, а также задачи символического рассуждения путем создания программ. Исследование опубликовано на сервере препринтов arXiv. Их подход, называемый встроенными программами естественного языка (NLEP), включает в себя предложение языковой модели создать и выполнить программу Python для решения запроса пользователя, а затем вывести решение на естественном языке. Они обнаружили, что NLEP позволяет большим языковым моделям достигать более высокой точности при решении широкого спектра задач рассуждения. Этот подход также можно обобщить, что означает, что одно приглаше...
04:17, 18.06.2024
Источник: android-robot.com  
Рубрика: «Наука и Технологии»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Google TPU Trillium: для больших языковых моделей ИИGoogle TPU Trillium: для больших языковых моделей ИИ На вчерашней конференции Google I/O основное внимание было уделено моделям искусственного ...

МГУ о применении мультимодальных больших языковых моделей в видеоаналитикеМГУ о применении мультимодальных больших языковых моделей в видеоаналитике Ученые МГУ провели исследование по проблеме перевода видео в текст, что позволит значитель ...

Опубликован BoN, метод обхода фильтров больших языковых моделейОпубликован BoN, метод обхода фильтров больших языковых моделей Выявлен новый метод атаки, позволяющий обойти механизмы противодействия генерации опасного ...

Разработан метод предотвращения галлюцинаций больших языковых моделейРазработан метод предотвращения галлюцинаций больших языковых моделей Большие языковые модели (LLM), такие как ChatGPT, научились генерировать тексты, почти не ...

CHASPIK.SPB.RU Поиск в новостях