Новая техника улучшает возможности рассуждения больших языковых моделей

Большие языковые модели, подобные тем, которые используются в ChatGPT, показали впечатляющую производительность при выполнении таких задач, как составление юридических записок, анализ отзывов клиентов или перевод документов на разные языки. Эти модели машинного обучения обычно используют только естественный язык для обработки информации и ответов на запросы, что может затруднить выполнение задач, требующих числовых или символических рассуждений. Например, большая языковая модель может запоминать и произносить список последних президентов США и их дней рождения, но та же самая модель может потерпеть неудачу, если задать вопрос: «Какие президенты США, избранные после 1950 года, родились в среду?» (Ответ: Джимми Картер.) Исследователи из Массачусетского технологического института и других стран предложили новую технику, которая позволяет большим языковым моделям решать задачи естественного языка, математики и анализа данных, а также задачи символического рассуждения путем создания программ. Исследование опубликовано на сервере препринтов arXiv. Их подход, называемый встроенными программами естественного языка (NLEP), включает в себя предложение языковой модели создать и выполнить программу Python для решения запроса пользователя, а затем вывести решение на естественном языке. Они обнаружили, что NLEP позволяет большим языковым моделям достигать более высокой точности при решении широкого спектра задач рассуждения. Этот подход также можно обобщить, что означает, что одно приглаше...

04:17, 18.06.2024

Рубрика: «Наука и Технологии» Поделиться:

МГУ о применении мультимодальных больших языковых моделей в видеоаналитике Ученые МГУ провели исследование по проблеме перевода видео в текст, что позволит значитель ...

Опубликован BoN, метод обхода фильтров больших языковых моделей Выявлен новый метод атаки, позволяющий обойти механизмы противодействия генерации опасного ...

Разработан метод предотвращения галлюцинаций больших языковых моделей Большие языковые модели (LLM), такие как ChatGPT, научились генерировать тексты, почти не ...

GPT на языке бизнеса: особенности применения больших языковых моделей Использование больших языковых моделей для генерации контента популярно не только среди ча ...