Новая техника улучшает возможности рассуждения больших языковых моделей
Большие языковые модели, подобные тем, которые используются в ChatGPT, показали впечатляющую производительность при выполнении таких задач, как составление юридических записок, анализ отзывов клиентов или перевод документов на разные языки. Эти модели машинного обучения обычно используют только естественный язык для обработки информации и ответов на запросы, что может затруднить выполнение задач, требующих числовых или символических рассуждений. Например, большая языковая модель может запоминать и произносить список последних президентов США и их дней рождения, но та же самая модель может потерпеть неудачу, если задать вопрос: «Какие президенты США, избранные после 1950 года, родились в среду?» (Ответ: Джимми Картер.) Исследователи из Массачусетского технологического института и других стран предложили новую технику, которая позволяет большим языковым моделям решать задачи естественного языка, математики и анализа данных, а также задачи символического рассуждения путем создания программ. Исследование опубликовано на сервере препринтов arXiv. Их подход, называемый встроенными программами естественного языка (NLEP), включает в себя предложение языковой модели создать и выполнить программу Python для решения запроса пользователя, а затем вывести решение на естественном языке. Они обнаружили, что NLEP позволяет большим языковым моделям достигать более высокой точности при решении широкого спектра задач рассуждения. Этот подход также можно обобщить, что означает, что одно приглаше...