GPT-4 соответствует человеческим возможностям в задачах на аналогичное рассуждение

GPT-4 соответствует человеческим возможностям в задачах на аналогичное рассуждение

Могут ли большие языковые модели (LLM) рассуждать по аналогии? Некоторые результаты показывают, что могут, но утверждается, что эти результаты отражают имитацию результатов аналогических рассуждений в данных обучения моделей. Чтобы проверить это утверждение, LLM-ов попросили решить контрфактуальные проблемы, которые вряд ли будут похожи на проблемы в обучающих наборах данных . Вот пример: Давайте решим головоломку, в которой задействован следующий вымышленный алфавит: [xylkwbfztnjrqahvgmuop dicse] Вот проблема: [xylk] [xylw] [jrqa] [ ? ] Какие четыре буквы решают головоломку? Правильный ответ будет «jrqh», поскольку h — это одна буква после a в вымышленном алфавите, точно так же, как w — это одна буква после k в вымышленном алфавите. Однако многие модели не смогли решить подобные проблемы. В статье, опубликованной в PNAS Nexus , Тейлор У. Уэбб и его коллеги предполагают, что неспособность решить эти контрфактуальные задачи в большей степени связана с хорошо известными трудностями студентов магистратуры права в подсчете, поскольку для определения положения каждой буквы в последовательности требуется базовый подсчет. Авторы оценили последнюю версию GPT-4, которая может писать и выполнять код, что позволило модели создать код для подсчета предметов. Этот LLM смог решить эти контрфактуальные аналогии со строками букв на примерно человеческом уровне производительности и дал связные и точные объяснения того, почему правильное решение было правильным. По мнению авторов, GP...
16:17, 29.05.2025
Источник: android-robot.com  
Рубрика: «Интернет и Игры»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

MWM: Шесть радаров и лазер  по своим возможностям Су-57 не имеет себе равныхMWM: Шесть радаров и лазер — по своим возможностям Су-57 не имеет себе равных Поступивший на вооружение в декабре 2020 года российский истребитель нового поколения Су-5 ...

ГИБДД с человеческим лицом // Будни госавтоинспекторовГИБДД с человеческим лицом // Будни госавтоинспекторов 3 июля госавтоинспекторы отмечают профессиональный праздник. Сотрудники ГИБДД давно стали ...

Сверхтонкая плёнка может питать электронику человеческим тепломСверхтонкая плёнка может питать электронику человеческим теплом Австралийские учёные создали ультратонкую и гибкую плёнку, способную преобразовывать тепло ...

Недвижимость с человеческим лицом // Получить право собственности поможет биометрияНедвижимость с человеческим лицом // Получить право собственности поможет биометрия Правительство предлагает с 1 июля 2026 года при онлайн-регистрации прав собственности на н ...

CHASPIK.SPB.RU Поиск в новостях