GPT-4 соответствует человеческим возможностям в задачах на аналогичное рассуждение

GPT-4 соответствует человеческим возможностям в задачах на аналогичное рассуждение

Могут ли большие языковые модели (LLM) рассуждать по аналогии? Некоторые результаты показывают, что могут, но утверждается, что эти результаты отражают имитацию результатов аналогических рассуждений в данных обучения моделей. Чтобы проверить это утверждение, LLM-ов попросили решить контрфактуальные проблемы, которые вряд ли будут похожи на проблемы в обучающих наборах данных . Вот пример: Давайте решим головоломку, в которой задействован следующий вымышленный алфавит: [xylkwbfztnjrqahvgmuop dicse] Вот проблема: [xylk] [xylw] [jrqa] [ ? ] Какие четыре буквы решают головоломку? Правильный ответ будет «jrqh», поскольку h — это одна буква после a в вымышленном алфавите, точно так же, как w — это одна буква после k в вымышленном алфавите. Однако многие модели не смогли решить подобные проблемы. В статье, опубликованной в PNAS Nexus , Тейлор У. Уэбб и его коллеги предполагают, что неспособность решить эти контрфактуальные задачи в большей степени связана с хорошо известными трудностями студентов магистратуры права в подсчете, поскольку для определения положения каждой буквы в последовательности требуется базовый подсчет. Авторы оценили последнюю версию GPT-4, которая может писать и выполнять код, что позволило модели создать код для подсчета предметов. Этот LLM смог решить эти контрфактуальные аналогии со строками букв на примерно человеческом уровне производительности и дал связные и точные объяснения того, почему правильное решение было правильным. По мнению авторов, GP...
16:17, 29.05.2025
Источник: android-robot.com  
Рубрика: «Интернет и Игры»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

MWM: Шесть радаров и лазер  по своим возможностям Су-57 не имеет себе равныхMWM: Шесть радаров и лазер — по своим возможностям Су-57 не имеет себе равных Поступивший на вооружение в декабре 2020 года российский истребитель нового поколения Су-5 ...

ГИБДД с человеческим лицом // Будни госавтоинспекторовГИБДД с человеческим лицом // Будни госавтоинспекторов 3 июля госавтоинспекторы отмечают профессиональный праздник. Сотрудники ГИБДД давно стали ...

Сверхтонкая плёнка может питать электронику человеческим тепломСверхтонкая плёнка может питать электронику человеческим теплом Австралийские учёные создали ультратонкую и гибкую плёнку, способную преобразовывать тепло ...

Илон Маск предсказал скорое превосходство искусственного интеллекта над человеческимИлон Маск предсказал скорое превосходство искусственного интеллекта над человеческим Илон Маск заявил, что искусственный интеллект скоро затмит человеческие возможности, но вы ...

CHASPIK.SPB.RU Поиск в новостях