Исследование Apple выявило серьёзный недостаток ИИ в моделях OpenAI и Google

Исследование Apple выявило серьёзный недостаток ИИ в моделях OpenAI и Google

Исследователи Apple обнаружили, что возможности логического мышления больших языковых моделей могут быть не такими продвинутыми, как казалось ранее! Большие языковые модели (LLMs) от OpenAI, Google и других компаний давно считаются образцом передовых технологий в области искусственного интеллекта благодаря своим впечатляющим навыкам логического мышления. Однако новое исследование от команды Apple показывает, что их интеллект может быть не чем иным, как сложным сопоставлением паттернов, а не настоящим логическим рассуждением. Проблемы с тестами и загрязнение данных Наиболее распространённым тестом для оценки логического мышления является GSM8K, но из-за его популярности существует риск загрязнения данных. Это означает, что языковые модели могли быть обучены на ответах, а не выводить их через встроенные способности. Чтобы проверить эту гипотезу, исследователи Apple разработали новый тест под названием GSM-Symbolic, который сохраняет суть задач по логике, но меняет переменные: имена, числа, уровень сложности и добавляет лишнюю информацию. Результаты оказались неожиданными: при изменении переменных производительность всех протестированных моделей заметно снизилась. В исследовании были протестированы более 20 моделей, включая OpenAI o1, GPT-4o, Google Gemma 2 и Llama 3. Независимо от модели, их точность падала при любых изменениях в условиях задачи. «Хрупкость» логики моделей Исследователи отметили, что при простом изменении имён или чисел точ...
00:17, 15.10.2024
Источник: itzine.ru  
Рубрика: «Наука и Технологии»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Мэр Александр Новиков назвал серьёзный недостаток в работе СмоленсктеплосетиМэр Александр Новиков назвал серьёзный недостаток в работе «Смоленсктеплосети» "Нужно поднять пятую точку и работать!" Градоначальник потребовал объяснительную от руково ...

Исследование: две трети мобильных разработчиков переживают из-за дуополии Apple и Google на рынке сторовИсследование: две трети мобильных разработчиков переживают из-за дуополии Apple и Google на рынке сторов Аналитики из Atomik Research изучили ситуацию на рынке мобильных магазинов приложений. Для ...

Исследование выявило генетические причины тремора рукИсследование выявило генетические причины тремора рук Новое исследование Национального института нейронаук Сингапура выявило, как генетические в ...

4 функции Apple Watch Series 10, которые появятся на старых моделях часов Apple4 функции Apple Watch Series 10, которые появятся на старых моделях часов Apple На презентации 9 сентября помимо iPhone 16 Apple показала и новую модель Apple Watch Serie ...

CHASPIK.SPB.RU Поиск в новостях