Модели искусственного интеллекта испытывают трудности с простым умножением без специальных методов обучения

Модели искусственного интеллекта испытывают трудности с простым умножением без специальных методов обучения

В наши дни большие языковые модели способны справляться со все более сложными задачами, писать сложный код и применять изощренные рассуждения. Но когда дело доходит до умножения четырехзначных чисел, задачи, изучаемой в начальной школе, даже самые современные системы терпят неудачу. Почему? В новой статье, опубликованной на препринт-сервере arXiv аспирантом факультета компьютерных наук Чикагского университета Сяоянем Баем и соруководителем исследовательской инициативы по новым интеллектуальным решениям Института науки о данных Ченхао Таном, ответы находятся путем обратного проектирования неудач и успехов. Они работали в сотрудничестве с коллегами из Массачусетского технологического института, Гарвардского университета, Университета Ватерлоо и Google DeepMind, чтобы исследовать « неровные границы » искусственного интеллекта — термин, обозначающий его способность преуспевать в сложных рассуждениях, но при этом спотыкаться на, казалось бы, простых задачах. Как вы, возможно, помните (или забыли), умножение больших чисел требует переноса цифр и мысленного «удержания» частичных произведений, чтобы затем сложить их и получить итоговую сумму. Процессы, требующие хранения информации для последующего использования таким образом, называются «дальними зависимостями». Стандартные большие языковые модели работают, обучаясь распознавать закономерности в данных, на которых они обучаются. Но чем сложнее задача, тем меньше вероятность того, что модель её конкретно обнаружила. Так как же научит...
20:17, 01.01.2026
Источник: android-robot.com  
Рубрика: «Наука и Технологии»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

МТС Web Services на 40% увеличила GPU-мощности для обучения искусственного интеллектаМТС Web Services на 40% увеличила GPU-мощности для обучения искусственного интеллекта МТС Web Services (MWS), входит в группу МТС, сообщает о запуске двух новых кластеров вирту ...

Google представила Learn About  инструмент интерактивного обучения на базе искусственного интеллектаGoogle представила Learn About — инструмент интерактивного обучения на базе искусственного интеллекта Компания Google без лишнего шума представила новый образовательный сервис на основе искусс ...

Большие языковые модели испытывают трудности с координацией в социальных и кооперативных играхБольшие языковые модели испытывают трудности с координацией в социальных и кооперативных играх Большие языковые модели (LLM), такие как модель, лежащая в основе функционирования популяр ...

Ученые Сбербанка разработали модели искусственного интеллекта для распознавания сложных эмоцийУченые Сбербанка разработали модели искусственного интеллекта для распознавания сложных эмоций Ученые Центра практического искусственного интеллекта Сбербанка повысили точность определе ...

CHASPIK.SPB.RU Поиск в новостях