Framework позволяет человеку корректировать действия робота, используя обратную связь, которую он дал бы другому человеку
Представьте, что робот помогает вам мыть посуду. Вы просите его вытащить из раковины мыльную миску, но его захват немного промахивается. Используя новую структуру, разработанную исследователями MIT и NVIDIA, вы можете исправить поведение этого робота с помощью простых взаимодействий. Метод позволит вам указать на миску или проследить траекторию к ней на экране, или просто подтолкнуть руку робота в нужном направлении. Работа опубликована на сервере препринтов arXiv. В отличие от других методов исправления поведения робота, эта техника не требует от пользователей сбора новых данных и переобучения модели машинного обучения , которая питает мозг робота. Она позволяет роботу использовать интуитивную обратную связь от человека в реальном времени, чтобы выбрать возможную последовательность действий, которая максимально соответствует намерению пользователя. Когда исследователи протестировали свою структуру, ее успешность оказалась на 21% выше, чем у альтернативного метода, не предполагавшего вмешательства человека. В долгосрочной перспективе эта структура может позволить пользователю легче управлять роботом, обученным на заводе, для выполнения широкого спектра домашних задач, даже если робот никогда не видел их дома или находящихся в нем предметов. «Мы не можем ожидать, что неспециалисты будут выполнять сбор данных и тонкую настройку модели нейронной сети. Потребитель будет ожидать, что робот будет работать сразу после установки, а если этого не произойдет, он захочет иметь интуитивн...