Представлена универсальная модель с открытым исходным кодом для манипулирования объектами роботов
Публичный выпуск ChatGPT и других больших языковых моделей (LLM) позволил разработчикам по всему миру начать экспериментировать с этими моделями для расширения интерактивных возможностей своих собственных систем. Однако подобных обобщающих моделей роботизированных манипуляций по-прежнему мало. Исследователи из Калифорнийского университета в Беркли (UC Berkeley), Стэнфордского университета и CMU недавно представили Octo, универсальную модель роботизированных манипуляций с открытым исходным кодом, которая может позволить различным роботизированным системам эффективно манипулировать широким спектром объектов. Эта модель, представленная в статье , предварительно опубликованной на сервере arXiv, может открыть новые возможности для разработки роботов, способных выполнять ручные задачи. «Большая часть текущего прогресса в области ИИ обусловлена большими наборами данных и большими моделями», — рассказали Tech Xplore Дибия Гош, Гомер Уок, Карл Перч, Кевин Блэк и Ойер Мис. «В сообществе робототехники мы недавно собрали набор данных Open X-Embodiment , большой набор данных для манипуляций, объединяющий данные многих исследовательских институтов . Хотя этот новый набор данных является действительно интересным ресурсом, в то время существовало не так много моделей, которые могли бы создать использовать его еще». Недавняя работа этой исследовательской группы преследовала две основные цели. Первая заключалась в разработке хорошей универсальной модели робототехники, которую можно было бы п...