Вычислительная структура упрощает синтезированные движения человеческих персонажей в трехмерных средах
Системы искусственного интеллекта (ИИ) становятся все более совершенными в синтезе изображений и видео, показывающих людей, животных и объекты. Автоматизированная генерация видео, в которых человеческие персонажи занимаются определенными видами деятельности, может иметь различные ценные приложения, например, упрощая создание анимационных фильмов, контента для виртуальной реальности (VR) и видеоигр. Исследователи из Пекинского университета, BIGAI и Пекинского университета почты и телекоммуникаций разработали новую вычислительную структуру для генерации реалистичных движений человеческих персонажей, перемещающихся в трехмерных средах. Эта структура, представленная в докладе , представленном на конференции SIGGRAPH Asia 2024 , опирается на модель диффузии авторегрессии для синтеза последовательных сегментов движения персонажа и планировщика, который прогнозирует переходы к следующему набору движений. «Наше вдохновение для этого исследования возникло из наблюдения за тем, как легко и интуитивно люди взаимодействуют с окружающей средой», — рассказал изданию Tech Xplore соавтор статьи Нань Цзян. «Независимо от того, тянем ли мы руку к чашке кофе на столе или обходим мебель, наши движения совершаются плавно, без сознательного планирования. Эта естественная динамика побудила нас к амбициозной попытке революционизировать взаимодействие виртуальных персонажей с окружающей средой». Было обнаружено, что многие модели на базе ИИ для генерации человеческих движений генерируют правдоподобны...