Новая структура может генерировать изображения, более соответствующие ожиданиям пользователя

Новая структура может генерировать изображения, более соответствующие ожиданиям пользователя

Генеративные модели, искусственные нейронные сети, которые могут генерировать изображения или тексты, стали все более продвинутыми в последние годы. Эти модели также могут быть полезны для создания аннотированных изображений для обучения алгоритмов компьютерного зрения, которые предназначены для классификации изображений или содержащихся в них объектов. Хотя многие генеративные модели, в частности генеративные состязательные сети (GAN), могут создавать синтетические изображения, которые напоминают те, что сняты камерами, надежный контроль содержания изображений, которые они производят, оказался сложной задачей. Во многих случаях изображения, созданные GAN, не соответствуют точным требованиям пользователей, что ограничивает их использование для различных приложений. Исследователи из Сеульского национального университета науки и технологий недавно представили новую структуру генерации изображений , разработанную для включения контента, который пользователи хотели бы видеть в сгенерированных изображениях. Эта структура, представленная в статье, опубликованной на сервере препринтов arXiv , позволяет пользователям осуществлять больший контроль над процессом генерации изображений, создавая изображения, которые больше соответствуют тем, которые они себе представляли. «Благодаря внедрению генеративных моделей был достигнут значительный прогресс в создании изображений», — пишут Джанг Х. Ле, Ань К. Нгуен и исследователи в своей статье. «Однако точный контроль содержимого генерируемых и...
00:17, 09.12.2024
Источник: android-robot.com  
Рубрика: «Интернет и Игры»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Поисковик Яндекса теперь может рассуждать и генерировать тексты и изображения с помощью АлисыПоисковик «Яндекса» теперь может рассуждать и генерировать тексты и изображения с помощью «Алисы» Вместо появившемуся в прошлом году «Поиску с Нейро» в поисковой машине « ...

NVIDIA: новая версия DLSS сможет генерировать до 16 кадров за раз (видео)NVIDIA: новая версия DLSS сможет генерировать до 16 кадров за раз (видео) С выпуском видеокарт серии RTX 50 компания NVIDIA представила улучшенную технологию генера ...

Новая структура для микросхем: кремний отправляется на покойНовая структура для микросхем: кремний отправляется на покой Уменьшить толщину полупроводников в 10 раз — звучит как научная фантастика. Но теперь это ...

Новая функция Windows 11 позволит записывать все действия пользователяНовая функция Windows 11 позволит записывать все действия пользователя Американская корпорация Microsoft представила новую функцию Recall для операционной систем ...

CHASPIK.SPB.RU Поиск в новостях