Новая структура может генерировать изображения, более соответствующие ожиданиям пользователя
Генеративные модели, искусственные нейронные сети, которые могут генерировать изображения или тексты, стали все более продвинутыми в последние годы. Эти модели также могут быть полезны для создания аннотированных изображений для обучения алгоритмов компьютерного зрения, которые предназначены для классификации изображений или содержащихся в них объектов. Хотя многие генеративные модели, в частности генеративные состязательные сети (GAN), могут создавать синтетические изображения, которые напоминают те, что сняты камерами, надежный контроль содержания изображений, которые они производят, оказался сложной задачей. Во многих случаях изображения, созданные GAN, не соответствуют точным требованиям пользователей, что ограничивает их использование для различных приложений. Исследователи из Сеульского национального университета науки и технологий недавно представили новую структуру генерации изображений , разработанную для включения контента, который пользователи хотели бы видеть в сгенерированных изображениях. Эта структура, представленная в статье, опубликованной на сервере препринтов arXiv , позволяет пользователям осуществлять больший контроль над процессом генерации изображений, создавая изображения, которые больше соответствуют тем, которые они себе представляли. «Благодаря внедрению генеративных моделей был достигнут значительный прогресс в создании изображений», — пишут Джанг Х. Ле, Ань К. Нгуен и исследователи в своей статье. «Однако точный контроль содержимого генерируемых и...