Разрабатывают новую модель генеративно-состязательных сетей, которая стабилизирует обучение и производительность
В последние годы искусственный интеллект (ИИ) и модели глубокого обучения быстро развивались, становясь легкодоступными. Это позволило людям, даже не имеющим специальных знаний, выполнять различные задачи с ИИ. Среди этих моделей генеративно-состязательные сети (GAN) выделяются своей выдающейся производительностью в создании новых экземпляров данных с теми же характеристиками, что и обучающие данные, что делает их особенно эффективными для создания изображений, музыки и текста. GAN состоят из двух нейронных сетей , а именно генератора, который создает новые распределения данных, начиная со случайного шума, и дискриминатора, который проверяет, является ли сгенерированное распределение данных «реальным» (соответствующим обучающим данным) или «поддельным». По мере обучения генератор совершенствуется в генерации реалистичных распределений, а дискриминатор — в идентификации сгенерированных данных как поддельных. GAN используют функцию потерь для измерения различий между поддельными и реальными распределениями. Однако этот подход может вызывать такие проблемы, как исчезновение градиента и нестабильное обучение, напрямую влияющие на стабильность и эффективность. Несмотря на значительный прогресс в улучшении GAN, включая структурные модификации и корректировки функции потерь, такие проблемы, как исчезновение градиента и коллапс мод, когда генератор выдает ограниченное разнообразие, продолжают ограничивать их применимость. Для решения этих проблем группа исследователей под руководство...