Новое исследование показывает, что модели OpenAI «запоминают» защищенный авторским правом контент

Новое исследование подтверждает, что OpenAI, вероятно, использовала защищенный авторским правом контент для обучения некоторых своих моделей искусственного интеллекта. Компания сталкивается с исками от авторов, программистов и других правообладателей, которые обвиняют OpenAI в том, что она использовала их работы — книги, код и т. д. — для создания своих моделей без разрешения. OpenAI утверждает, что действует в рамках добросовестного использования, однако истцы настаивают на том, что в американском законодательстве об авторском праве нет исключений для данных, используемых для обучения. Исследование было проведено учеными из Вашингтонского университета, Копенгагенского университета и Стэнфорда. Они разработали новый метод для выявления данных, которые модели запомнили во время обучения. Модели ИИ работают как предсказательные механизмы: обучаясь на больших объемах данных, они выявляют закономерности и могут генерировать тексты или изображения. Хотя большинство их выходных данных не являются точными копиями обучающих материалов, некоторые фрагменты все же могут быть воспроизведены. Например, модели изображений могут воспроизводить кадры из фильмов, а языковые модели могут копировать новостные статьи. В исследовании использовались так называемые «высокоудивительные» слова — те слова, которые выделяются как необычные в контексте текста. Например, слово «радар» в предложении «Джек и я сидели совершенно неподвижно, пока радар жужжал» считается высокоудивительным по...

04:17, 05.04.2025

Источник: itzine.ru

Рубрика: «Наука и Технологии» Поделиться:

Новое исследование от партнера Workday показывает, что прорыв ИИ приводит к большим изменениям в сфере HR-консалтинга Новое исследование консалтинговой компании Kognitiv, специализированного партнера Workday, ...

Новое исследование показывает, что Млечный Путь имеет меньше спутниковых галактик, чем другие галактики Новое исследование, проведённое группой астрономов в рамках проекта SAGA («Спутники ...

Новый метод позволяет моделям ИИ забывать личные и защищенные авторским правом данные Группа специалистов по информатике из Калифорнийского университета в Риверсайде разработал ...

Новое исследование показывает, почему люди используют Интернет вещей (IoT) и почему иногда они этого не делают Интернет вещей (IoT) — это новый способ подключения к интернету таких устройств, как умные ...