В исках утверждается, что компании обучали свои модели ИИ на книгах без разрешения.
Комик и писатель Сара Сильверман, а также авторы Кристофер Голден и Ричард Кадри подают в Окружной суд США иски против OpenAI и Meta по двойным искам о нарушении авторских прав.
В исках, среди прочего, утверждается, что ChatGPT OpenAI и LLaMA Meta обучались на незаконно приобретенных наборах данных, содержащих их работы, которые, по их словам, были получены с веб-сайтов «теневых библиотек», таких как Bibliotik, Library Genesis, Z-Library и другие.
Что касается отдельного иска против Meta, то в нем утверждается, что книги авторов были доступны в наборах данных, которые Meta использовала для обучения своих моделей LLaMA — квартета моделей искусственного интеллекта с открытым исходным кодом, который компания представила в феврале.
В жалобе поэтапно излагается, почему истцы считают, что наборы данных имеют незаконное происхождение — в документе Meta, подробно описывающем LLaMA , компания указывает источники для своих обучающих наборов данных, один из которых называется ThePile и был собран компанией под названием EleutherAI. В жалобе указывается, что ThePile был описан в документе EleutherAI как составленный из «копии содержимого частного трекера Bibliotik».
Bibliotik и другие перечисленные «теневые библиотеки», говорится в иске, «явно незаконны». В обоих заявлениях авторы говорят, что они «не давали согласия на использование своих книг, защищенных авторским правом, в качестве учебного материала» для моделей искусственного интеллекта компаний.
Каждый их иск содержит по шесть пунктов различных видов нарушений авторских прав, халатности, неосновательного обогащения и недобросовестной конкуренции.
Авторы ожидают возмещение убытков на основе закона.
Источник, в том числе документация исков.