Конфликт по поводу авторских прав между The New York Times и компанией OpenAI, поддерживаемой Microsoft, достиг наивысшей точки на прошедшей неделе. Times обвинила OpenAI в том, что инженеры компании «непреднамеренно удалили данные, собранные газетой за более чем 150 часов в качестве потенциальных доказательств».
OpenAI удалось восстановить некоторые данные, но юридическая команда Times утверждает, что изначальные имена файлов и структура каталогов были утрачены. В иске, поданном юристом Times Дженнифер Б. Майзел в среду, говорится, что это усложняет установление, какие именно статьи истца использовались для обучения моделей OpenAI.
Джейсон Дейтром, представитель OpenAI, прокомментировал: «Мы не согласны с изложенной интерпретацией событий и вскоре предоставим свой ответ». The New York Times отказалась давать комментарии.
В прошлом году Times подали в суд на OpenAI и Microsoft за нарушение авторских прав, утверждая, что компании незаконно использовали статьи газеты для обучения своих технологий, таких как ChatGPT. Это дело является частью большего числа аналогичных юридических противостояний между компаниями, занимающимися ИИ, и издателями, включая иск Daily News.
Нынешнее дело Times находится на стадии раскрытия, что требует от OpenAI предоставить Times свои обучающие данные. С этой целью OpenAI создала «песочницу» из двух «виртуальных машин», которую юристы Times могли исследовать. Тем не менее, по заявлению Майзел, данные, подготовленные Times, были стерты с одной из этих машин инженерами OpenAI.
OpenAI признала факт удаления данных и предприняла шаги по его устранению вскоре после получения информации о проблеме в начале месяца. Однако, когда адвокаты Times проверили восстановленные данные, они оказались настолько неорганизованными, что пришлось заново воссоздать результаты, вложив значительные человеко-часы и вычислительное время, как заявили другие юристы Times в письме для судьи.
Адвокаты отметили, что у них «нет оснований полагать», что действия OpenAI были «намеренными». В приложенных к письму электронных письмах адвокат OpenAI Том Горман охарактеризовал удаление данных как «сбой».
Этот инцидент не первый подобного рода в данном иске. В течение прошлого года Times и технологические компании обсуждали, кто должен отвечать за классификацию обучающих данных. Представители Times считают, что OpenAI лучше всего подходящая сторона для выполнения этой задачи.
The Times также обратилась к OpenAI и Microsoft с требованием предоставить сообщения Slack, текстовые сообщения и диалоги в социальных сетях между ключевыми сотрудниками OpenAI. На прошлой неделе The New York Times также подала новое ходатайство, требуя от суда обязать Microsoft и OpenAI предоставить больше материалов.
Тем временем Microsoft потребовала, чтобы The New York Times предоставила все документы, связанные с использованием генеративного ИИ, включая информацию о колонках Кевина Руза, обозревателя в области технологий.
Пока это и другие подобные дела продолжают рассматриваться в суде, OpenAI стремится заключить соглашения о лицензировании контента с другими издателями. В кругах медицины и юриспруденции отсутствует единодушное мнение касательно разрешения текущих дел, однако они станут важными прецедентами для будущего регулирования индустрии искусственного интеллекта в Соединенных Штатах.
Источник: iXBT