Коллективный иск против Adobe по поводу авторских прав и обучения искусственного интеллекта.

  • Авторы обвиняют Adobe в использовании книг, защищенных авторским правом, для обучения своей модели SlimLM.
  • Коллективный иск касается наборов данных SlimPajama-627B, RedPajama и Books3.
  • Этот случай может создать ключевые прецеденты в области авторского права и обучения искусственному интеллекту в США и Европе.
  • Этот скандал ставит под сомнение модель данных генеративного ИИ и обещание Adobe о «ответственном ИИ».

Коллективный иск против Adobe по поводу авторских прав и обучения искусственного интеллекта.

Юридическая тяжба вокруг обучение моделей искусственного интеллекта с использованием произведений, защищенных авторским правом В этой истории открылась новая глава: компания Adobe оказалась в центре скандала. Исторически связанная с творческим сектором, компания теперь сталкивается с серьезными проблемами. коллективный иск что ставит под сомнение сам способ получения компанией части данных, использованных для обучения одного из её ИИ.

Суть иска заключается в следующем: SlimLM, семейство легковесных языковых моделей, разработанных для задач помощи в работе с документами, особенно в мобильныйВ жалобе утверждается, что для обучения этой системы использовались следующие ресурсы: пиратские книги и другие произведения, защищенные авторским правом без разрешения авторов, что открывает деликатный фронт не только для Adobe, но и для всей индустрии генеративного ИИ, в том числе в Европе и Испании, где начинают накаляться дебаты о законном использовании данных для ИИ.

Контекст коллективного иска и происхождение конфликта

Правовой контекст коллективного иска против Adobe.

El Декабрь 17 2025Компания Adobe была уведомлена о предлагаемые коллективные действия Иск, поданный писателем из Орегона, рассматривается в федеральном суде Северного округа Калифорнии. Элизабет Лионобвиняет компанию в том, что она воспользовалась ситуацией. пиратские версии книг —включая несколько его собственных работ — для подготовки к предварительному обучению его моделей искусственного интеллекта.

В иске утверждается, что компания Adobe использовала его тексты в рамках обработанное подмножество Данные, послужившие основой для SlimLM. Этот материал стал частью цепочки известных наборов данных в экосистеме ИИ: Книги3включено в Красная пижамаи, в свою очередь, интегрированы в набор данных. SlimPajama-627Bиспользовался для предварительного обучения модели Adobe. По утверждению истцов, в этом процессе якобы были использованы тысячи произведений, защищенных авторским правом, без разрешения, указания авторства или компенсации.

Лион утверждает, что играет роль от имени других авторов и правообладателей кто мог бы оказаться в подобной ситуации, что делает этот случай... потенциально далеко идущий коллективный искХотя конкретная сумма пока не обнародована, в иске запрашивается значительная финансовая компенсация, возмещение юридического и иного ущерба, а также оплата услуг адвокатов и прямое признание компанией Adobe умышленного нарушения авторских прав.

Компания, со своей стороны, утверждала, что SlimLM проходил обучение с использованием SlimPajama-627B.Этот набор данных, описанный как открытый набор данных, опубликованный компанией Cerebras в июне 2023 года и состоящий из данных, предположительно полученных из... множественные открытые и дедуплицированные корпусаСуть правового конфликта заключается именно в определении того, достаточно ли этого «открытого» характера для легитимизации использования защищенных авторским правом произведений, которые попали бы в набор данных без согласия их авторов.

На данный момент процесс находится на начальной стадии. Компания Adobe избегает публичных подробностей, а такие СМИ, как Reuters, отмечают, что компания не ответила на некоторые запросы о комментариях. Однако Лион подчеркнул, что это полны решимости неуклонно продвигать это дело. и что у него есть ресурсы, чтобы довести дело до конца, что предполагает длительную и широко освещаемую в СМИ судебную тяжбу.

Как SlimLM вписывается в стратегию Adobe в области искусственного интеллекта

Модель SlimLM от Adobe и обучение искусственного интеллекта.

Одним из элементов, делающих этот случай особенно примечательным, является то, что рассматриваемая модель не является СветлякAdobe — наиболее известный широкой публике пакет программ для создания креативных работ, но... SlimLMгораздо более незаметная система, ориентированная на выполнение задач Помощь в работе с документами и выполнении вспомогательных функций. на заднем плане. То есть, речь идёт не об ИИ, генерирующем эффектные изображения для рекламных кампаний, а о моделях, которые помогают обрабатывать, обобщать или управлять текстом в фоновом режиме приложений.

До сих пор в своей стратегии продвижения ИИ компания Adobe в значительной степени опиралась на Firefly. пример «ответственного ИИ»обучен — по утверждению самой компании — с лицензионный контент (например, Adobe Stock), материалы, находящиеся в общественном достоянии, и другие ресурсы, на которые компания заявляет явные права. Кроме того, компания продвигала программы компенсаций для авторов Adobe Stock с целью укрепления имиджа платформы как союзника фотографов, иллюстраторов и создателей контента.

Однако в иске основное внимание уделяется не этому широко обсуждаемому аспекту. В центре внимания — компания SlimLM и... происхождение данных, использованных для предварительного обученияименно в области, менее заметной для конечного пользователя. Это различие важно, поскольку оно демонстрирует, что дискуссия об использовании произведений, защищенных авторским правом, не ограничивается инструментами, создающими эффектные изображения или креативные тексты, но также и другими подобными вещами. Это также затрагивает более тихие модели поддержки.интегрированы в повседневные товары.

Согласно представленной документации, обучение SlimLM должно было проводиться на основе... SlimPajama-627B, вариант более крупного набора данных, Красная пижамаочень популярен в сообществе ИИ. Это, в свою очередь, интегрирует Книги3коллекция из примерно 191.000 книг который неоднократно упоминался в исках о нарушении авторских прав. В иске утверждается, что если SlimPajama напрямую происходит от RedPajama, а RedPajama включает в себя Books3, то Произведения Лиона и других авторов копировались и обрабатывались в процессе предварительной подготовки. без четкого правового основания.

Для Adobe этот вопрос возник в деликатный момент, в разгар расширения спектра предоставляемых услуг. Генеративный искусственный интеллект и вспомогательные инструменты Интегрированные в экосистему креативных и офисных продуктов, эти продукты создают имидж компании как защитника творческих людей, который она тщательно культивирует, чтобы отличаться от других технологических гигантов. Поэтому этот имидж подвергается особенно пристальному вниманию, в том числе и среди креативных специалистов в Испании и Европе, которые ежедневно используют такие инструменты, как Photoshop, Illustrator, Acrobat или Premiere.

Роль наборов данных Books3, RedPajama и SlimPajama

Чтобы понять, почему этот спрос выходит далеко за рамки единичного случая, стоит на мгновение остановиться и рассмотреть, как обучаются современные модели искусственного интеллекта. Крупные языковые модели и многие генеративные системы искусственного интеллекта обучаются на огромных массивах текста.Веб-страницы, статьи, книги, код, техническая документация и т. д. Чем разнообразнее и обширнее этот корпус, тем лучше, как правило, работают модели, при условии, что обработка данных и проектирование системы соответствуют необходимым стандартам.

В этом контексте, такие наборы данных, как Книги3огромная коллекция книг, происхождение которых давно вызывает подозрения, и Красная пижама, проект, цель которого – воспроизвести наборы данных, используемые крупными лабораториями для обучения своих моделей. SlimPajama-627B Это будет дедуплицированный и уточненный вариант того материала, который компания Cerebras предоставила сообществу в качестве открытого набора данных в 2023 году.

Согласно иску против Adobe, компания SlimPajama якобы была создана. «Копирование и манипулирование» RedPajama, включая раздел Books3. Именно это включение, теоретически, и дает доступ к... тысячи произведений, защищенных авторским правом по всей цепочке. В обвинении утверждается, что даже если Adobe не составляла книги напрямую, тот факт, что она использовала набор данных, включающий эти книги, все равно представляет собой мошенничество. многократно скачивать, копировать и обрабатывать. Материал защищен на этапах предварительной обработки и предварительного обучения.

Этот спор не нов: оба Книги 3 в образе Красной Пижамы Они уже упоминались в других судебных исках против технологических компаний, в том числе в случаях, когда такие компании, как Apple и Salesforce, обвинялись в использовании этих данных для обучения своих внутренних моделей. В основе всех этих споров лежит один и тот же вопрос: Можно ли считать законным повторное использование «открытых» наборов данных, содержащих произведения, защищенные авторским правом? не получив предварительно разрешения от всех участвующих авторов?

Таким образом, судебный процесс против Adobe дополняет небольшой поток судебных разбирательств что подталкивает отрасль к пересмотру своей практики. На практике каждый новый случай усиливает давление на создание механизмов для прослеживаемость данныхЧеткие системы отказа от участия для создателей контента и специальные модели лицензирования для обучения ИИ — на это в Европе также может повлиять... Регламент ЕС об искусственном интеллекте а также действующие правила в области авторского права.

Правовая сфера, которая уже затрагивает всю индустрию искусственного интеллекта.

Иск против Adobe возник не на пустом месте. С 2023 года идёт разбирательство. Волна судебных исков о нарушении авторских прав против компаний, разрабатывающих генеративный искусственный интеллект.В том числе такие компании, как OpenAI, Stability AI, Meta, Anthropic и Midjourney. Многие из этих дел связаны с одной и той же идеей: несанкционированное использование произведений, защищенных авторским правом, для обучения моделей, способных генерировать тексты, изображения или музыку, которые порой могут очень точно имитировать стиль оригинальных авторов.

Одним из недавних достижений стало Соглашение достигнуто компанией Anthropicкоторые согласились заплатить примерно 1.500 млн. Некоторые авторы осудили использование пиратских версий своих книг для обучения чат-бота Клода. Это широко обсуждаемое соглашение было истолковано как возможное точка перегиба То, как технологические компании обрабатывают подобные иски, открыло путь к ожиданиям существенной компенсации в будущих судебных разбирательствах.

Тем временем американские СМИ, такие как TechCrunch, Reuters, The Verge и The New York Times, документируют происходящее. связанные дела Эти проблемы затрагивают практически всех крупных игроков в сфере ИИ. Характерная закономерность повторяется: огромные массивы данных, включающие всё — от веб-страниц до репозиториев кода и даже целых книг; отсутствие чётких механизмов согласия; и всё более мощные модели, использующие этот материал для предоставления сложных ответов, резюме, анализов или генерации креативного контента.

Дело Adobe добавляет важный нюанс: компания построила часть своей коммерческой стратегии вокруг идеи чтобы «отличить» себя от остальных. защита создателей. Именно поэтому подозрение, что одна из его моделей могла быть основана на пиратских книгах, вызывает волну возмущения в творческом секторе, в том числе в таких странах, как Испания, где писатели, переводчики, журналисты и издатели Они с некоторой обеспокоенностью отмечают, что их каталоги могут прямо или косвенно попасть в обучающие наборы данных.

За пределами Соединенных Штатов решения судов по этим вопросам будут внимательно отслеживаться в Европе. Судебная практика США по вопросам добросовестного использования Копирование с целью трансформационного использования не совсем соответствует европейской правовой базе, которая в большей степени защищает права правообладателей. Тем не менее, предстоящие решения могут повлиять на то, как европейские судьи будут интерпретировать такие вопросы, как массовое использование данных в учебных целях или необходимость выплаты конкретной компенсации авторам.

Потенциальное влияние в Европе и на творческих деятелей в Испании.

Хотя иск против Adobe был подан в американский суд, его последствия могут ощущаться по обе стороны Атлантики. Крупные технологические компании работают с глобальные модели И их подход к управлению данными редко ограничивается одной юрисдикцией. Если суды США в конечном итоге признают использование определенных наборов данных нарушением авторских прав, то, вероятно, Следует пересмотреть те же модели или методы. также в Европе.

В частности, в случае с Adobe многие из ее инструментов на основе искусственного интеллекта уже широко используются в различных областях. Испанские дизайн-студии, рекламные агентства, издательства и средства массовой информацииВозможное присутствие испанских литературных произведений в таких наборах данных, как Books3, без разрешения вызывает растущую обеспокоенность у авторов и профессиональных групп. Если подтвердится, что книги, зарегистрированные в Испании, использовались для обучения моделей, могут возникнуть новые проблемы. каналы для подачи индивидуальных или коллективных жалоб также в европейских юрисдикциях.

El Регламент Европейского Союза по искусственному интеллекту, которая вводит обязательства по обеспечению прозрачности для определенных систем, а также правила Европейского сообщества в отношении авторское правоЭти факторы будут иметь ключевое значение при определении того, какие методы являются приемлемыми. Например, требование документировать используемые наборы данных или предоставлять правообладателям четкие механизмы отказа от участия может быть ужесточено, если случаи, подобные делу Adobe, станут более распространенными.

Для европейской творческой экосистемы подобные судебные разбирательства лишь усиливают представление о необходимости их проведения. вести переговоры о новых формах отпусков и вознаграждения Речь идёт о подготовке ИИ. Это не просто предотвращение несанкционированного использования, а изучение способов, с помощью которых издатели, агентства по управлению правами и технологические платформы могут... согласовать условия доступа к каталогам литературные или визуальные произведения в обмен на справедливое вознаграждение.

С точки зрения инноваций, задача будет заключаться в следующем: согласование разработки мощных моделей с подлинным уважением к интеллектуальной собственностиВ Испании, где издательская индустрия, а также аудиовизуальный и рекламный секторы имеют значительный вес, исход судебного процесса против Adobe будет внимательно отслеживаться как компаниями, уже использующими ИИ, так и юридическими фирмами, специализирующимися на цифровом праве и интеллектуальной собственности.

Уроки для стартапов и технологических компаний по использованию ИИ.

Дело Adobe напрямую доносит сообщение до... экосистема технологических стартаповКак в Америке, так и в Европе происхождение данных имеет огромное значение. Хотя многие молодые компании не разрабатывают собственные крупные языковые модели, они часто полагаются на... открытые наборы данных, API сторонних разработчиков и предварительно обученные модели которые, сами того не подозревая, могут столкнуться с теми же юридическими проблемами, которые сейчас обсуждаются в судах.

Первый урок заключается в необходимости тщательно проверять источники данныхПростое обозначение набора данных как «открытого» или размещение его в общедоступном репозитории не гарантирует автоматически защиту авторских прав. Изучите документацию, выявите любые компоненты, защищенные авторским правом, и, если сомневаетесь, искать более экологичные альтернативы или договариваться о конкретных лицензиях. Это может предотвратить серьезные проблемы в будущем.

Второе связано с международное соответствие нормативным требованиямСтартапам, работающим в Испании или Латинской Америке, но стремящимся выйти на пользователей в Европе или США, следует помнить, что на них могут распространяться определенные правила. нескольких юрисдикций одновременноЭто требует разработки с самого начала четких правил, касающихся сбора, хранения данных, получения согласия и реагирования на запросы об удалении или претензии по поводу нарушения авторских прав.

В-третьих, это открывает благодатную почву для новые бизнес-модели В центре внимания – ответственное управление данными. Инструменты отслеживания наборов данных, сервисы проверки разрешений, платформы, упрощающие лицензирование культурных каталогов, или решения, позволяющие правообладателям контролировать использование своих произведений в системах искусственного интеллекта, могут стать инструментами обеспечения прослеживаемости. очень ценные продукты в ближайшие годы.

Наконец, стоит помнить, что репутация Искусственный интеллект стал таким же важным активом, как и сама технология. Для любой компании, которая разрабатывает или внедряет ИИ, вовлечение в конфликт из-за неправомерного использования контента, защищенного авторским правом, может стать серьезной проблемой. вызвать недоверие среди клиентов, партнеров и пользователейФормирование культуры уважения к интеллектуальной собственности — это не только юридический вопрос, но и умный способ выделиться на рынке, все больше насыщенном обещаниями «этичного ИИ» или «ответственного ИИ».

Возможные сценарии и то, что может произойти дальше.

Как и во многих подобных судебных процессах, дело против Adobe открывает широкий спектр возможностей. правовые сценарииСуд может принять решение о полном принятии коллективного иска, ограничить его объем, отклонить его, если сочтет основания недостаточными, или, как это происходило в других разбирательствах, спор может быть разрешен путем... внесудебное урегулирование Это включает в себя финансовое вознаграждение и обязательства по изменению практики работы компании.

Для Adobe, помимо экономических затрат, наибольшее влияние может оказать необходимость тщательно проверьте их цепочки поставок данныхЭто предполагает проверку того, какие наборы данных использовались в каждой модели, какая часть обучения основана на конфиденциальных данных, какие лицензии регулируют такое использование, и как прозрачно доносить всю эту информацию до клиентов и регулирующих органов.

Технологическая индустрия в целом находится на перепутье. По мере роста числа исков о нарушении авторских прав и ужесточения регулирования — особенно в Европейском Союзе — разработка ИИ на основе этих технологий кажется все менее целесообразной. Массовый сбор данных из интернета и сомнительные коллекции книг или изображений.Вместо этого, идея моделей, обученных с использованием тщательно отобранные данные с четкими разрешениями и, во многих случаях, сопровождаемые соглашениями о вознаграждении..

В этой меняющейся ситуации дело Adobe служит зеркалом как для крупных технологических компаний, так и для малых предприятий, стремящихся использовать ИИ без юридических ловушек. Решение суда по этому вопросу будет иметь решающее значение. коллективный иск по поводу авторских прав и обучения ИИ Это повлияет не только на конкретную модель, такую ​​как SlimLM, но и может изменить представление о доступе к креативным данным в эпоху искусственного интеллекта.

Как издать книгу
Теме статьи:
Как издать книгу