Великобритания разрабатывает меры по регулированию использования защищенного авторским правом контента технологическими компаниями для обучения своих моделей искусственного интеллекта.
Британское правительство во вторник начало консультации, целью которых является повышение ясности как для творческих индустрий, так и для разработчиков искусственного интеллекта касаемо того, как интеллектуальная собственность получается и используется компаниями искусственного интеллекта для учебных целей.
Некоторые художники и издатели выражают недовольство по поводу того, как их контент свободно собирается такими компаниями, как OpenAI и Google, для обучения своих больших языковых моделей — моделей искусственного интеллекта, которые обучаются на огромных объемах данных для генерации человеческих ответов.
Большие языковые модели являются ключевой технологией, на которой основаны современные генеративные системы искусственного интеллекта, такие как ChatGPT от OpenAI, Gemini от Google и Claude от Anthropic.
В прошлом году The New York Times подал иск против Microsoft и OpenAI, обвиняя компании в нарушении авторских прав и злоупотреблении интеллектуальной собственностью для обучения больших языковых моделей.
В ответ OpenAI отвергло обвинения, заявив, что использование открытых веб-данных для обучения моделей искусственного интеллекта должно считаться «добросовестным использованием», а также предоставляет «возможность отказа» для владельцев прав, так как это «правильно».
Отдельно платформа распространения изображений Getty Images подала в суд на другую компанию по разработке искусственного интеллекта Stability AI в Великобритании, обвиняя её в изъятии миллионов изображений с её сайтов без согласия для обучения своей модели Stable Diffusion AI. Stability AI оспорила иск, отметив, что обучение и разработка её модели происходили за пределами Великобритании.
Предложения для обсуждения: Во-первых, во время консультаций будет рассмотрена возможность сделать исключение из закона об авторском праве для обучения искусственного интеллекта, если оно используется в коммерческих целях, но при этом дать право владельцам сохранять свои права для контроля за использованием их контента.
Во-вторых, будет предложено принять меры, которые помогут создателям контента лицензировать и получать компенсацию за использование их материалов для обучения моделей искусственного интеллекта, а также дадут разработчикам искусственного интеллекта ясность о том, какие материалы можно использовать для обучения их моделей.
Правительство заявило, что и творческим индустриям, и технологическим компаниям нужно сделать больше для обеспечения того, чтобы любые стандарты и требования, связанные с резервированием прав и прозрачностью, были эффективными, доступными и широко принятыми.
Также правительство рассматривает предложения, которые потребуют от разработчиков моделей искусственного интеллекта большей прозрачности касаемо их наборов данных для обучения и способов их получения, чтобы владельцы прав могли понять, когда и как их контент использовался для обучения искусственного интеллекта.
Это может быть спорным, так как технологические компании не склонны раскрывать данные, которые питают их алгоритмы, или рассказывать о том, как они их обучают, с учетом коммерческой чувствительности и риска раскрытия этих секретов потенциальным конкурентам.
Ранее при правительстве бывшего премьер-министра Риши Сунака было предпринято попытку установить добровольный кодекс авторских прав для искусственного интеллекта.
Авторские права и искусственный интеллект: Великобритания против США
В недавнем интервью CNBC генеральный директор компании по разработке программного обеспечения Appian Метт Калкинс отметил, что Великобритания имеет хорошие шансы стать «мировым лидером» в этом вопросе.
«Великобритания сделала ставку на правильные ценности, заявив, что она придает большее значение правам интеллектуальной собственности», — сказал Калкинс, отметив Закон о защите данных 2018 года как пример того, как Великобритания тесно связана с правами интеллектуальной собственности.
Кроме того, Великобритания не сталкивается с таким мощным лоббированием от национальных лидеров в области искусственного интеллекта, как в США, добавил Калкинс, утверждая, что в Великобритании политики менее склонны поддаваться давлению со стороны технологических гигантов.
«В США любой, кто пишет закон об искусственном интеллекте, услышит мнение Amazon, Oracle, Microsoft или Google, прежде чем законопроект попадет на рассмотрение», — отметил он.
«Это мощная сила, которая мешает принять разумное законодательство и защитить права тех, чья интеллектуальная собственность массово захватывается этими большими игроками в сфере ИИ».
Проблема потенциальных нарушений авторских прав со стороны компаний, работающих в сфере искусственного интеллекта, становится все более заметной, поскольку технологические компании переходят к более «мультимодальным» системам искусственного интеллекта, то есть таким, которые способны воспринимать и создавать контент в различных формах — изображениях, видео и текстах.
На прошлой неделе OpenAI представила свою модель видеогенерации Sora в США и большинстве стран мира. Этот инструмент позволяет пользователям вводить описание сцены и получать видеоклип с высоким качеством.