Группа авторов обвинила Microsoft в использовании почти 200 000 пиратских книг для обучения модели искусственного интеллекта.
Кэй Бёрд, Джиа Толентино, Дэниел Окрент и другие авторы заявили, что компания использовала пиратские цифровые версии их произведений, чтобы научить свой ИИ Megatron (модель генерации естественного языка, которая содержит 530 млрд параметров) реагировать на человеческие подсказки.
Их иск, поданный в федеральный суд Нью-Йорка, является одним из нескольких громких дел, возбужденных авторами, новостными агентствами и другими правообладателями против технологических компаний, включая Meta Platforms (признана «экстремистской организацией» и запрещена в РФ), Anthropic и поддерживаемый Microsoft OpenAI, по поводу предполагаемого неправомерного использования их материалов в обучении ИИ.
Megatron не только построен на работах тысяч авторов, но и создан для генерации широкого спектра выражений, имитирующих синтаксис, голос и темы из защищённых авторским правом произведений, которые легли в основу обучения, добавили истцы.
Они призвали суд вынести постановление, которое запретит Microsoft нарушать авторские права. Истцы добиваются от корпорации возмещение ущерба — до $150 тыс. за каждую работу из тех, что предположительно вошли в датасет для обучения Megatron.
Недавно суд в США постановил, что Anthropic имеет право обучать свои ИИ-модели на опубликованных книгах без разрешения авторов. Решение стало прецедентом. Спустя два дня суд разрешил Meta обучать модели ИИ на защищённых авторским правом книгах.
Главное за неделю в области права.
23 декабря 2022 года Минюст включил Роскомсвободу в реестр незарегистрированных общественных объединений, выполняющих функции иностранного агента. Мы не согласны с этим решением и обжалуем его в суде.