Группа авторов обвинила Microsoft в использовании почти 200 000 пиратских книг для обучения модели искусственного интеллекта.
Кэй Бёрд, Джиа Толентино, Дэниел Окрент и другие авторы заявили, что компания использовала пиратские цифровые версии их произведений, чтобы научить свой ИИ Megatron (модель генерации естественного языка, которая содержит 530 млрд параметров) реагировать на человеческие подсказки.
Их иск, поданный в федеральный суд Нью-Йорка, является одним из нескольких громких дел, возбужденных авторами, новостными агентствами и другими правообладателями против технологических компаний, включая Meta Platforms (признана «экстремистской организацией» и запрещена в РФ), Anthropic и поддерживаемый Microsoft OpenAI, по поводу предполагаемого неправомерного использования их материалов в обучении ИИ.
Megatron не только построен на работах тысяч авторов, но и создан для генерации широкого спектра выражений, имитирующих синтаксис, голос и темы из защищённых авторским правом произведений, которые легли в основу обучения, добавили истцы.
Они призвали суд вынести постановление, которое запретит Microsoft нарушать авторские права. Истцы добиваются от корпорации возмещение ущерба — до $150 тыс. за каждую работу из тех, что предположительно вошли в датасет для обучения Megatron.
Недавно суд в США постановил, что Anthropic имеет право обучать свои ИИ-модели на опубликованных книгах без разрешения авторов. Решение стало прецедентом. Спустя два дня суд разрешил Meta обучать модели ИИ на защищённых авторским правом книгах.
The main news of the week in the field of law.
On December 23, 2022, the Ministry of Justice included Roskomsvoboda in the register of unregistered public associations performing the functions of a foreign agent. We disagree with this decision and are appealing it in court.