Yandex Cloud (облачный провайдер «Яндекса») дал пользователям возможность классифицировать тексты посредством нейросетей. Как сообщили «Ъ» в компании, классификатор на базе YandexGPT понадобится в том числе для «обнаружения противоправной информации», а также для работы с обращениями клиентов, спамом и противодействия мошенничеству.
Классификация текстов, по сообщению компании, реализована следующим образом: заказчик определяет категории, по которым он хочет классифицировать тексты, затем загружает в сервис «Яндекса» примеры текстов для каждой категории, а потом получает доступ к созданной под задачу модели-классификатору.
Компании уже пытались использовать сервисы «Яндекса» для выявления запрещенной в РФ информации. В декабре 2022 года интернет-издательство Ridero объявило о проверке своей библиотеки с помощью нейросети, чтобы выявить ЛГБТ-книги и снять их с продажи. Позже выяснилось, что нейросеть обучалась с помощью принадлежащего «Яндексу» сервиса «Толока», пользователям которого предлагали прочитать текст и указать, одобряется ли в нем «существование лесбиянок, геев, бисексуалов и трансгендеров», смена пола, зоофилия, некрофилия, идеи чайлдфри или инцест. В пресс-службе «Яндекса» сообщили, что отозвали это задание, сочтя его оскорбительным.
The main news of the week in the field of law.
On December 23, 2022, the Ministry of Justice included Roskomsvoboda in the register of unregistered public associations performing the functions of a foreign agent. We disagree with this decision and are appealing it in court.