«Википедия» приняла новую политику против текстов, созданных ИИ

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН, РАСПРОСТРАНЕН И (ИЛИ) НАПРАВЛЕН ИНОСТРАННЫМ АГЕНТОМ «РОСКОМСВОБОДА» ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА «РОСКОМСВОБОДА». 18+
Редакторы Википедии приняли новые правила, призванные помочь им справиться с потоком статей, созданных нейросетями, заполонивших онлайн-энциклопедию.

По новым правилам, редакторы энциклопедии могут моментально удалять статьи, в которых явно прослеживаются среды машинного происхождения — обычный процесс удаления занимает около недели. Кроме того, для удаления сгенерированной статьи не нужно проходить многоступенчатую процедуру обсуждения. Ранее такой ускоренный механизм удаления применялся только к бессмысленным наборам слов, рекламе и другим очевидным отклонениям от формата. Об этом пишут на Хабре со ссылкой на 404 Media.

Википедия поддерживается глобальным сообществом добровольцев, работающих в тесном сотрудничестве, и одна из причин, по которой она остаётся надёжным источником информации, заключается в том, что это сообщество уделяет много времени обсуждениям, размышлениям и спорам обо всём, что происходит на платформе, будь то изменения отдельных статей или политика, регулирующая эти изменения. Удаление целых статей «Википедии» — нормальное явление, но основной процесс удаления обычно требует недельного обсуждения, в ходе которого википедисты пытаются прийти к консенсусу относительно того, удалять ли статью.

Однако для решения распространённых проблем, которые явно нарушают правила «Википедии», также предусмотрена процедура «быстрого удаления», когда один человек отмечает статью, администратор проверяет её на соответствие определённым условиям, а затем удаляет её без периода обсуждения.

Например, статьи, полностью состоящие из бессмысленного текста, или то, что «Википедия» называет «патентной чепухой» ("patent nonsense"), могут быть отмечены для быстрого удаления. То же самое относится и к статьям, представляющим собой просто рекламу, не имеющую энциклопедической ценности. Если же кто-то помечает статью как требующую удаления, потому что она «скорее всего, не представляет интереса», это более субъективная оценка, требующая всестороннего обсуждения.

В настоящее время большинство статей, которые редакторы Википедии помечают как созданные ИИ, попадают в последнюю категорию, поскольку редакторы не могут быть абсолютно уверены в этом. Ильяс Леблё (Ilyas Lebleu), основатель WikiProject AI Cleanup и редактор, внесший ряд критических замечаний в недавно принятую политику в отношении статей, созданных ИИ, и их быстрого удаления, рассказал, что именно поэтому предыдущие предложения столкнулись с трудностями:

«Хотя намёки на то, что что-то сгенерировано ИИ, легко заметить (выбор формулировок, длинные тире, маркированные списки с жирным заголовком и т. д.), эти сигналы обычно не столь очевидны, и мы не хотим по ошибке удалять что-то только потому, что это похоже на ИИ. Рост количества легко генерируемого ИИ-контента – „экзистенциальная угроза“ для «Википедии»: поскольку наши процессы ориентированы на (часто долгие) обсуждения и достижение консенсуса, возможность быстро генерировать много фиктивного контента проблематична, если у нас нет способа так же быстро его удалять. Конечно, контент, созданный ИИ, не однозначно плох, и люди тоже вполне способны писать плохой контент, но, конечно, не с такой же скоростью».

 

Решение, придуманное википедистами, заключается в том, чтобы разрешить быстрое удаление статей, явно созданных ИИ, которые в целом соответствуют двум условиям. Первое — если статья содержит «информацию, предназначенную для пользователя» (в ответ на запросы к языковым моделям). Это относится к тексту статьи, который явно является ответом LLM (Large Language Model, Большая языковая модель) на запрос пользователя, например: «Вот ваша статья в Википедии о…», «До моего последнего обновления обучения…» и «как большая языковая модель» ("Here is your Wikipedia article on…,” “Up to my last training update …,” and "as a large language model”). Это явный признак того, что статья была создана LLM, основывающимся на методе, который ранее использовали для идентификации сообщений в социальных сетях и научных работ, созданных ИИ.

Другое условие, при котором статья, созданная ИИ, может быть быстро удалена, — это явно неверные цитаты. Это может быть как включение внешних ссылок на книги, статьи или научные труды, которые не существуют, так и ссылки, ведущие на совершенно не связанный с темой контент. В новой политике Википедии приводится пример цитирования статьи о виде жука в статье по информатике.

Леблё заявил, что быстрое удаление — это своего рода «пластырь», способный решить самые очевидные проблемы, и что проблема с ИИ сохранится, поскольку всё больше контента, созданного ИИ, не соответствует новым условиям быстрого удаления. Он также отметил, что ИИ может стать полезным инструментом, который может оказать положительное влияние на Википедию в будущем.

Contacts

For general questions

[email protected]

For legal questions

[email protected]

Contacts for media:

Telegram: moi_fee
Signal: moi_fee.13

18+

On December 23, 2022, the Ministry of Justice included Roskomsvoboda in the register of unregistered public associations performing the functions of a foreign agent. We disagree with this decision and are appealing it in court.