27 июня 2024

Учёные составили рейтинг открытости генеративных AI-моделей

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И (ИЛИ) РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ «РОСКОМСВОБОДА» ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА «РОСКОМСВОБОДА». 18+
Оказалось, что большинство моделей на самом деле распространяются под ограничивающими лицензиями и не предоставляют сведений о данных, используемых для обучения.

Исследователи из Нидерландов составили рейтинг открытости 40 больших языковых моделей и 7 моделей для генерации изображений, которые заявлены производителями как открытые. Оказалось, как пишет OpenNET, что большинство моделей на самом деле распространяются под ограничивающими лицензиями, запрещающими использование в коммерческих продуктах. Сторонние исследователи могут экспериментировать с ними, но не имеют права адаптировать их под себя. Кроме того, более половины моделей не предоставляют детальных сведений о данных, используемых для обучения, и не публикуют информации о внутреннем устройстве.

В итоге наиболее открытыми были признаны модели BloomZAmberChatOLMoOpen Assistant и Stable Diffusion, которые опубликованы вместе с исходными данными, кодом и реализацией API. Модели от Google (Gemma 7B), Microsоft (Orca 2) и Meta (Llama 3) расположились ближе к концу рейтинга, поскольку они не предоставляют доступ к исходным данным, не раскрывают технические детали реализации и распространяются под лицензиями, ограничивающими область использования. 

Всего исследователи предложили 14 критериев открытости AI-моделей, в числе которых — условия распространения кода, данных для обучения, весовых коэффициентов, вариантов данных и коэффициентов, оптимизированных при помощи обучения с подкреплением (RL), а также наличие готовых к использованию пакетов, API, документации и детального описания реализации.

В настоящее время критерии открытости моделей машинного обучения ещё только формируются. В соответствии с предложенным организацией OSI (Open Source Initiative) вариантом определения открытого AI, основными критериями открытости AI-системы являются  возможности по её использованию в любых целях и без отдельного разрешения, изучению работы системы и инспектированию её компонентов, внесению изменений для любых целей, а также возможности по передаче другим лицам исходного варианта и редакций после изменений.

Контакты

По общим вопросам

[email protected]

По юридическим вопросам

[email protected]

Для СМИ

Телеграм: moi_fee
Signal: moi_fee.13

18+

23 декабря 2022 года Минюст включил Роскомсвободу в реестр незарегистрированных общественных объединений, выполняющих функции иностранного агента. Мы не согласны с этим решением и обжалуем его в суде.