Исследователи из Нидерландов составили рейтинг открытости 40 больших языковых моделей и 7 моделей для генерации изображений, которые заявлены производителями как открытые. Оказалось, как пишет OpenNET, что большинство моделей на самом деле распространяются под ограничивающими лицензиями, запрещающими использование в коммерческих продуктах. Сторонние исследователи могут экспериментировать с ними, но не имеют права адаптировать их под себя. Кроме того, более половины моделей не предоставляют детальных сведений о данных, используемых для обучения, и не публикуют информации о внутреннем устройстве.
В итоге наиболее открытыми были признаны модели BloomZ, AmberChat, OLMo, Open Assistant и Stable Diffusion, которые опубликованы вместе с исходными данными, кодом и реализацией API. Модели от Google (Gemma 7B), Microsоft (Orca 2) и Meta (Llama 3) расположились ближе к концу рейтинга, поскольку они не предоставляют доступ к исходным данным, не раскрывают технические детали реализации и распространяются под лицензиями, ограничивающими область использования.
Всего исследователи предложили 14 критериев открытости AI-моделей, в числе которых — условия распространения кода, данных для обучения, весовых коэффициентов, вариантов данных и коэффициентов, оптимизированных при помощи обучения с подкреплением (RL), а также наличие готовых к использованию пакетов, API, документации и детального описания реализации.
В настоящее время критерии открытости моделей машинного обучения ещё только формируются. В соответствии с предложенным организацией OSI (Open Source Initiative) вариантом определения открытого AI, основными критериями открытости AI-системы являются возможности по её использованию в любых целях и без отдельного разрешения, изучению работы системы и инспектированию её компонентов, внесению изменений для любых целей, а также возможности по передаче другим лицам исходного варианта и редакций после изменений.
Главное за неделю в области права.
23 декабря 2022 года Минюст включил Роскомсвободу в реестр незарегистрированных общественных объединений, выполняющих функции иностранного агента. Мы не согласны с этим решением и обжалуем его в суде.