Исследователи из Нидерландов составили рейтинг открытости 40 больших языковых моделей и 7 моделей для генерации изображений, которые заявлены производителями как открытые. Оказалось, как пишет OpenNET, что большинство моделей на самом деле распространяются под ограничивающими лицензиями, запрещающими использование в коммерческих продуктах. Сторонние исследователи могут экспериментировать с ними, но не имеют права адаптировать их под себя. Кроме того, более половины моделей не предоставляют детальных сведений о данных, используемых для обучения, и не публикуют информации о внутреннем устройстве.
В итоге наиболее открытыми были признаны модели BloomZ, AmberChat, OLMo, Open Assistant и Stable Diffusion, которые опубликованы вместе с исходными данными, кодом и реализацией API. Модели от Google (Gemma 7B), Microsоft (Orca 2) и Meta (Llama 3) расположились ближе к концу рейтинга, поскольку они не предоставляют доступ к исходным данным, не раскрывают технические детали реализации и распространяются под лицензиями, ограничивающими область использования.
Всего исследователи предложили 14 критериев открытости AI-моделей, в числе которых — условия распространения кода, данных для обучения, весовых коэффициентов, вариантов данных и коэффициентов, оптимизированных при помощи обучения с подкреплением (RL), а также наличие готовых к использованию пакетов, API, документации и детального описания реализации.
В настоящее время критерии открытости моделей машинного обучения ещё только формируются. В соответствии с предложенным организацией OSI (Open Source Initiative) вариантом определения открытого AI, основными критериями открытости AI-системы являются возможности по её использованию в любых целях и без отдельного разрешения, изучению работы системы и инспектированию её компонентов, внесению изменений для любых целей, а также возможности по передаче другим лицам исходного варианта и редакций после изменений.
The main news of the week in the field of law.
On December 23, 2022, the Ministry of Justice included Roskomsvoboda in the register of unregistered public associations performing the functions of a foreign agent. We disagree with this decision and are appealing it in court.