1
Что такое открытые данные?
Открытые данные — это общедоступная информация, размещенная в Интернете для неоднократного, свободного и бесплатного использования в виде машиночитаемых систематизированных данных, в формате, позволяющем их автоматизированную обработку.
2
Открытые данные — только государственные данные?
Нет, речь может идти о самых разных данных — государственных, коммерческих, научных и пр. Открытые государственные данные — это один из видов открытых данных. Это может быть информация как о самом государстве, так и собираемая самими госорганами при выполнении их функций.
3
К слову, свободные лицензии из этой серии?
И да и нет. Свободные лицензии, а ещё открытый исходный код и т.п. подходы являются смежными направлениями — все они о том, что тот или иной вид информации, контента, продукта должен быть общедоступен, бесплатен и не регулируем авторским правом.
4
Почему открытые данные важны для меня?
Открытые данные обеспечивают для граждан открытость и прозрачность государства, бизнеса, науки и позволяют принять участие в деятельности различных структур. Для самих структур это хорошая база для проведения исследований.
Также пользователи могут использовать открытые данные для своих исследований и создания собственных как некоммерческих, так и коммерческих сервисов. Монетизация открытых данных пока очень недооценена.
5
Где можно применять открытые данные? Как они вообще выглядят, я так и не понял(а)?
Государственные открытые данные агрегируют, к примеру, проект мониторинга госзакупок Госзатраты и база данных о российских публичных должностных лицах Декларатор.
Помимо этого государственные открытые данные для коммерческих целей применяют, например, сервис поиска недвижимости ЦИАН и поисковая система Yandex.ru.
Общественные открытые данные собирает, допустим, хранилище структурированных данных экосистемы «Викимедиа» WikiData и система раскрытия информации о некоммерческих организациях «Открытые НКО».
Редкий пример научных открытых данных в России — «Национальный корпус русского языка».
Открытые данные ещё применяются в обучении алгоритмов искусственного интеллекта на больших объёмах данных и реальных задачах.
6
А как определяется, какие данные должны быть открыты?
При публикации открытых данных необходимо учитывать, что существует достаточно обширный пласт информации, раскрытие которой может нести риски для субъекта, к которому она относится. Это персональные данные, информация ограниченного доступа, гостайна и др.
Степень открытости данных — вопрос общественной значимости и коллективного консенсуса по этому вопросу. Что перевешивает, в сложных случаях могут решать уполномоченные лица или специальные органы, такие как комиссары по вопросам информации в Европе или суды в США. В России это тоже регламентируется.
7
И где у нас это регламентируется?
Понятие «открытые данные» даёт постановление Правительства РФ № 583 «Об обеспечении доступа к общедоступной информации о деятельности государственных органов и органов местного самоуправления в информационно-телекоммуникационной сети «Интернет» в форме открытых данных».
Регулируют публикацию данных следующие основные документы:
— 149-ФЗ «Об информации, информационных технологиях и о защите информации»;
— 8-ФЗ «Об обеспечении доступа к информации о деятельности государственных органов и органов местного самоуправления»;
— распоряжение Правительства «Об утверждении Концепции открытости федеральных органов исполнительной власти»;
— 152-ФЗ «О персональных данных»,
— 5485-1-ФЗ «О государственной тайне»;
— ст. 13 о соблюдении врачебной тайны 323-ФЗ «Об основах охраны здоровья граждан в Российской Федерации».
8
В России действительно открытые данные — открытые?
В России открытые данные публикуются не сбалансированно. Модель работы с ними в нашем государстве представляет перевернутую пирамиду.
- Высокий уровень открытости всего финансового и экономического блока. Например, есть данные по субсидиям и контрактам на портале «Госрасходы» и проекты Федерального казначейства и Минфина России), качеству госуправления (данные по госпрограммам), юридическим лицам (бухгалтерский баланс, число сотрудников).
- Крайне низкий уровень доступа к данным по качеству жизни (здравоохранение, образование, криминальная статистика и др.). В этих областях данные либо некачественные, либо их вообще нет.