Читайте о математическом прогнозировании пандемии Pandemia Live, изучении нарушающих приватность мобильных приложений, расследовании утечек из московской системы распознавания лиц и создании плагина для информирования о слежке CensorTracker.
28 ноября «РосКомСвобода» совместно с «Информационной культурой» весь день вела площадку «Право на приватность и открытость». Гости секции «Гражданские инициативы по приватности и открытости в период пандемии коронавируса» представили конкретные проекты, рассказали о проведённых ими исследованиях и тестах, и даже посвятили в детали расследования, касающегося утечек данных из госструктур.
.
.
Соавтор Pandemia Live Савва Мотовилов говорил о математическом прогнозировании пандемии коронавируса на примере своего некоммерческого научного проекта. Его команда создала дашборд для сбора статистики и отслеживания динамики по заражению, разработав и запустив набор инструментов для математического моделирования. В результате получился веб-портал, показывающий метрики и готовые прогнозы по всем регионам.
Работает он следующим образом: в данные Роспотребнадзора добавляются индексы и параметры (скрипты), после чего алгоритмы, построенные на нейронных сетях (машинном обучении), делают прогнозную аналитику. Происходит это в три этапа: сбор исходных данных, обработка алгоритмами и визуализация в виде графиков.
По словам Мотовилова, Pandemia Live — единственная подобная математическая модель с открытым кодом на GitHub в России и одна из немногих в мире. Любой разработчик может воспроизвести результаты. Данные на сайте, включая прогнозы и аналитику, доступны для скачивания и дальнейшего использования широкой аудиторией.
Развитие проекта идёт в сторону создания интерфейса открытых данных в виде датасетов CSV и подготовленной графической аналитики.
«Логично было бы подключить к проекту data scientists из России и других стран, которым было бы интересно проанализировать этот объём данных. Перед многими data scientists стоит задача найти исходные данные. Мы это сделали для них, поэтому открыть данные — закономерный для нас шаг», — заявил Мотовилов.
.
Учёные смогут вычислить индексы влияния на здравоохранение, проверить эффективность работы тех или иных механизмов в здравоохранении, найти статистические аномалии и манипуляции.
.
Эксперт из АНО «Инфокультура» Ксения Орлова рассказала о том, как мобильные приложения соблюдают приватность пользователей. Они облегчают нам жизнь, но собирают большие объёмы персональных данных, поэтому было бы неплохо понимать — куда, когда они собираются и кому отдаются, считает спикер.
В фокусе исследования организации оказались 147 приложений на Android из числа социально значимых, таких как сервисы соцсетей, мессенджеры, навигаторы, государственные приложения. У них проверили, какие данные запрашивались, какие трекеры использовались, в каких юрисдикциях базируются компании-издатели трекеров и какие разрешения используются непосредственно в работе приложения. Базу данных трекеров и разрешений взяли с Expodus Privacy. Выяснилось, что 90% имеют хотя бы один встроенный трекер и происходит передача данных третьему лицу. Треть передаёт данные пяти сторонним компаниям и лицам. У приложений и игр наихудшие показатели по трекерам: там могут быть установлены 50-60 трекеров, большей частью с рекламой. И в принципе только треть трекеров в исследуемых приложениях были аналитическими, остальные — рекламные.
Пандемия коронавируса, безусловно, повлияла на рынок приложений: государство проявило инициативу и сделало «Государственные услуги СТОП коронавирус» (Минцифры), «Социальный мониторинг» (Правительство Москвы), «Стопкоронавиурс контакты» (Минцифры) и мобильный идентификатор для удостоверения личности (Минцифры).
С 1 января 2021 году вступит в силу закон о предустановке отечественного ПО, напомнила Орлова. И возникает вопрос: насколько безопасны приложения, которые нам рекомендует государство? Сколько в них трекеров и разрешений?
Прежде чем устанавливать приложения, эксперт рекомендовала понять:
— сколько трекеров содержит приложение и какие разрешения запрашивает;
— хочу ли я установить приложение или обязан(а) это сделать?
— хочу ли я или обязан(а) предоставить требуемую информацию?
«Таким образом, немножко повышая осознанность использования мобильных приложений, можно самостоятельно формировать цифровой профиль и контролировать оставляемые цифровые следы», — заключила эксперт.
.
Журналист Андрей Каганских продолжил тему приватности и рассказал об утечках данных московской системы распознавания лиц и как благодаря «РосКомСвободе» в полиции раскрыли занимавшихся «пробивом по лицу» сотрудников. Он интересовался темой давно, предположив, что, поскольку данные из всех госсистем утекают, скорее всего, сольют их и с камер распознавания лиц. В ноябре 2019 года он обнаружил, что, хоть система и не была запущена в полном объёме, с неё уже появились утечки:
«Работали всего 2% камер, но с них уже вовсю «банчили» данные на чёрный рынок».
.
Об этом стали писать СМИ, которым Департамент информационных технологий Москвы отвечал одно и то же, хотя это явно противоречило объективной реальности: «Доступ к данным ЕЦХД [Единый центр хранения и обработки данных Москвы — прим. ред.] имеют только уполномоченные сотрудники органов исполнительной власти и правоохранительных органов».
К началу пандемии система видеонаблюдения заработала полноценно. Весной данные на чёрном рынке стали доступны за 1 тыс. долл. За полгода чиновники так и не остановили утечки данных с московских камер. «РосКомСвобода» мониторила ситуацию всю весну, а летом провела эксперимент: волонтёр Анна купила полное досье на себя за 15 тыс. руб. Кроме того, выяснилось, что барыги на чёрном рынке на просьбу показать, как работает слив данных, предоставили данные шести человек просто в качестве примера. «Если бы я был полицейским, это было бы шесть эпизодов в уголовном деле», — сказал Каганских.
ДИТ отвечает, что система анонимна, но на деле возможны так называемые корреляционные атаки, когда фотографии сопоставляются с данными из других систем, в результате чего личность человека раскрывается. Так, в МВД есть система, которая сверяет изображения с данными из системы «Российский паспорт». Получается, что анонимность системы по факту формальна. Можно использовать две системы и фото человека и на выходе получить досье на него.
В ноябре мэрия выделила 237 млн на реформу этой системы. Но можно израсходовать раз в 10 меньше денег на систему безопасности МВД, которая просто будет запугивать коррумпированных полицейских, которые сливают данные на чёрном рынке, считает Каганских. По его мнению, власти хотят «исправить» техническую часть системы, в то время как надо работать над юридической. Полиция, ДИТ не контактируют с людьми, поэтому расследование удалось провести благодаря тому, что «полиция любит сливать данные на чёрный рынок и зарабатывать. Зарабатывать, кстати, гроши». Мы только догадываемся, как работает система распознавания лиц. К слову, это ярко иллюстрируют кейсы Сергея Межуева и Антона Леушина — первые известные нам случаи ошибки этой системы.
Данные с камер — малая часть рынка пробива, где много коррумпированных сотрудников разных ведомств, а также провайдеров и инсайдеров, отметил спикер.
Ни у одной страны нет такой торговли данными, заявил журналист:
«В России есть огромная системная проблема со сливами: сотрудники силовых ведомств постоянно что-то сливают. Это значит, что службы безопасности МВД и ФСБ плохо справляются о своей работой».
.
Напоминаем, «РосКомСвобода» проводит кампанию против слежки через распознавание лиц Bancam. В рамках неё мы требуем ввести мораторий на массовое распознавание лиц, пока система видеонаблюдения не станет прозрачной и подотчётной и не будет иметь гарантии защиты от подобных злоупотреблений. Вы можете помочь нам, присоединившись к кампании и подписав петицию на сайте Change.org.
.
Если Ксения Орлова говорила о слежке через мобильные приложения, а Андрей Каганских — о слежке с помощью камер видеонаблюдения, то разработчик плагина CensorTracker «РосКомСвободы» Вадим Мисбах-Соловьёв представил инструмент для противодействия слежке в интернете.
CensorTracker умеет следующее:
— определять наличие домена в реестрах ОРИ и заблокированных сайтов;
— проверять блокировки по закону о «суверенном Рунете»;
— предоставлять доступ к заблокированным доменам.
Таким образом, плагин показывает — ресурс ориентирован на пользователя или на государство: сливает ли он государству данные по первому зову или же публично отказался от этого.
Для поиска домена в реестрах плагин раз в несколько часов скачивает актуальные «слепки» на основе реестров в локальный кэш при установке и проверяет наличие в «слепках» домена сайта, который открыт в текущей вкладке.
При проверке блокировок по закону о «суверенном Рунете» плагин собирает статистику о недоступности сайта: если сайт недоступен у нескольких человек, вероятно, его блокируют, хотя он может и не быть в соответствующем реестре.
Предоставляя доступ к заблокированным доменам, CensorTracker предлагает открыть сайт через прокси «РосКомсСободы», а также составляет локальный PAC-файл (понятный браузеру список сайтов и через какой прокси их открывать) и «подсказывает» его браузеру.
«Мы гарантируем приватность пользователей», — заявил Мисбах-Соловьёв.
Если хотите обезопаситься от утечек, вам нужно знать, как собирают ваши данные и куда отдают. Этот плагин полезен в плане информирования, убеждён программист.
Это последний материал из цикла статей с площадки «РосКомСвободы» на ОГФ’2020. Предыдущие обзоры читайте ниже:
• «Открытость и приватность: дисбаланс между правами граждан и действиями государства в эпоху пандемии коронавируса» здесь.
• «Открытые данные как инструмент общественного контроля борьбы с пандемией» здесь.
• «Ответственные алгоритмы: как открытость способна повлиять на легитимность технологий в обществе?» здесь.
Главное за неделю в области права.
23 декабря 2022 года Минюст включил Роскомсвободу в реестр незарегистрированных общественных объединений, выполняющих функции иностранного агента. Мы не согласны с этим решением и обжалуем его в суде.