ОГФ’2020: открытые данные по коронавирусу вызывают большие сомнения


Выделили самое главное в секции «Открытые данные как инструмент общественного контроля борьбы с пандемией», где эксперты среди прочего рассказывают, можно ли доверять сайту «Стопкоронавирус.рф», как органы ЗАГС стали скрывать данные по смертности населения, куда из бюджета расходуются «коронавирусные деньги», выдержала ли проверку временем поисковая статистика и почему в общественном здравоохранении всё плохо с точки зрения открытых данных.  

28 ноября «Роскомсвобода» совместно с «Информационной культурой» весь день вела на Общероссийском гражданском форуме площадку «Право на приватность и открытость». В рамках секции докладов «Открытые данные как инструмент общественного контроля борьбы с пандемией» эксперты рассказали про открытость/закрытость государства и прозрачность/непрозрачность его решений во время пандемии, а также ответили, почему прямой диалог общества и государства может помочь в борьбе с коронавирусом (про важность открытых данных, кстати, почитайте здесь). В некоторых выступлениях красной нитью проходила мысль, что государству надо больше доверять гражданам и отказываться от патерналистской модели поведения.

Кандидат биологических наук, независимый аналитик Алексей Куприянов представил доклад об общественном аудите государственной статистики. С 13 марта эксперт собирает данные по распространению коронавирусной инфекции по России. В апреле он стал публиковать их и в «Фейсбуке» на страничке инициативной группы Watching Covid-19.ru, где вместе с коллегами, в том числе другими докладчиками — Алексеем Ракша и Борисом Овчинниковым, — выкладывает аналитику. Основные источники данных — «Стопкоронавирус.рф» и СМИ, на первых порах — ещё бюллетени Роспотребнадзора.

Задачи инициативы — резервное копирование данных, расчёт их характеристик (к примеру, доля смертей, ускорение и замедление эпидемии), наработка аналитической инфографики для осмысления ситуации и методов выявления манипуляций с данными. Первое на удивление не менее важно, чем всё остальное, поскольку в России нет ресурсов, которые бы давали полную картинку по эпидемии, с самого начала, в динамике. Тот же сайт «Стопкоронавирус.рф» «не имеет памяти»: каждый месяц он «начинает с начала», а данные за минувшие месяцы «уходят».

Куприянов отметил, что это первая пандемия, по которой так много открытых данных, но, к сожалению, они не очень достоверны. Аналитик выявил две главных фальсификации, из-за которых доверять информации невозможно:
— избыточное сглаживание данных, когда показатели долгое время находятся на одном уровне («собянинский коридор»);
— дагестанский скачок, когда все вдруг резко выздоровели (в других регионах тоже такое было, например, в Марий Эл, где добились отрицательного количества заболевших).

«Эта пандемия развивается благоприятно в плане открытости данных, но она совершенно проиграна в плане достовернности данных».

Для получения более точных данных, по мнению учёного, необходимы:
— машиночитаемые данные;
— доступ к дезагрегированным данным;
— расширение спектра доступных параметров;
— смещение акцента с агрегирования на валидацию.

Для исправления ситуации эксперт советует, например, Росстату как можно раньше опубликовать данные по смертности по датам смерти, а не регистрации, а Роспотребнадзору — максимально подробно раскрыть данные по госпитализации (к примеру, количество людей на интенсивной терапии). Последнее поможет гражданам в принятии рациональных решений, уверен Куприянов.

Граждане подросли, а государство обращается с нами по-прежнему, как с малыми детьми, за которых надо всё решать, не предлагать разумные действия, а просто приказывать, посетовал аналитик. Но такая модель устарела, и теперь людьми надо вести более вдумчивый диалог, заявил он.

Демограф Алексей Ракша представил доклад о рождаемости, смертности и манипуляции со статистикой в эпоху ковида. По его словам, самый важный показатель для сравнения ситуации в разных местах — смертность (как итог пандемии). Избыточная смертность (рост смертности по сравнению с базовыми показателями) — лучший индикатор тяжести и динамики пандемии. Такие СМИ, как The New York и Times Financial Times используют именно его. Ведущая международная база о смертности Human Morality Database создала интерактивный портал с инфографикой еженедельной статистики общей и, соответственно, избыточной смертности. В отличие от «Стопкоронавирус.рф» в ней можно рассматривать разные периоды для сравнения, от недели до 20 лет. В большинстве развивающихся стран, однако, нет нормальной статистики даже по «обычной» смертности. В России не ведётся еженедельная статистика. Также в последние годы число умерших устойчиво снижалось, поэтому использование, к примеру, средних значений за пять лет не подходит: это занижает масштаб проблемы.

В России органы ЗАГС регистрируют факты смерти и загружают в базу Единый государственный реестр ЗАГС. Там посмотреть данные может любой госорган, имеющий доступ к ней, тот же Росстат. Последний обычно выгружает и проверяет данные обычно за 28-30 по окончании месяца, в пандемию этот срок увеличился до 35-40 дней в связи с изменением режимов работы ЗАГС, изменением поведения людей (боязнь посещать публичные места) и т.п. Также многие Центральные управления ЗАГС регионов перестали публиковать информацию, особенно о числе актов смерти, начиная с апреля. Росстат стал в закрытом режиме ежедневно отчитываться о числе смертей перед Правительством.

К сожалению, всё больше органов ЗАГС стали и вовсе отказываться от ежемесячных публикаций о числе актов смерти. Так стало происходить во многих субъектах: Москве, Ленинградской, Рязанской, Вологодской, Челябинской, Свердловской областях, Тыве, Алании, Крыму, Камчатке и др. Интересно, что информация о рождаемости и др. «хороших новостях» остаётся.

«Всё плохое убрали, всё хорошее оставили», — сказал спикер.

В Челябинской области был случай, когда данные выложили, потом удалили и после скандала из-за этого — убрали страничку со статистикой целиком. Некоторые субъекты перешли на ежеквартальные отчёты.

«Стопкоронавирус.рф» демограф охарактеризовал как «красивый, но насквозь лживый». Один из примеров фальсификаций — в некоторых регионах каждый день якобы умирает одинаковое число людей. Тем не менее сайт можно использовать как базу для сравнения. При умножении данных сайта на 6,5-7 и небольшом сдвиге назад по времени можно выйти на избыточную смертность, вычислил эксперт.

По итогам октября 2020 число умерших в ряде регионов побило рекорд, а ноябрь 2020 года и вовсе может стать самым страшным месяцем по количеству умерших в стране с 1947 года. Чтобы повысить доверие к госстатистике, эксперт советует «Стопкоронавирус.рф» «перестать врать» и давать большую разбивку по критериям (возрасту, полу). Гражданам отдельно можно запрашивать ежеквартальные данные по С41-форме у Росстат. Ведомство собирает данных больше, чем публикует, отметил спикер.

Государство должно «перестать считать граждан за не очень умных людей» и разговаривать с население, объяснять и давать ему информацию, заключил Ракша.

Исследователь издания «Проект» Юлия Апухтина представила «финансовую сторону коронавируса». Четыре трлн руб. — расходы федерального бюджета на коронавирус, в которые входят доплаты врачам, социальные выплаты, дотации бюджетам на компенсацию выпадающих расходов и закупки системы здравоохранения. Первая особенность этих расходов — мегаконтракты с «Ростехом» и его дочерними компаниями. Вторая — непрозрачность контрактов (целевые субсидии не записываются в Кодах бюджетной классификации) и невозможность подсчитать их точно (наборов данных нет, они разбросаны по сайтам; по Москве часто нет достаточной информации по закупкам). Таким образом, можно только приблизительно оценить, к примеру, то, что закупки, связанные с коронавирусом, составили 300-350 млрд руб., а 35% их сделаны у единственного поставщика. 

Больше всего денег в сравнении с другими выделили таким структурам, как Минпромторг (28,8 млрд руб.), Минобороны (16,2 млрд руб.) и МВД (7,8 млрд руб.). Минздраву досталось 5,7 млрд руб., Роспотребнадзору —  5 млрд руб. Интересно, что Управделами президента получило больше, чем вся ФСИН (2,9 млрд руб. против 2,5 млрд руб.).

«450 тыс. заключённых не получили, наверно, и доли того, что получили пациенты клиник Управделами Президента», — отметила Апухтина. 

Больше всего дотаций из регионов пришлось на Москву (14,27 млрд). Далее идут Дагестан, Кабардино-Балкария, Тыва, где была действительно плохая ситуация. Другие получатели не самые бедные (Краснодарская область, Татарстан). Эксперт считает, что здесь основным инструментом получения денег стал лоббизм.

«Мы видим картину, когда лоббизм стал основным инструментом получения дотаций. Насколько губернаторы и региональные министры здравоохранения смогли убедить центр в необходимости получения средств».

В первую очередь закупки направлялись на медицинское оборудование (64%), средства защиты (11%), строительство и ремонты в больницах (11%), инфраструктуру больниц (8%), антисептику и и дезинфекцию (6%), а также лабораторную диагностику и исследования (1%). Нехватки ИВЛ нет, отметила спикер. Для сравнения, в 2019 году ИВЛ закупили на 9 млрд, в 2020 — на 40. Из них 15 млрд пришлось опять же на «Росстех». Но проблемы больниц остаются и основная заключается в том, что сложно закупать необходимое оборудование, не обозначенное как медицинское (газификаторы, трубы и пр).

Для того чтобы повысить прозрачность госзакупок, регионам и федеральным ведомствам следует рассказать, как они расходовали средства. Было бы интересно посмотреть на подобные отчёты от Минздрава, Минобороны и др., сказала журналист.

Совладелец исследовательской компании Data Insight Борис Овчинников заявил, что человек и общество сейчас познаваемы намного лучше, чем 20 лет назад. В 2020 году «Яндекс» по России выдаёт 350 млн событий как результат поисков. Это позволяет исследовать, что интересует сотни тысяч человек, как бизнесу, так и науке, по самым разным темам: от смога в Москве в 2010 году до политических кампаний.

Google Trends, хоть и используется как инструмент по всему миру, на самом деле для аналитики очень плох, заявил Овчиннников. «Это чёрный ящик, а не открытые данные, его цифры хаотично меняются». Отечественный Wordstat.yandex.ru более удобен и функционален, хотя и тоже не идеален.

Поисковая статистика не угрожает приватности, считает спикер, поскольку даёт обезличенные данные. Зато она хорошо отражаёт всё происходящее на Земле. Во-первых, она собирается по одним и тем же правилам (особенно Wordstat.yandex.ru), что резко повышает удобство сравнения разных периодов. Во-вторых, динамика и география запросов отражают изменение актуальности проблемы, интереса к ней. В-третьих, цифровая эпидемиология — это в принципе анализ поисковой статистики в первую очередь.

Смотреть статистику полезно не только, когда госстатистика врёт.

Статистика запросов позволяет оценить
— географию эпидемии;
— динамику заболеваемости;
— сравнительную частоту волн;
— ожидаемую динамику загрузки больниц в ближайшие дни;
— ожидаемую избыточную смертность.

Классическая наука признала эти данные — поисковая статистика выдержала проверку временем, констатировал эксперт.

Поистине ужасную картину обрисовал проректор Высшей школы организации и управления здравоохранением Николай Прохоренко, рассказав о недостоверных данных в общественном здравоохранении. По его словам, чем больший интерес представляют данные, тем больше с ними происходит фальсификаций. Эксперт заявил, что в России неточные данные по численности населения, смертности, заболеваемости, потребности в объёмах медицинской помощи, обеспеченности кадрами и плохая обратная связь от населения.

В качестве причин недостоверной статистики спикер назвал:
— дефекты нормативной базы;
— дефекты управления;
— закрытость и несистемность статистики и аналитических данных;
— недостаток квалификации;
— избыточно сложную систему финансового обеспечения в системе ОМС со смещёнными приоритетами;
— разрозненность государственной, частной и ведомственной медицины;
— личный интерес в сокрытии или фальсификации данных;
— существование рынка с неформальной оплатой медицинской помощи;
— политизированность.

Общая численность населения неточна, например, из-за разницы между переписью населения и учётом за обозначаемый период. Также есть проблема подсчёта числа людей в регионах с интенсивной трудовой миграцией. Заболеваемость трудно исчислять из-за проблем диагностики, неучтённости повторных диагнозов и пр. Что касается смертности, то 74% врачей подтверждают в опросах те или иные манипуляции с кодировкой смертности, в двух случаев из трёх это происходит под административным давлением.

«Чем больше интерес к какому-то статическому показателю, тем больше этот показатель фальсифицируется».

По потребности в объёмах медпомощи последние исследования проводились ещё в СССР. Заявленные объёмы медорганизаций не обеспечены финансами, они непрозрачны и определены не научными методами. По обеспеченности кадрами нет единых, полных и научно обоснованных нормативов нагрузки. Многие нормативы сформированы 30-40 лет назад и отстают от возможностей современных технологий. Штатные расписания не соответствуют нормативам по медперсоналу. Нагрузка по ставкам искажена требованиями исполнения «майских указов» президента и не соответствует фактической.

Что касается обратной связи от населения, здесь не проводятся исследования жалоб и запросов (например, на лекарства) от пациентов, нет достоверных данных по употреблению алкоголя и курению, занятию спортом и т.д.

Для решения проблем спикер предлагает:
— сформировать единую научно обоснованную систему управленческого мониторинга;
— открыть данные для профессионального сообщества;
— упростить и устранить дублирование отчётности;
— изменить управленческий вектор с наказания на мотивацию;
— упростить порядок оплаты медпомощи.

Однако, по мнению эксперта, наведении порядка требует ресурсов и высокой квалификации. Достоверная информация может ухудшить показатели управленцев, поэтому большинство акторов системы не заинтересованы в научно обоснованных и прозрачных статистике и аналитике.

Другие наши материалы с ОГФ:

  • «Открытость и приватность: дисбаланс между правами граждан и действиями государства в эпоху пандемии коронавируса» здесь.
  • «Ответственные алгоритмы: как открытость способна повлиять на легитимность технологий в обществе?» здесь.
  • «Гражданские инициативы по приватности и открытости в период пандемии коронавируса» здесь.
Контакты

По общим вопросам

[email protected]

По юридическим вопросам

[email protected]

Для СМИ

Телеграм: moi_fee
Signal: moi_fee.13

18+

23 декабря 2022 года Минюст включил Роскомсвободу в реестр незарегистрированных общественных объединений, выполняющих функции иностранного агента. Мы не согласны с этим решением и обжалуем его в суде.