Сбор Плохих Данных - 2. 1,5 Года Спустя О Том, Как Не Публиковать Открытые Данные

Не секрет, что российские власти в последнее время декларируют высокую степень открытости, публикуют данные и некоторые из них даже полезны, но так было не всегда и не везде.

Полтора года назад я приводил массу примеров неверной интерпретации открытых данных.

В примечании «Сбор неверных данных» Есть несколько примеров, когда разделы на веб-сайтах или PDF-документы выдавались за машиночитаемые открытые данные.

Несмотря на то, что мониторинг открытости государственных данных в России – дело неблагодарное, а методические рекомендации того же Минэкономразвития – это победа формы над содержанием, но даже в этой ситуации можно лишь сетовать на то, что госорганы облегчили жизнь при публикации данных, а не усложнили.

Необходимо ли проводить полноценный опрос властей на предмет качества открытости данных – вопрос открытый.

Рано или поздно это придется сделать, хотя это и займет много времени.

Но самые выдающиеся примеры можно найти и сейчас.

Ну и рейтинги конечно фуфло, антирейтинги рулят. Худших нужно знать в лицо.



Рособоронзаказ

Связь: xn--80aabycqsgabatek.xn--p1ai/Открытие_данни 4 комплекта данных и их паспорта.

Открываем паспорт: xn--80aabycqsgabatek.xn--p1ai/Открытие_данни/Паспорт_набора_откритих_данних_подведомс Написано в XML, внутри Excel-файл с паспортом.

Содержимое файла Excel на скриншоте.

Внутри ничего нет, никаких ссылок.

Контактная почта на mail.ru, никаких структур данных, ссылки не на сайт ведомства, а на сайт их разработчиков типа «roz.sitesoft.ru».



Сбор плохих данных - 2. 1,5 года спустя о том, как не публиковать открытые данные



Ространснадзор

Связь: www.rostransnadzor.ru/rostrans/pressa. Сразу показательно, что открытые данные публикует на сайте пресс-служба.

Много интересного о Ротранснадзоре мы можем узнать в разделе открытых данных, но сами данные почему-то представлены в виде разделов на сайте, файлов MS Word и Excel. Мало того, что нет перечня публикуемых данных, так вообще все размещенное совершенно не соответствует ни форме, ни духу, ни цели раскрытия машиночитаемой информации.



ФСИН России

Связь: www.fsin.su/opendata В перечне ФСИН 7 наборов данных:
  • 7706562710.1.1 Перечень территориальных органов ФСИН России
  • 7706562710.2.1 Перечень подведомственных организаций
  • 7706562710.3.1 План проведения плановых и внеплановых проверок
  • 7706562710.4.1 Сведения о результатах плановых и внеплановых проверок
  • 7706562710.5.1 Статистическая информация
  • 7706562710.6.1 Сведения о вакантных должностях государственной гражданской службы в ФСИН России
  • 7706562710.7.1 Реестры лицензий на отдельные виды деятельности


Сбор плохих данных - 2. 1,5 года спустя о том, как не публиковать открытые данные

Из них жив только один, первый.

Остальное - пустые знаки, в которых просто ничего нет - www.fsin.su/opendata/7706562710.2.1

Федеральное дорожное агентство

Связь: rosavtodor.ru/opendata Несмотря на то, что они публикуют 19 наборов данных и среди наборов есть даже интересные, даже первый взгляд позволяет оценить качество раскрытия.

В наборе rosavtodor.ru/opendata/7717509757-svoddor данные представлены в XML набором полей Столбец1, Столбец2 и т.д. В схеме (структуре) данных, естественно, ни одно поле не помечено, что оно означает. В общем, формальности соблюдены, и смысла больше нет.

Сбор плохих данных - 2. 1,5 года спустя о том, как не публиковать открытые данные



Сбор плохих данных - 2. 1,5 года спустя о том, как не публиковать открытые данные



Государственная курьерская служба

Связь: www.gfs.ru/opendata У сервиса мало данных, он практически не работает с людьми и мало кому нужен.

Но даже в этом случае, рассматривая набор данных задания обнаруживаем, что он не обновлялся уже год и, судя по содержанию, вакансий в ГФС нет. Хотя на самом сайте есть 3 вакансии - www.gfs.ru/kadrovaya-sluzhba/vakansii/vakansii-federalnoj-gosudarstvennoj-grazhdanskoj-sluzhby

Министерство спорта Российской Федерации

Связь: www.minsport.gov.ru. На сайте Минспорта есть связь с главной страницы.

По ссылке, как и ожидалось, отображается сообщение «403. Запрещено.

» Типа есть данные, даже открытые, но не для нас.

— Несколько особо заметных ведомств остались за бортом, публикуя файлы MS Word под видом XML-файлов, муляжи в виде CSV-файлов и прочее.

О них отдельно и с увлечением в следующий раз.

Почему происходит такая ситуация? Есть много причин.

В этом виноваты Минэкономразвития, Совет открытых данных, а главное, вся система государственного управления, имеющая возможность не просто «имитировать оргазм», а имитировать деятельность в принципе.

Если вы знаете другие выдающиеся случаи такого подражания, предлагаю поделиться ими со всеми.

Вопрос ко всем: можно ли автоматизировать проверку и выявление наиболее одиозных случаев? Автоматическая проверка схем CSV, XSD? Идентифицировать те XML-файлы, которые на самом деле являются файлами DOC и так далее? Может быть, есть уже готовые инструменты с открытым исходным кодом? И второй вопрос/опрос: В опросе могут участвовать только зарегистрированные пользователи.

Войти , Пожалуйста.

Как бороться с чиновниками, «имитирующими публикацию данных»? 45,53% Лишение свободы за подлог (уголовное наказание) 234 65,18% Штраф за халатность (административное наказание) 335 47,67% Научите, как делать правильно.

Включите государственных служащих в программы обучения.

245 3.89% Они невиновны, данные все равно никому не нужны Проголосовали 20 514 пользователей.

69 пользователей воздержались.

Теги: #Открытые данные #плохие данные #opendata #плохие данные #Интеллектуальный анализ данных #Открытые данные

Вместе с данным постом часто просматривают: