Управление Публичными Данными: Подготовка И Предоставление

Передача данных, особенно на постоянной основе и периодически обновляемых, поднимает перед поставщиками множество технических, технологических, методологических, управленческих и юридических вопросов.

И если юридические аспекты как-то регламентированы, технические определяются имеющимися ресурсами (материально-технической базой), то управленческие (экономические, маркетинговые) и в большей степени методологические аспекты приводят к очень сложным проблемам, которые приходится решать.

решаться самостоятельно и не всегда успешно.



Управление публичными данными: подготовка и предоставление

Данная публикация является продолжением общей серии по теме публичных данных.

Многие понятия, встречающиеся в тексте, обсуждались в предыдущих статьях.

Ссылки на предыдущие статьи

  1. Почему данные могут быть открытыми и бесплатными
  2. Открытая передача данных
  3. Об открытых, общих и делегированных данных
  4. Содержание, метаданные и контекст открытых данных
  5. Показатели качества государственных данных
Имея бесчисленные залежи накопленных цифровых данных, любой владелец рано или поздно начинает осознавать, что он пользуется и не использует бесценный ресурс.

И чем больше размеры хранилищ, тем больше начинают говорить о величии цифрового мира, о бесценных нефтеподобных источниках данных, о феномене больших данных, о сильной зависимости современных систем управления от своевременного информационного обеспечения.

И данные есть.

А чтобы данные не пылились на полках, как тяжёлая ноша, их владельцы инициируют и продвигают внутреннюю аналитику.

Последний, выполняя вполне конкретные коммерческие задачи, может постепенно превратиться из структуры, предназначенной для получения знаний, в отдел, готовящий разнородные и красочные, статичные отчеты и диаграммы или динамические информационные панели.

Тем самым совершенно не помогая менеджерам принимать решения, а обременяя их ненужной информацией сомнительного количества и качества.

Растет потребность в квалифицированном управлении информацией и разработке конкретной стратегии (модели) управленческой аналитики.

А данные накапливаются и лежат там.

Когда на арену выходят общедоступные данные, ситуация серьезно усложняется для поставщиков и получателей.

Планировать, организовывать, координировать и контролировать закрыто внутренний цифровой проще и эффективнее.

Она всегда находится в зоне полного внимания и контроля, а воздействие на нее понятно и не требует особых подходов.

Публичные данные, будучи внешними и плохо контролируемыми, ставят несколько иные вопросы и требуют решения особых проблем.

Поставщик не может полностью контролировать использование публикуемых данных, а получатель не может существенно влиять на данные до того, как они будут раскрыты широкому кругу людей.

Конкуренция поставщиков за получателей и конкуренция получателей за данные — это отдельная история со своими героями и проигравшими.

В целом, включить в цикл управления бизнесом открытые, разделяемые и делегированные данные не так-то просто, как с точки зрения их публикации, так и с точки зрения их реализации.

Подготовка и доставка данных неограниченному или условно ограниченному числу пользователей осуществляется их владельцем или сторонним поставщиком в интересах владельца.

Даже если владелец данных передает такую функциональность на аутсорсинг, в большинстве ситуаций он напрямую заинтересован в результатах.

В противном случае это оказывается какой-то бессмысленной деятельностью по «утечке данных».



Стратегия

Разработка стратегии общедоступных данных для поставщика — лучший способ начать получать значимые и полезные результаты в будущем.

Следует четко понимать, что такая стратегия идеально строится в дополнение к стратегиям управленческого учета, управления знаниями и бизнес-аналитики (моделирования).

Конечно, можно попытаться «впихнуть» в окружающую сетевую реальность какие-то гипотетически полезные наборы данных, не уделяя особого внимания ключевым стратегическим вопросам.

Эффектом от такой деятельности скорее всего воспользуется кто-то другой, и хорошо, если это не прямой конкурент. Стратегически стоит принять решение и спланировать работу по следующим направлениям:

  1. Ставить цели публикация данных и ключевых предметных областей, в рамках которых ведется поиск новых решений и знаний.

    На этом этапе важно привязаться к внутренним вопросам и системе бизнес-аналитики.

  2. Формулировка больших подзадач передача данных по публичной схеме в соответствии с поставленными целями и предметными областями с предварительным прогнозированием (расчетом) ожидаемых результатов.

  3. Формализация критериев отбора данные для публикации, включая содержательные, структурные и форматные аспекты.

    Возможно даже в виде внутренних закрытых или публичных положений (стандартов, правил).

  4. План публикации данных в формате общих принципов или даже на уровне отдельных мероприятий.

    Лучше, если часть этого плана будет доступна потенциальным получателям.

  5. Построение системы управления с обратной связью эффект общедоступных данных, который предназначен посредством мероприятий (мероприятий), сообществ (общения с экспертами) и исследований (сетевого анализа) с целью вернуть поставщику те знания, которые удается получить сторонним пользователям.

  6. Супервайзер по общественным данным – отдельный контрольно-координирующий функционал, целью которого является общая и проблемная оценка процесса публикации данных для целей поставщика.

    Для «супервайзера» необходимо определить ориентиры и дать возможность не только активно наблюдать и вмешиваться в непосредственные процедуры публикации данных, но также в процессы и объекты внутри организации-поставщика, которые принимают или могут принять обратный эффект новые решения и знания (продукты) и услуги).

  7. HR-поддержка общедоступные данные как за счет выделения функционала в отдельные позиции, так и за счет разумного дополнения функционала существующих позиций.

    Как всегда, актуальным остается вопрос повышения компетентности отдельных работников в сфере публичных данных.

  8. Поддержка публикации инструментов из-за сложности процедур подготовки, проверки, публикации и мониторинга наборов цифровых данных.

    Поиск или разработка и последующее внедрение на практику сложных программных, управленческих и технологических инструментов является неотъемлемой частью эффективной работы в данном направлении информатизации бизнеса.

  9. Техническая поддержка публикация данных в части оценки и дополнительного выделения машинных ресурсов (складских помещений, вычислительных мощностей, специалистов).

  10. Юридическая поддержка публикация данных как на уровне формального описания набора данных, так и на уровне составления и оформления генерального договора (перечня условий) публичной передачи данных.

  11. Маркетинговая поддержка публикация данных для привлечения пользователей к свободно распространяемым цифровым наборам данных.

Как и во многих других вопросах, связанных с менеджментом, формулирование и оптимизация стратегии — это непрерывный итеративный процесс с обратной связью и полезными контрольными показателями.

В связи с рассматриваемой темой наиболее неверным способом оценки результатов стратегии управления публичными данными провайдера является подсчет количества и размера данных, размещенных в Интернете.

Основная задача грамотной вендорской стратегии управления публичными данными заключается вовсе не в выполнении плана раскрытия данных, а в получении того самого « волшебный «Результат, который сделают другие, но на его данных и для его выгоды.



Выбор

Какие данные следует публиковать? Если бизнес или другой экономический субъект хочет участвовать в глобальном процессе передачи общедоступных данных и имеет аналогичный вопрос независимо от других важных вопросов, то публиковать какие-либо данные, вероятно, не стоит. Интернет ежесекундно насыщен разнообразной информацией и дополнительные наборы цифровых данных ему совершенно не навредят, но и не принесут ощутимой пользы.

А саму проблему выбора наборов данных для публикации следует начинать решать с постановки целей раскрытия публичных данных в рамках упомянутой выше стратегии.

При этом такая цель должна быть действительно осмысленной и логичной.

Выбор наборов данных для публикации напрямую вытекает из необходимости поставщика насильно, разнообразно и открыто исследовать определенную для него проблемную область.

Почти как режим «мозгового штурма», но без фиксированного круга лиц и в условиях турбулентности глобальной информационной сети.

Понятно, что целевые наборы данных должны соответствовать теме и быть достаточно качественными: актуальными, актуальными, целостными, объективными, измеримыми.

Выбор структуры и формата публикации данных должен рассчитываться исходя из целевой аудитории.

Разумеется, допускается постепенное расширение наборов данных как по смыслу, так и по структуре, а также по схеме данных.

Однако важно осознавать, что подобные изменения не вызывают особого доверия к вендору и во многих случаях вынуждают менять алгоритмы загрузки и обработки, а иногда даже выбирать другие инструменты.



Наборы

Данные публикуются наборами.

Это удобная концепция для определенной части цифровых данных, отдельной по смыслу, структуре или формату.

Фактически под набором можно понимать либо отдельную таблицу в файле, либо вывод строк данных по запросу к программному интерфейсу.

С другой стороны, в понятии набора данных нет ограничений по размеру — его можно понимать даже как реляционную базу данных в целом.

Каждый комплект должен сопровождаться метаданными и паспортом (уведомлением).

В данном случае «паспорт» представляет собой своего рода условный удостоверяющий набор характеристик, включающий основные метаданные, отдельные специальные метаданные в сжатом виде и ссылку на контекст. Паспорт включает в себя, помимо прочего, оценку качества данных, установленных поставщиком в той или иной форме.

В настоящее время не разработано единых, общепринятых, удобных стандартов полноценного формирования и описания общедоступных цифровых наборов данных.

Скорее всего, аналогичные стандарты или правила потребуется ввести для каждого типа или даже субъекта общедоступных данных.

Однако существует ряд правил и рекомендаций.

Если организация стремится получить максимальный эффект от раскрытия данных в долгосрочной перспективе, то ей необходимо решить концептуально и технически сложный вопрос правильного формирования наборов данных.



Публикация

В рамках публичной передачи данных, когда нежелательно создавать и поддерживать долговременный отдельный защищенный канал связи с каждым из получателей, прямая доставка данных (их публикация) возможна одним из двух способов:
  • статически по ссылке – готовый набор данных предварительно генерируется и доступен для скачивания его копии получателем по фиксированному адресу в сети;
  • динамически по требованию – набор данных создается (дополняется) специальным программным сервисом на основе хранимых данных ресурса по заданным получателем параметрам и доступен для непосредственного получения в качестве ответа на запрос.

Каждый метод имеет свои преимущества и недостатки.

Более того, они появляются на любом уровне цифровых общедоступных данных.

При выборе преференциального метода конкретному поставщику, исходя из собственных ресурсов и выбранной стратегии, приходится решать такие вопросы, как:

  • необходимость и функциональность API,
  • местонахождение данных – собственный сетевой ресурс или сторонний,
  • связи с внешним контекстом,
  • формат загружаемых файлов и их максимальные размеры,
  • фиксация актуальности в рамках непрерывных или дискретных обновлений,
  • участие в каталогах (на порталах) справочных или актуальных и т.п.

При публикации важно действовать логично и сосредоточиться на поддержании высокого качества данных.

Поэтому в приоритете системный подход, а не случайная выгрузка «цифровых» массивов.

Систематическая публикация данных основана на хорошо продуманном и реализуемом плане.

Профессиональное планирование передачи публичных данных и последующая реализация плана позволяют не только избежать многих операционных ошибок, но и сформировать у получателей данных положительное впечатление об ответственности и заинтересованности издателя.

Пользователь не любит сложные данные.

А что касается общедоступных данных, то сложность обычно заключается не в глубине вложенных и подчиненных наборов и не в количестве единиц данных (полей таблицы).

Основная сложность – это неполные или неверные метаданные, описывающие основные данные, которые могут быть изменены в любой неуказанный момент. Получатель (эксперт, аналитик) вынужден тратить время на мониторинг и анализ данных и приведение их в подходящее состояние, т.е.

он вынужден восстанавливать недостающие или исправлять неверные характеристики, сопровождающие и без того большие объемы цифровых данных.

Семантическая, структурная и форматная сложность устраняется только метаданными.

Но метаданные сами по себе также являются данными, а это означает те же правила и показатели качества .

И как ни странно, метаданные явно или неявно сопровождаются соответствующими метаданными следующего уровня.

На последнем этапе, когда подготовленные наборы данных готовы к распространению, не следует пренебрегать характеристикой юридические и управленческие особенности в зависимости от их типа: открытый, общий или делегированный .

Лучшим вариантом будет «производственное» редактирование и корректура готовых наборов данных, естественно с использованием соответствующих инструментов.

Интересным комплексным показателем эффективности усилий по публикации данных является измерение количества времени, необходимого для публикации одного набора данных.

.

начиная с момента постановки задачи извлечения данных из общего хранилища и заканчивая проверкой и подтверждением возможности получения набора с сетевого ресурса, где он опубликован.

Абсолютное значение показателя дает общее представление о трудозатратах, а его изменение во времени позволяет оценить, есть ли улучшения в управлении поставщиком публикацией данных, по крайней мере, на этапе их бесплатного распространения в сети.

Этот показатель комплексно отражает:

  • общий уровень управления данными;
  • уровень доступных информационных технологий;
  • уровень финансово-экономического и организационного управления;
  • уровень безопасности и услуг по управлению рисками.

В чем проблема с публикацией данных? Проблем быть не должно:
  • если они у вас есть в хорошем рабочем формате и виде,
  • если у вас есть средства связи с цифровым обществом,
  • можете ли вы оценить их на открытость и возможность публикации и оценить риски их публикации,
  • если вы можете физически загрузить их на сервер (сеть) в том или ином виде,
  • если можно одновременно выкладывать метаданные и указывать контекстные связи
  • и, наконец, если вы понимаете, зачем все это нужно.

Этот показатель – не единственный способ оценки.

Конкретные и контролируемые показатели успеха разрабатываются на этапе стратегического проектирования и позволяют отслеживать эффективность совершенно бессмысленной деятельности — публикации данных.



Обратная связь

В своей простейшей форме Обратная связь по общедоступным данным для провайдера – это отзывы получателей (пользователей) о качестве данных, их применимости и полученных результатах.

В более сложном случае – обратная связь – это запрос, исследование и внедрение этих сторонних новых решений и знаний в существующие процессы и бизнес-объекты (организации).

Поддержание обратной связи с получателями является отдельным важным компонентом общей значимой модели управления публичными данными.

Организовать обратную связь на уровне, достаточном для получения значимого результата, сложнее, дороже и важнее, чем размещение общедоступных наборов данных на сетевых ресурсах.

При отсутствии устойчивых связей между провайдером и неограниченным количеством получателей общедоступных данных фактически необходимо реализовать множество различных механизмов взаимовыгодного общения.

Может быть:

  • подписка получателей (пользователей) на серию уведомлений от поставщика,
  • открытый пул получателей данных (определенный клуб или сообщество по интересам),
  • реальные или виртуальные соревнования на основе общедоступных данных (хакатоны),
  • оффлайн или онлайн тематические мероприятия (семинары, конференции),
  • опрос получателей данных (простые или целенаправленные опросы),
  • обучающие мероприятия (лекции, аттестационные испытания) и т.д.
Но целью всех подобных механизмов обратной связи будет желание получить в той или иной форме результаты, полученные теми субъектами, которые скачивали общедоступные данные, обрабатывали и анализировали их, находили что-то новое и полезное или создавали новые продукты и услуги.

Прямые методы обратная связь предполагает контакт между поставщиком общедоступных данных и получателями.

Косвенные методы обратная связь сводится к исследованию информационного пространства сети и поиску новых решений и знаний, полученных из данных поставщика или с использованием данных поставщика, но по тем или иным причинам выпавших из поля зрения.

Существует некоторый риск упустить из виду полезный эффект, который кто-то получит от данных поставщика.

Но это не проблема.

Поставщик всегда может вернуть потерянную стоимость, особенно если он сам является владельцем данных.

Однако узнать, что с заданным набором общедоступных данных вообще можно сделать что-то ценное, значит получить обратную связь от тех, кто уже что-то сделал или хотя бы попробовал.

Теги: #открытые данные #открытые данные #открытые данные #публичные данные #публичные данные #публичные данные #открытые данные #управление данными #Исследования и прогнозы в ИТ

Вместе с данным постом часто просматривают: