Какие типы данных существуют? Прежде чем перейти непосредственно к системам управления мастер-данными, давайте определим, какие данные бывают. Ниже приведены 5 типов ключей: 1. Метаданные; 2. Справочные данные; 3. Основные данные; 4. Транзакционные данные; 5. Исторические данные.
Метаданные это данные о данных.
Они нужны, чтобы понять и определить, какими данными оперирует предприятие.
Метаданные определяют структуры, типы данных, доступ к ним и т. д. Существуют различные схемы описания метаданных.
Например, схема XSD может использоваться для описания структуры XML-документа, а схема WSDL — для описания веб-службы.
Справочные данные - Это сравнительно редко меняющиеся данные, определяющие значения конкретных сущностей, используемых при выполнении операций на всем предприятии.
К таким сущностям чаще всего относятся: валюты, страны, единицы измерения, виды договоров/счетов и т.д. Основные данные - Это основные данные, определяющие хозяйствующие субъекты, с которыми имеет дело предприятие.
К таким хозяйственным субъектам обычно относятся (в зависимости от предметной отраслевой направленности предприятия) заказчики, поставщики, продукция, услуги, договоры, счета, пациенты, граждане и т.п.
Помимо информации непосредственно о том или ином главном субъекте, к основным данным относятся отношения между этими сущностями и иерархиями.
Например, с точки зрения выявления дополнительных возможностей продаж может быть очень важно выявить явные и неявные отношения между людьми.
Основные данные распространяются по всему предприятию и участвуют во всех бизнес-процессах.
Обычно мастер-данные воспринимаются как ключевой нематериальный актив предприятия, поскольку от их качества и полноты зависит эффективность его работы.
В России вместо термина «основные данные» часто используется термин «нормативно-справочная информация».
Транзакционные данные – это данные, которые образовались в результате выполнения предприятием каких-либо хозяйственных операций.
Например, для коммерческого предприятия: продажи товаров и услуг, закупки, поступления/списания денежных средств, поступления на склад и т.д. Обычно такие данные базируются в системе планирования ресурсов предприятия (ERP) или других отраслевых системах.
Естественно, транзакционные системы широко используют основные данные при выполнении транзакций.
Исторические данные это данные, которые включают в себя исторические транзакционные и основные данные.
Чаще всего такие данные накапливаются в системах ODS и DWH и используются для решения различных аналитических задач и поддержки управленческих решений.
Системы управления мастер-данными
Прежде чем перейти к системе управления основными данными, давайте определим, что такое управление основными данными в целом.Управление основными данными (MDM) — это дисциплина, которая работает с основными данными с целью создания «золотой записи», то есть целостного и всестороннего представления основной сущности и связей, стандарта основных данных, который используется на всем предприятии.
а иногда и между предприятиями для облегчения обмена информацией.
Специализированные системы управления основными данными (MDM-системы) автоматизируют все аспекты этого процесса и являются «авторитетным» источником основных данных масштаба предприятия.
Часто системы MDM также управляют справочными данными.
Ситуация, когда система MDM является единственным источником основных данных, все изменения вносятся в систему MDM и только потом передаются в системы-потребители, называется «системой записей».
Это идеальная ситуация для управления основными данными.
Однако в реальной жизни все не так просто: MDM-система не всегда будет «системой записей».
В связи с особенностями бизнес-процессов конкретного предприятия, техническими сложностями конкретных систем и т. д. возникает необходимость создания «копий» основных записей.
Система, содержащая копию основных данных, называется «справочной системой».
Чтобы не потерять контроль, «система связи» должна быть под контролем и синхронизирована с «системой записи».
Три измерения систем MDM
Давайте рассмотрим систему MDM в трех измерениях: Обычно MDM-системы не внедряются «в спешке», поскольку их внедрение представляет собой сложный процесс последовательных преобразований в масштабе всего предприятия: от ведения разрозненных данных до создания целостного, комплексного представления о главном объекте.Поэтому внедрение MDM-систем осуществляется последовательно с постепенным приближением к целевому результату по трем заданным измерениям.
Давайте подробнее рассмотрим эти измерения.
Домены
В контексте управления основными данными домен относится к определенной области основных данных.Наиболее распространенными доменами основных данных являются домен клиента и домен продукта.
В западной литературе появились устоявшиеся термины для управления основными данными в этих областях: интеграция данных клиента (CDI) для области клиента и управление информацией о продукте (PIM) для области продукта.
CDI традиционно включает в себя не только клиентов, но и организации или частных лиц, которые могут называться по-разному в зависимости от отрасли предприятия: клиенты, поставщики, банки, фонды, пациенты, граждане и т. д. ПИМ традиционно включает в себя: продукцию, товары, материалы, услуги, работы и т.д. В подходах CDI и PIM к управлению основными данными есть много общего, но есть и много различий.
Например, при дедупликации клиентских сущностей в большинстве случаев выполняется простой парсинг атрибутов сущностей и их сравнение на основе вероятностных алгоритмов, тогда как в предметной области осуществляется семантический/онтологический анализ атрибутов с включением механизмов самообучения.
.
Кроме того, в предметной области сущности могут иметь очень разные атрибуты в зависимости от выбранной категории (например, у ноутбуков свой набор атрибутов, а у стиральных машин — свой).
Все эти функции разных доменов должны поддерживаться системами MDM. В последнее время наметилась тенденция создания многодоменных MDM-систем с возможностью гибкой настройки структуры метаданных.
Такая гибкость дает предприятию возможность описывать мастер-данные конкретно для себя, учитывая все особенности и нюансы, но в то же время требуется много времени и знаний, чтобы грамотно спроектировать и настроить такую систему.
На рынке также существуют системы с «жесткой» структурой главных сущностей, которые уже имеют правильно настроенные механизмы, но использование такой системы возможно только теми предприятиями, которые смогут к ней адаптироваться.
Обычно такие системы хорошо подходят для решения задачи управления мастер-данными в рамках конкретной отрасли.
На мой взгляд, наиболее перспективными являются системы с гибкой моделью метаданных, но при этом имеющие заранее настроенные для предприятий разных отраслей модели, которые можно быстро переконфигурировать.
Способы использования
Методы использования MDM (Метод использования) определяют, для чего будет использоваться система MDM на предприятии.Другими словами, кто будет потребителем основных данных (их, естественно, может быть несколько).
Существует три основных метода использования: 1. Аналитический 2. Операционный 3. Совместная работа Метод аналитического использования поддерживает бизнес-процессы и приложения, которые используют основные данные в первую очередь для анализа эффективности бизнеса, предоставления необходимых отчетов и выполнения аналитических функций.
Это часто происходит при взаимодействии MDM с инструментами и продуктами BI. Обычно аналитическая MDM-система работает с данными в режиме только для чтения; он не меняет данные в исходных системах, а очищает и обогащает их.
Метод оперативного использования позволяет собирать, изменять и использовать основные данные во время выполнения бизнес-транзакций (операций) и служит для поддержания семантической согласованности основных данных в рамках этих операций во всех операционных приложениях.
Фактически в этом случае MDM функционирует как OLTP-система, обрабатывающая запросы от других работающих приложений или пользователей.
Работа в этом режиме часто требует построения единой интеграционной среды с использованием принципов сервис-ориентированной архитектуры (SOA) и инструментов корпоративной сервисной шины (ESB).
Идеально, если такие инструменты будут либо включены непосредственно в MDM-систему, либо будут ее продолжением (есть вендоры, у которых в линейке есть как MDM, так и ESB-решения, глубоко интегрированные друг с другом).
Коллективный метод использования позволяет создавать мастер-сущности в тех случаях, когда в процессе создания требуется коллективное взаимодействие между разными группами пользователей.
Такая сверка обычно имеет сложные «разветвленные» бизнес-процессы, состоящие из различных автоматизированных и ручных задач.
Задачи, выполняемые вручную, выполняются различными специалистами по данным (распорядителями данных) в порядке, определяемом бизнес-процессом.
Чаще всего метод коллективного использования применяется в предметной области.
Например, при создании нового продукта, когда за ввод разных данных отвечают несколько человек, приходится много ручной работы и окончательного утверждения.
Важно, что MDM-система позволяет настраивать произвольные бизнес-процессы для быстрой поддержки бизнес-процессов конкретного предприятия.
Стили реализации
Обычно существует три основных стиля реализации: 1. Реестр; 2. Сосуществование; 3. Транзакционный.Стиль реализации реестра предполагает создание источника основных данных в качестве «системы связей» с источниками данных нижнего уровня.
MDM реестра содержит только ключевые атрибуты, необходимые для идентификации и сопоставления объектов.
Registry MDM работает в режиме только для чтения, при этом данные вводятся в исходные системы и передаются в MDM для разрешения объектов.
Также в реестре MDM могут храниться ссылки на источники неключевых данных, но сами данные в MDM обычно не передаются.
Стиль реализации реестра обычно используется при выборе оперативного метода использования MDM (см.
выше).
Сосуществующий стиль реализации предполагает распределенный ввод данных из нескольких источников (бизнес-приложений и системы MDM).
Система MDM в этом случае может быть «системой учета» только для части атрибутов.
Однако в MDM-системе формируется полноценная мастер-сущность, изменения которой передаются в другие системы (возможно, не все).
Сосуществующий стиль реализации достаточно прост и часто используется как первый шаг к следующему – транзакционному стилю, т.к.
не требует глубокой переделки систем, взаимодействующих с MDM-системой.
Транзакционный стиль реализации предполагает создание полноценной «системы записей», в которой хранятся все данные о главных сущностях.
Система MDM в данном случае является «единым источником истины» для всех потребительских систем.
Все операции по созданию и обработке данных выполняются на уровне системы MDM. Ввод данных на уровне потребительской системы запрещен.
Такой подход обычно довольно сложен в реализации, т.к.
требует существенных изменений в бизнес-процессах и абонентских системах.
Заключение
На практике выбор той или иной стратегии внедрения MDM определяется многими факторами: целями предприятия в области управления мастер-данными, степенью зрелости предприятия, степенью готовности ИТ-инфраструктуры, доступностью инвестиций на реализацию проекта и многие другие параметры.Для принятия решения о стратегии реализации необходимо провести тщательный анализ всех этих факторов и составить детальное технико-экономическое обоснование проекта и подробный график с указанием этапов разработки проекта.
Но это еще одна обширная тема, требующая отдельного рассмотрения.
Одно можно сказать наверняка: к внедрению системы МДМ нужно подходить очень внимательно и прогрессивно.
Большинство проектов по внедрению систем MDM терпят неудачу именно потому, что недооценивают сложность и объем изменений, с которыми приходится сталкиваться проектам MDM. Максим Власов Теги: #мдм #основные данные #основные данные #нормативно-справочная информация #ИТ-терминология
-
Ностальгия По Фидонету
19 Oct, 24 -
Построение Куба - Продолжение
19 Oct, 24 -
Оффлайн Яндекс Фото. 23 Августа.
19 Oct, 24