Еще немного о том, как MarkLogic Server хранит данные.
О форматах данных MarkLogic Server представляет собой базу данных XML, но помимо XML он может хранить JSON, текстовые и двоичные данные.
В этом случае документы JSON преобразуются в XML при попадании в базу данных.
Текстовые документы индексируются как текстовые объекты XML без «родительского» объекта.
Двоичные документы по умолчанию не индексируются, но можно создать индекс их метаданных и извлеченного содержимого.
Об индексах Индексы используются в MarkLogic для повышения производительности базы данных.
Доступен «из коробки» Текстовый указатель И Индекс структуры , которые индексируют все данные XML и используются при выполнении запросов XQuery, что обеспечивает высокую эффективность.
Также доступны индексы метаданных: Индексы коллекций , Индексы каталогов , Индексы безопасности , Индексы свойств .
Стоит отметить, что индексы в MarkLogic Server могут превышать размер самих XML-данных в 2, а то и в 3 раза.
Но такая ситуация возможна только при большом количестве задействованных индексов.
На это также влияет тот факт, что MarkLogic сжимает данные XML во время хранения.
Изначально MarkLogic обычно имеет небольшие размеры индексов по сравнению с исходными данными.
О внутреннем представительстве Давайте подробнее рассмотрим, как данные хранятся в MarkLogic Server. Основными понятиями здесь являются: База данных — это высшая абстракция внутреннего представления данных в MarkLogic Server. Он обеспечивает доступ к данным как к единому объекту, независимо от механизмов масштабирования и внутреннего представления.
Объект База данных объединяет настройки безопасности, схемы XML-документов, набор триггеров, настройки кэша в памяти, индексы, параметры, управляющие поиском, параметры ведения журнала, параметры репликации, параметры резервного копирования и набор объектов леса.
Лес – это объекты, в которых хранятся данные и индексы.
В базе данных может быть несколько объектов леса, и они могут располагаться на одном или разных серверах.
Механизм «переключение при отказе локального диска» манипулирует объектами Forest, для этого одному объекту Forest назначается один или несколько «копия леса» объектов, что повышает надежность.
Лес имеет значительно меньше настроек по сравнению с объектами базы данных.
Для Forest вы можете настроить расположение данных в файловой системе.
«каталог данных» , укажите место для хранения крупных объектов «каталог больших данных» или расположение так называемого «каталог быстрых данных» , то есть каталоги в быстрой файловой системе.
«каталог быстрых данных» используется для хранения журнала транзакций и фрагментов данных.
Этот каталог должен находиться на устройстве хранения, отличном от того, на котором он находится.
«каталог данных» .
При заполнении «каталог быстрых данных» крупные объекты из него сливаются с данными, расположенными в «каталог данных» .
Внутри Forest данные хранятся в объектах стенда.
Стоять – Это неотъемлемая часть лесных объектов.
Каждый стенд представляет собой упакованный двоичный файл, хранящийся в подкаталогах объекта Forest. Сам объект Стенд состоит из XML-фрагментов.
Теги: #Интеллектуальный анализ данных #NoSQL #xml #bigdata #Интеллектуальный анализ данных #NoSQL #Большие данные
-
Секс И Гендер
19 Oct, 24 -
Что Может Понадобиться Гику На Отдыхе?
19 Oct, 24 -
Летняя Стажировка В Mars Is: Взгляд Изнутри
19 Oct, 24 -
Звук На Java
19 Oct, 24