Я изложу свое видение, по каким причинам были созданы новые технологии хранения и обработки данных, известные как NoSQL и MPP. Статья будет особенно полезна начинающим пионерам разработки баз данных.
В статье не рассматриваются специализированные базы данных векторных, графических и других нестандартных форматов.
Во-первых, SQL и СУБД.
1.1. Необходимо знать язык SQL и основные принципы работы СУБД, такие как транзакции, внешние ключи, таблицы.
Допустим, вы Java-разработчик, и вам также необходимы некоторые знания SQL и особенности СУБД.
Естественно, вы ленитесь, пытаетесь как-то вывернуться.
И кроме того, принцип ООП сильно отличается от модели данных в СУБД.
1.2. Если у вас большой проект, то вам нужен профессиональный разработчик баз данных, а это дополнительный балласт, если в будущем проектов не будет. Java-программисты просто хотят выполнять всю бизнес-логику на Java, минуя SQL и РСУБД.
Во-вторых, цена 2.1. Невозможность использовать стандартные серверы для обработки больших данных.
Если у вас 600 Терабайт, то из СУБД вам подойдет только Exadata или Teradata. 2.2. Отказоустойчивость.
Без технологии без разделения ресурсов и отсутствия единой точки отказа вы вынуждены покупать дорогие серверы с двойным резервированием всего.
RAID-контроллеры, блоки питания, купите источник бесперебойного питания, дорогие запоминающие устройства и так далее.
2.3. Стоимость лицензий.
СУБД с расширенными возможностями, которые могут хранить сотни терабайт, стоят недешево, особенно решения для устройств.
В-третьих, > =1 Пбайт данных 3.1. Если у вас объем данных более 1 Петабайта, то из СУБД вам подойдет только Teradata за $20 млн.
Тогда как построение кластера для Hadoop с тройным резервированием на 1 петабайт данных сейчас стоит $367 000 (только серверы с дисками).
На таких серверах и 4 диска в RAID 0 www.ulmart.ru/goods/613438 www.ulmart.ru/goods/690535 Вы фактически разоритесь на электричестве.
Для такого детища вам понадобится мини электростанция.
Собственно, поэтому и началось это движение NoSQL, Hadoop, MPP. Для устранения вышеперечисленных особенностей, неудобств и недостатков.
Заключение: СУБД по-прежнему остаются универсальными базами данных, способными решить любую задачу.
Так что советую еще раз подумать, критичен ли для вас один из вышеперечисленных пунктов.
Если нет, то смело берите обычную СУБД! Вердикт: 1. Если у вас мало денег, у вас сложная разработка или нужно неблокирующее чтение и вам нравятся комфортные условия развития.
Купить Эксадата 2. Если у вас мало денег, разработка не очень сложная, вас не пугает отсутствие хороших инструментов, а вы не любите создавать агрегаты, а любите перебор полного сканирования, тогда покупайте Teradata 3. Если у вас есть деньги, но вы умеете их считать, вам нужна стабильная, универсальная и простая в освоении база данных и у вас меньше 10 Терабайт данных, и вас не пугают сложности администрирования, то возьми обычный Oracle 4. Если у вас нет денег, но не более 1 ТБ данных, но вам еще нужна хорошая платформа для разработки базы данных со сложной логикой, то берите PostgreSQL 5. Если у вас нет навыков работы с SQL и РСУБД, значит, данные слабо связаны или у вас есть хороший ETL, который фиксирует все.
Несложные запросы без объединения нескольких таблиц.
Вся логика не находится в базе данных.
Тогда вам вполне подойдет база данных NoSQL, хотя, как я уже говорил, СУРБД универсальны, с ними можно все, если вы умеете ими пользоваться.
Теги: #teradata #oracle #NoSQL #rdbms #oracle #NoSQL
-
Литий
19 Oct, 24 -
«Отзывы — Это Лайки Для Бизнеса»
19 Oct, 24 -
Химия Атмосферы
19 Oct, 24 -
Лучшие Игровые Мыши 2021 Года
19 Oct, 24 -
Добавление Новой Функции На Хабрехабре
19 Oct, 24 -
Шпионаж За Пользователем Через In-App На Ios
19 Oct, 24