Технология хранения и обработки больших данных Hadoop - Тимур Машнин (2021г.)

Распределенный анализ больших объемов данных с помощью Hadoop. В основе этой технологии лежит обработка данных на мощных кластерных системах. Наличие большого количества оборудования приводит к необходимости хранения информации на специальном сервере. Кроме того, для работы этой технологии требуется специальное программное обеспечение, которое является разработкой компании Apache.

В этой книге подробно рассмотрены основные концепции работы с Hadoop, их назначение и особенности функционирования. Рассмотрены все этапы распараллеливания процесса обработки данных: создание объектов MapReduce и HDFS (Hadoop Distributed File System) — файловая система хранения данных в Hadoop. На основе полученного опыта можно сделать вывод, что технология обработки больших объемов информации помогает получить много полезной аналитической информации.

Книга Тимура Машнина "Технология хранения и обработки огромных объемов данных Hadoop" посвящена изучению основных понятий и технологий в области обработки хранилища огромных массивов информации - Hadoop. Все это одно целое с применением языков программирования Java и Mapreduce. Основной акцент делается на структуру составляющих, алгоритмы работы компонентов, а также использование распределенных вычислений запросов к базам данных на больших магазинах. Полезна специалистам по обработке информации, аналитику, студентам информационных технологий. Рекомендуется подготовить какое-то начальное понятие языка программирования для студентов, изучающих технологии Hadoop на первых курсах, а так же для инженеров и разработчиков бизнес-решений для больших объемов информации).

Если описательное предложение вам не знакомо, следуйте этим шаблонам:

Книга "Hadoop: Русский язык для начинающего". Тимур Машин: "Hadoop – это не набор приложений для кластеров, поддерживающих распределенную технологию, которая включает HDFS, MapReduce и YARN. Благодаря своей простой архитектуре, вам больше не понадобится быть первоклассным программистом, чтобы решить задачи обработки огромных объемов данных на вашем кластере."

Если книга или статья предназначена для специалистов, описание может выглядеть так: "В книге рассматриваются технологии извлечения знаний из больших объемов структурированных и неструктурированных данных за счет интеграции и последующей совместной обработки данных из нескольких хранилищ данных- в том числе Hadoop .".

Электронная Книга «Технология хранения и обработки больших данных Hadoop» написана автором Тимур Машнин в 2021 году.

Минимальный возраст читателя: 12

Язык: Русский

ISBN: 978-5-532-96881-3


Описание книги от Тимур Машнин

Apache Hadoop – это платформа для распределенной обработки больших наборов данных на кластерах компьютеров с использованием простых моделей программирования. В этой книге вы познакомитесь с общей архитектурой платформы, компонентами стека, такими как HDFS и MapReduce, приложениями Hadoop.



Похожие книги

Информация о книге

  • Рейтинг Книги:
  • Автор: Тимур Машнин
  • Категория: Интернет
  • Тип: Электронная Книга
  • Дата выхода: 2021г.
  • Возрастная категория: 12+
  • Язык: Русский
  • Издатель: Автор
  • ISBN: 978-5-532-96881-3