Building Dependable Distributed Systems

Эта книга охватывает наиболее важные методы проектирования и построения надежных распределенных систем. Вместо того, чтобы охватывать широкий спектр научных работ по каждой стратегии обеспечения надежности, книга фокусируется только на некоторых из них (обычно наиболее фундаментальных работах, наиболее практичных подходах или первых публикациях каждого подхода), которые включены и подробно объяснены, как правило, с полным набором примеров. Цель состоит в том, чтобы тщательно разобрать каждый метод, чтобы читатели, которые не знакомы с надежными распределенными вычислениями, действительно могли понять метод после изучения книги.

Книга содержит восемь глав. Первая глава вводит базовые понятия и терминологию надежных распределенных вычислений, а также дает обзор основных средств достижения надежности. Вторая глава подробно описывает механизмы контрольных точек и ведения журнала, которые являются наиболее широко используемыми средствами для достижения ограниченной степени отказоустойчивости. Такие механизмы также служат основой для более сложных решений в области надежности.

Глава три охватывает работы по вычислениям, ориентированным на восстановление, которые сосредоточены на практических методах, сокращающих время обнаружения и восстановления отказов для приложений в Интернете. Глава четыре очерчивает методы репликации для отказоустойчивости данных и сервисов. Эта глава также уделяет особое внимание оптимистичной репликации и теореме CAP.

Глава пять объясняет несколько основополагающих работ по системам групповой связи. Глава шесть знакомит с проблемой распределенного консенсуса и подробно освещает ряд алгоритмов семейства Paxos. Глава семь представляет проблему византийских генералов и ее новейшие решения, включая основополагающий алгоритм Практическая Византийская Отказоустойчивость (PBFT) и ряд его производных. Заключительная глава охватывает последние результаты исследований в области отказоустойчивости к византийским отказам с учетом приложений, которые являются важным шагом вперед на пути практического использования методов византийской отказоустойчивости.

Эта книга охватывает наиболее важные методы проектирования и создания надежных распределенных систем. Вместо того, чтобы охватывать широкий спектр исследовательских работ по каждой стратегии надежности, книга фокусируется только на нескольких избранных (обычно наиболее фундаментальных работах, наиболее практических подходах или первой публикации каждого подхода), которые подробно объясняются, обычно с использованием обширного набора примеров. Цель состоит в том, чтобы тщательно разобрать каждый метод, чтобы читатели, которые не знакомы с надежными распределенными вычислениями, могли действительно понять этот метод после изучения книги. Книга содержит восемь глав. В первой главе представлены основные концепции и терминология надежного распределенного вычисления, а также дается обзор основных способов достижения надежности. Вторая глава подробно описывает механизмы контрольных точек и регистрации, которые являются наиболее часто используемыми средствами достижения ограниченной степени отказоустойчивости. Такие механизмы также служат основой для более сложных решений в области надежности. Третья глава охватывает работы, связанные с восстановлением ориентированных на восстановление систем.

Электронная Книга «Building Dependable Distributed Systems» написана автором Wenbing Zhao в году.

Минимальный возраст читателя: 0

Язык: Английский

ISBN: 9781118912706

Описание книги от Wenbing Zhao

This book covers the most essential techniques for designing and building dependable distributed systems. Instead of covering a broad range of research works for each dependability strategy, the book focuses only a selected few (usually the most seminal works, the most practical approaches, or the first publication of each approach) are included and explained in depth, usually with a comprehensive set of examples. The goal is to dissect each technique thoroughly so that readers who are not familiar with dependable distributed computing can actually grasp the technique after studying the book. The book contains eight chapters. The first chapter introduces the basic concepts and terminologies of dependable distributed computing, and also provide an overview of the primary means for achieving dependability. The second chapter describes in detail the checkpointing and logging mechanisms, which are the most commonly used means to achieve limited degree of fault tolerance. Such mechanisms also serve as the foundation for more sophisticated dependability solutions. Chapter three covers the works on recovery-oriented computing, which focus on the practical techniques that reduce the fault detection and recovery times for Internet-based applications. Chapter four outlines the replication techniques for data and service fault tolerance. This chapter also pays particular attention to optimistic replication and the CAP theorem. Chapter five explains a few seminal works on group communication systems. Chapter six introduces the distributed consensus problem and covers a number of Paxos family algorithms in depth. Chapter seven introduces the Byzantine generals problem and its latest solutions, including the seminal Practical Byzantine Fault Tolerance (PBFT) algorithm and a number of its derivatives. The final chapter covers the latest research results on application-aware Byzantine fault tolerance, which is an important step forward towards practical use of Byzantine fault tolerance techniques.