Как сообщается в опубликованном Описание большой таблицы ( PDF ), распределенная система предназначена для хранения и управления огромным количеством структурированных данных.
Основным требованием к распределенной базе данных является ее масштабируемость.
Система содержит сотни терабайт информации на тысячах взаимозаменяемых серверов Google. Распределенная база данных Bigtable используется множеством собственных сервисов, включая Google Analytics, Google Finance, Orkut, Personalized Search, Writely, Google Earth и, конечно же, основную систему веб-индексации.
Каждое из этих приложений имеет свои собственные требования к базе данных.
Объемы хранимой информации также существенно различаются.
Например, спутниковые фотографии Google Earth занимают примерно столько же места, сколько поисковый индекс всего Интернета.
Описание Bigtable описывает объем информации, хранящейся в распределенной базе данных, и уровень сжатия.
Вся информация по состоянию на август 2006 года.
База данных поиска веб-документов состоит из двух частей: 800 и 50 терабайт со степенью сжатия 11% и 33% соответственно.
База данных Google Analytics также хранится в двух таблицах по 200 ТБ (14%) и 20 ТБ (29%).
Google Планета Земля занимает 70,5 ТБ, из них 70 ТБ исходных изображений и 500 ГБ индекса.
Персональный поиск занимает очень мало места по сравнению с самыми ресурсоемкими приложениями: всего 4 ТБ (степень сжатия 47%).
Каждому пользователю в системе присваивается уникальный идентификатор, и все его действия на поисковом сайте заносятся в базу данных.
Система Google Base использует 2 ТБ, а социальная сеть Orkut — всего 9 ТБ места в базе данных.
Если подсчитать, сколько реального дискового пространства занимают все сервисы Google с учетом сжатия, вы получите около 220 ТБ .
К сожалению, в опубликованном документе нет ни одного упоминания о почтовой системе Gmail, однако миллионы почтовых ящиков емкостью в несколько гигабайт каждый требуют немалых ресурсов.
Однако, даже принимая во внимание учетные записи Gmail, некоторые могут назвать все дисковые массивы Google довольно маленькими.
Например, нефтяные компании или другие корпорации, занимающиеся географическими информационными системами, могут хранить на своих серверах даже большие объемы данных, чем Google. Их количество может составлять не сотни терабайт, а петабайты.
В этом смысле лозунг Google об «организации всей мировой информации» выглядит немного нелепо.
Теги: #Bigtable #Google #база данных #серверы #дисковый массив #дисковый массив #хранилище #Чулан
-
От 3D-Модели К Концепт-Кару
19 Oct, 24 -
Мнение Эксперта: Будущее Металлических Очков
19 Oct, 24 -
#Ускорение4X. Принцип № 0/2. Скрам-Мастер
19 Oct, 24 -
Учет Времени
19 Oct, 24 -
Интеграция Ии С Человеческим Мозгом
19 Oct, 24