Современный бизнес не может обойтись без постоянного притока свежей информации.
Но получения информации недостаточно; его необходимо обработать и проанализировать.
Причем сделать это необходимо как можно быстрее.
Как вода, информация не должна застаиваться.
Он должен постоянно перетекать от источников к периферии и локальным дата-центрам, а затем в облако, а иногда и обратно.
Источник: https://www.pexels.com/ru-ru/photo/1181316/
Что изменилось в потоках данных?
Предприятия регулярно передают данные между разными точками хранения, но их объемы растут гораздо быстрее, чем емкость сети, а привычный способ перемещения информации по сетевым каналам становится все менее эффективным.Об этом, в частности, говорит недавно вышедший отчет Mass Data on the Go от Seagate. В качестве иллюстрации колоссальных объемов корпоративных данных приводится пример систем активной помощи водителю (ADAS).
На начальном этапе разработки ADAS их возможности ограничивались предотвращением блокировки тормозов и регулировкой тяги для противодействия пробуксовке.
Эти системы уже способны самостоятельно парковаться и предотвращать столкновения с помощью радара, но переход к полностью автономным транспортным средствам потребует многих лет и бесчисленных петабайт данных.
Чем выше уровень автономии, к которому стремятся дизайнеры, тем больше информации им требуется.
Для полной автономности может потребоваться до 20 ТБ в час на транспортное средство, используемое для записи данных ИИ.
А общий объем обучающего набора данных, полученного от группы таких автомобилей, составит не менее 20 ПБ в час.
Вся эта информация обрабатывается в гипермасштабных дата-центрах, но как передать в них необходимую информацию? Чтобы отправить всего 1,5 ПБ данных, сгенерированных 10–20 исследовательскими машинами, по гигабитному соединению корпоративного класса, потребуется более 150 дней.
За это время информация полностью потеряет свою актуальность и станет практически бесполезной.
Но это лишь один, наиболее яркий пример проблемы.
Кроме того, с аналогичными проблемами сталкиваются приложения для мультимедиа и развлечений, обработки данных систем видеонаблюдения, здравоохранения и умного производства.
Эксперты Cisco считают, что основной движущей силой текущего роста объёма данных являются системы межмашинной связи (M2M), а IDC прогнозирует резкое увеличение глобального объёма создаваемых данных: если в 2020 году он составлял 64 ЗБ, то в 2025 году он достигнет 180 ЗБ.
Главным «виновником» этого, по мнению аналитиков, станет Интернет вещей, особенно камеры и автоматизированные M2M-взаимодействия с участием цифровых счетчиков коммунальных услуг, систем управления медицинским оборудованием и т. д.
Почему нельзя обойтись без периферии
Десять лет назад предприятия оказались перед простым выбором: хранить данные в публичном или частном облаке.Но сегодня этот выбор значительно расширился, и для оптимизации доступа к данным, их размещения, распространения и использования организации все чаще прибегают к мультиоблачным и гибридным моделям.
Аналитики IDC Storage Systems & Infrastructure Trends Survey обнаружили, что 47% предприятий в настоящее время используют централизованную архитектуру облачного хранилища, но через два года их доля снизится до 22%.
Напротив, доля гибридной архитектуры хранения данных из централизованных и периферийных систем пока не так велика — 25%, но за те же два года эта цифра вырастет до 47%.
Как видно из отчета IDC, непрерывный рост корпоративных данных приводит к постепенному смещению акцента в сторону облачного ядра и периферии, и если в 2015 году там хранилось всего 30% данных, то в 2020 году их доля увеличилась до 50. %, а в 2025 году, по прогнозу, достигнет уже 70%.
Ограниченных возможностей сетевых каналов уже недостаточно для быстрой передачи растущих объемов данных.
Но помимо ограничений производительности сети и задержки, существует несколько других препятствий для доступа к данным и их передачи — отсутствие оптоволоконных каналов и общая стоимость таких услуг.
При этом, как показывают опросы, именно последний фактор оказывает наибольшее влияние на выбор решения по транспортировке или миграции корпоративных данных.
Ну а выбор в пользу физических средств миграции данных в 78% случаев объясняется недостаточными характеристиками сети для передачи необходимых объемов информации.
Данные в большей степени создаются на периферии, а периферийные системы все чаще становятся важной частью передачи данных и ключевым элементом стратегии хранения.
Они могут работать на границе любой сети и по существу разделены на три уровня.
Микрограница расположена ближе всего к внешнему краю и конечным точкам сети.
На этом уровне собирается наибольшее количество данных, а задержка не превышает 5 мс.
Микропериферийные устройства сбора данных обычно представляют собой внешние накопители, подключенные к периферийным серверам или по беспроводной сети.
Городская периферия уже работает на уровне города.
Время отклика у такой системы заметно выше — 5-10 мс, а емкость ее памяти значительно выше.
Периферийным объектом сети может быть небольшой центр обработки данных в здании штаб-квартиры компании или несколько стоек в коммерческом колокейшн-центре.
Его близость к источникам данных и большая емкость делают его хорошим выбором для систем управления транзакционными базами данных, систем потокового мультимедиа и других приложений.
Наконец, третий уровень периферии — макропериферия.
Это масштабные объекты со временем отклика 10–20 мс, обслуживающие до десяти арендаторов и расположенные на расстоянии 10–150 км от конечных точек.
Как правило, это колокейшн-центры или полноценные дата-центры с резервными магистральными каналами, которые находятся всего на ступень ниже ядра сети.
Рост периферии обусловлен теми же движущими силами, которые стимулируют рост данных.
Прежде всего, это развитие технологий искусственного интеллекта, набирает популярность Интернет вещей и сети 5G. Кроме того, значительную роль в этом играет конвергенция ИТ и операционных технологий в производстве, а необходимость дополнения облачных мощностей периферийными привела к появлению периферийных дата-центров.
«Центр тяжести» данных теперь меняется
Быстрое развитие систем периферийных вычислений приводит к изменению способов хранения данных, которые все чаще распределяются по различным облачным и периферийным ресурсам.Данные в экосистеме «от конечной точки к ядру» перемещаются по большему количеству маршрутов, чем раньше, а это означает, что их можно размещать рядом с приложениями, чтобы обеспечить максимальную производительность приложений.
По мере накопления данных они приобретают собственную гравитационную силу, воздействующую на приложения, сервисы и новые данные.
Причём, чем больше объём (или так называемая масса) данных, тем больше сила притяжения.
На определенном этапе данные могут достичь критической массы, превратившись в своеобразную «черную дыру», засасывающую приложения, сервисы и данные.
Чтобы избежать этого, IDC рекомендует размещать данные вместе с соответствующими приложениями, независимо от их местонахождения.
Одним из наиболее эффективных средств преодоления этого гравитационного колодца может стать служебный автомобиль или защищенный грузовик спецслужб, перевозящий петабайты данных.
Они позволяют переносить большие объемы данных гораздо быстрее, чем через глобальную сеть.
Однако здесь нужно понимать необходимость принятия строгих мер безопасности.
Перевозимая информация должна быть зашифрована на всех этапах транспортировки, а организации должны учитывать нормативные требования и законы о суверенитете данных.
Теги: #Хранение данных #Хранение данных #Большие данные #seagate
-
10 Тенденций Занятости В 2016 Году
19 Oct, 24 -
С++ Перечисление <-> Строка? Свет
19 Oct, 24 -
Механизм Кармы Расшифрован
19 Oct, 24 -
Модуль Кэширования Приложений Asp.net
19 Oct, 24