Здравствуйте, дорогие хабровчане! Это корпоративный блог МТС.
Здесь наши специалисты, отвечающие за связь и технологии, напишут обо всем самом интересном.
Начнем с директора департамента эксплуатации конвергентных сетей и сервисов МТС Андрея Серегина.
Итак, слово Андрею Вячеславовичу.
Добрый день! Наконец-то дошли руки до текста для Хабра.
Хочу поделиться своим опытом с профессиональной и заинтересованной публикой.
4 года назад мы в МТС первыми в стране открыли Единый центр оперативного управления мобильной сетью, который находится в Краснодаре.
В ноябре прошлого года мы официально открыли Единый центр управления фиксированной сетью в Нижнем Новгороде.
Таким образом, мы завершили централизацию мониторинга и управления всеми сетями – мобильными и фиксированными.
И это первый в России опыт централизации такого масштаба среди операторов связи.
Несколько слов о себе.
Я окончил факультет микроприборов и технической кибернетики Московского института электронной техники.
Моя специальность — радиотехнические устройства, и я с удовольствием работаю в этой сфере 27 лет, из них 21 год в МТС, где я был сотрудником аварийно-ремонтной бригады, оператором центра управления, а со временем стал оперативным менеджером.
На работе мне приходилось «лазить» в трансиверы и компьютеры с паяльником, программировать на разных языках, карабкаться на 70-метровые вышки связи и управлять большим коллективом, пройдя пару программ MBA. Но я всегда был и горжусь тем, что являюсь инженером связи, и в любой момент рад погрузиться в любые технические детали работы нашей сети.
В первом вступительном посте я расскажу, как с помощью наших уникальных центров мы контролируем работу сетей и оперативно устраняем нештатные ситуации.
Как мы следим за сетью Как вы уже понимаете, задачей единого центра управления сетью является контроль работы сети, управление устранением аварийных ситуаций на сети и плановыми работами.
Имея два центра, наш отдел теперь полностью отвечает как за мобильную, так и за фиксированную сеть.
Хотя понятия «фиксированные» и «мобильные» сети стали условными (мы называем нашу единую сеть конвергентной и предоставляем абонентам конвергентные услуги).
Например, нам необходимо подключить крупного корпоративного клиента к широкополосному доступу.
И у него в офисе есть базовая станция 4G. В этом случае мы часто предоставляем доступ к сети через базовую станцию.
То есть в офисе стоит обычный модем, принимающий сигнал от станции 4G. Далее идет внутренняя широкополосная сеть.
Поэтому мы с одной стороны обеспечиваем фиксированный доступ, с другой – через мобильную сеть.
И наоборот, бывает, что мы включаем новую базовую станцию на объекте, к которому когда-то строили оптическую линию, чтобы предоставлять услуги фиксированного доступа по этой оптической линии.
Вот почему теперь мы рассматриваем два наших центра как один, используя географическое разделение для повышения живучести.
Для нас важно, чтобы управление мобильной и фиксированной сетью было в одних руках, а не в разных структурах и на разных уровнях, как это было раньше.
Как мы решаем проблемы с сетью В Центре оперативного управления у нас установлена зонтичная система мониторинга.
На монитор оперативного дежурного со всей страны поступают сообщения о сбоях в работе сетевого оборудования или об изменении условий его работы.
Оперативный дежурный после прочтения сообщения должен устранить проблему самостоятельно в течение 15 минут, используя удаленный доступ к оборудованию, либо поручить инцидент инженерам на месте для устранения.
Ход разрешения порученного инцидента строго контролируется.
По статистике, наиболее распространенной причиной неполадок на базовых станциях является отключение внешнего электропитания.
При отключении внешнего электропитания станция автоматически переходит на работу от аккумуляторов, которые рассчитаны на несколько часов работы.
В этом случае, как правило, внешнее электропитание восстанавливается достаточно быстро.
То есть чрезвычайная ситуация разрешается сама собой и не требует реагирования.
Поэтому не всегда оправдано спешить с ответом на подобные сообщения.
Стоит подождать и оценить способность базовой станции «противостоять» отсутствию внешнего электропитания и не вытащить дежурного инженера из теплой постели, а отправить его с генератором на базовую станцию.
Более того, наш опыт показал, что можно доверить эту работу роботу, и он точно решит, нужно ли привлекать человека.
Зачастую дежурному приходится быстро анализировать сразу несколько экстренных сообщений и группировать их в одно.
Например, у нас есть три базовые станции, построенные в определенном месте.
Между собой они связаны радиорелейными линиями (две тарелки, как спутниковые, смотрят друг на друга и соединяют базовые станции).
Если одно «реле» выходит из строя, то вся цепочка базовых станций за ним, если нет резерва, не работает, и дежурный оператор получает сообщения о выходе из строя нескольких базовых станций.
Глупо затевать инциденты на всех станциях, когда нужно отремонтировать отдельный «пролет».
Такие экстренные сообщения могут автоматически «сворачиваться» в одно сообщение, но там, где это невозможно настроить программно, это должен сделать дежурный.
Это все называется корреляцией тревог.
90% аварий решаются удаленно, из центра управления, поскольку почти вся наша инфраструктура построена на компьютерах.
Но если нужно что-то починить вручную, поменять физическую плату, починить антенну, то высылается выездная бригада.
Я также отвечаю за организацию их работы.
В каждом регионе должны быть свои две-три команды, чтобы у нас была возможность добраться до объекта в короткие сроки.
Дальность действия бригады достигает 400 км.
Много ли экстренных сообщений в день? Ежедневно на монитор оперативного дежурного поступают тысячи экстренных сообщений.
За 12-часовую смену фиксируется около 800-900 происшествий.
4 года назад сообщения поступали оператору каждые пять секунд, за смену фиксировалось 1200 инцидентов.
Сейчас мы автоматизировали многие вещи, улучшили анализ сообщений и частично автоматизировали процесс создания «инцидентов».
Это позволяет нам контролировать гораздо больший объем оборудования.
Влияют ли чрезвычайные ситуации на клиентов? Нарушение обслуживания клиентов в случае возникновения «инцидента» трудно оценить напрямую.
И вот почему.
Представьте себе, в Москве базовые станции почти каждые 200 метров.
А если включить телефон в режим мониторинга, то можно увидеть, что в одном конкретном месте он ловит сигнал сразу с нескольких базовых станций.
Если одна базовая станция выключится, вы все равно сможете безопасно звонить, отправлять SMS и пользоваться Интернетом.
Но для нас это пока инцидент. И мы оперативно решаем эту проблему.
Ведь чисто теоретически один из клиентов мог находиться в офисе с какими-то экранированными окнами, где его «добивает» только одна конкретная близлежащая станция (поскольку сигнал при проникновении в этот «железный ящик» может ослабнуть в тысячу раз) .
Но если посмотреть общий трафик фрагмента сети при выключении одной базовой станции, он не изменится.
Он будет перераспределен между другими станциями.
Говорить о нарушении работы с клиентами в такой ситуации, как минимум, некорректно.
Я не знаю ни одной компании в мире, которая смогла бы строго подсчитать, насколько она пострадала и пострадал ли вообще сервис в такой ситуации.
Это то, чем я занимаюсь профессионально в общих чертах.
О чем бы вы хотели, чтобы я рассказал в следующих постах? Теги: #МТС #3G #4G #LTE #wi-fi #мобильная сеть #мобильная сеть #связь #базовая станция #трафик #передача данных #нагрузка #мощность #передатчик #информационная безопасность #Тестирование IT-систем #Разработка систем связи
-
Лебедев Сергей Васильевич.
19 Oct, 24 -
Миф О Нихромовых Вредителях
19 Oct, 24 -
Университет Для Айтишника: Взгляд Изнутри
19 Oct, 24 -
Bee.fm Учится Угадывать Настроение
19 Oct, 24