Частотный Словарь Запрещенных Сайтов



Частотный словарь запрещенных сайтов

Исследование проводилось с целью создания корпуса слов с сайтов, заблокированных государственными органами РФ.

Список ссылок в реестре на момент исследования был получен из открытых источников.

Всего в списке 24515 ссылок.

Для каждого URL-адреса мы сделали запрос на получение данных из страны, в которой нет юридических ограничений на подобные действия.

Ответы серверов распределились следующим образом:

Частотный словарь запрещенных сайтов

Большинство сайтов вполне неплохо функционируют и не собираются переоценивать собственные взгляды на жизнь.

Многие люди используют фаерволы, отсекая потенциально опасных (по их мнению) посетителей.

Значительное количество пользователей просто перенаправляются на новый белый домен.

Несколько слов о «пуленепробиваемости».

Давайте посмотрим на распределение по tld (только 200 OK):

Частотный словарь запрещенных сайтов

Не менее интересно распределение по странам, в которых физически расположены заблокированные ресурсы:

Частотный словарь запрещенных сайтов



Частотный словарь запрещенных сайтов

Интерактивная визуализация словаря Статья не направлена на пропаганду чего-либо, а лишь отражает существующую реальность.

Полученный материал может быть кому-то полезен для проведения собственных исследований.

Теги: #Роскомнадзор #запрещенные сайты #корпус слов #статоператор #Семантика #Интеллектуальный анализ данных #Открытые данные #Визуализация данных

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.