О Хабрахабре, Статистике И... Облаках Тегов

Привет! Примерно месяц назад я написал статья , в котором он представил уважаемому хабрапаблику несколько графиков.

Графики как могли отразили историю развития этого сайта и попытались оценить качество контента на нем.

Даже не знаю, удалось ли им добиться своей цели, но в целом статья была принята достаточно тепло.

Уже тогда я пообещал себе, что при возможности постараюсь продолжить тему.



О Хабрахабре, статистике и.
</p><p>
.
</p><p>
.
</p><p>
 облаках тегов

И снова о тематическом контенте В прошлый раз я пытался отразить тематическое наполнение Хабрахабра с помощью графиков и круговых диаграмм, которые основывались на количестве статей, принадлежащих к определенной категории.

блоги .

И, если честно, я считаю, что у меня это получилось очень плохо.

Я подумал, что должен быть какой-то способ отразить тематическое содержание сайта с течением времени.

К сожалению, гугление не дало никаких результатов — ничего лучше старых добрых графиков человечество пока не придумало.

Но ждать! Ведь мы живем в эпоху Web 2.0 и одним из ее главных символов является… обычное облако тегов.

Вы все это видели много раз, оно банально до невозможности и уже достаточно приелось своим присутствием на каждом втором сайте, да еще и в различных 3D флеш-формах.

Но, справедливости ради, облако тегов приобрело свою популярность именно потому, что оно очень хорошо отражает тематическое наполнение сайта.

Что, если вы попытаетесь нарисовать облако тегов и заставить его динамически меняться с течением времени? Это как машина времени.

Дальше оставалось мало что сделать: подумать, как это все будет выглядеть, сделать динамичнее, выделить вечер на реализацию замысла в WPF и еще вечер на рендеринг и кодирование в видео.

То, что я придумал, я назвал «Tag Tornado» или «Twister of Tags».

Собственно виновника торжества можно увидеть на следующем видео: *Рекомендую смотреть видео на YouTube в «большом» плеере и разрешении 480р.

**У меня никогда не было возможности выбрать музыку для видео, выбор оставляю за зрителем.

Расслабьтесь, расслабьтесь и наслаждайтесь Как это работает? Да, работает это очень просто — заголовки блогов вращаются вокруг общего центра по кругу с постоянной угловой скоростью.

Для каждого последовательного момента (в данном случае с шагом в два часа) рассчитывается «вес» каждого блога.

Вес блога зависит от общего рейтинга статей в нем за период около двух недель, причем рейтинг каждой статьи умножается на коэффициент расстояния между моментом ее публикации и моментом, который мы рассматриваем.

В общем, чем ближе статья к данному моменту, тем больше ее оценка влияет на ее вес.

После расчета весов всех блогов на данный момент они нормализуются и укладываются в интервал [0;1] путем деления на максимальный балл.

Те блоги, максимальный вес которых никогда не превышал 0,1, полностью отбрасываются.

Вес влияет на три параметра — чем он больше, тем меньше расстояние тега от центра, больше размер шрифта и меньше прозрачность текста.

Теги сортируются лексикографически.

Ко всему этому добавлено несколько дополнительных коэффициентов, обеспечивающих общую плавность вылетов и приходов меток на «сцену».

Вместо заключения Внимательный и занудный читатель заметит, что видео не теги, а блоги Хабрахабра, но у меня уже заготовлен ответ: дело в том, что тегов слишком много и они слишком разные, поэтому без таблиц синонимов и смысловых связей между теги, такая визуализация будет не очень полезна — потеряется слишком много важной информации.

Визуализировать категории, как в предыдущей статье, нет смысла, потому что их слишком мало.

Также теги иногда перекрывают друг друга, но если смотреть в динамике, а не отдельные кадры, то читабельности это почти не мешает. И да, что касается названия визуализации, сначала я хотел назвать ее «водоворотом», но в результате пришел к выводу, что лучше подойдет «атмосферная» аналогия с облаком тегов.

Спасибо за внимание.

Теги: #Статистика в ИТ #статистика #Хабрахабр #визуализация #облака тегов #торнадо тегов #облако тегов #торнадо тегов

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.