Книга "Инструменты автоматизированного сбора социологической информации" автора А.М. Соколова рассматривает алгоритмы автоматизированного исследования территориальной идентичности в крупных городах благодаря анализу информации из социальных сетей.
В статье описывается, как использовать сообщества в социальной сети "Вконтакте" и интернет-ресурсы для анализа тематической активности пользователей. Эффективным источником информации считаются открытые и закрытые группы, в которых публикуются записи о районных проблемах и мероприятиях.
Разработанный авторами алгоритм позволяет выявлять релевантные для исследования группы путем морфологического анализа текстовых данных, извлекать их содержимое и определять активность пользователей при обсуждении местных вопросов. Взаимодействие с сервером соцсети осуществляется с помощью API, определяющего список записей соответствующей тематики.
Для идентификации сообществ используется морфологический анализ, позволяющий получить данные о их наименовании по идентификационному номеру. Также в статье предлагаются оригинальные функции построения списка урбанонимов заданного района.
На языке Python реализована программная реализация алгоритма, предназначенная для анализа трех районов в г. Москве. Результаты проведенной проверки показали сравнительную погрешность программы в сравнении с полученными данными вручную.
Электронная Книга «Инструменты автоматизированного сбора и анализа социологической информации о территориальной идентичности жителей крупных городов» написана автором А. М. Соколов в 2021 году.
Минимальный возраст читателя: 0
Язык: Русский
Серии: Прикладная информатика. Научные статьи
Описание книги от А. М. Соколов
В статье предлагается алгоритм автоматизированного поиска и первичного анализа социологической информации для исследования территориальной идентичности жителей районов крупных городов в интернет-источниках. В качестве основного источника информации рассматриваются сообщества в социальных сетях (на примере социальной сети «Вконтакте»), в качестве вспомогательных – интернет-порталы о топографических объектах, находящихся на исследуемых территориях. Показано, что с точки зрения информационного обеспечения наибольшим потенциалом обладают публичные страницы и группы с открытой и ограниченной «стеной». Разработанный алгоритм предполагает выделение релевантных для решаемой задачи групп, выявление содержащихся в них записей по районной тематике и определение показателей активности участников сообщества при обсуждении территориальных проблем. Извлечение требуемой информации осуществляется посредством взаимодействия с сервером социальной сети с использованием официального программного интерфейса приложения (API). Для идентификации сообществ и записей предлагается использовать методы морфологического анализа текстовой информации. Описана программная реализация указанного алгоритма на языке Python 3.8.5, которая включает оригинальные функции для получения данных о сообществах по их идентификационным номерам, для формирования набора урбанонимов для заданного района и др. С использованием разработанной программы проведен анализ территориальных групп трех районов г. Москвы. Определена погрешность результатов работы программы относительно результатов, полученных вручную.