Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration - Т. В. Какатунова (2019г.)

Книга “Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration” автора Т.В. Какатунова предлагает новый подход к анализу коротких сообщений и документов, поступающих на интернет-порталы органов государственной власти и электронные письма. Эта модель позволяет классифицировать короткие неструктурированные текстовые документы при недостаточной статистической информации, а также слабой степени пересечения тем. Входными данными для создания модели являются рубрики и обучающие выборки, а результатом является нечеткая весовая оценка значимых слов в тезаурусах рубрик. Это позволяет корректно представить характеристики документа и обеспечить работу алгоритма рубрикации.

В представленной работе предлагается подход к автоматизированному анализу коротких текстовых данных в системе обеспечения передачи сообщений органами власти. Сущность рассматриваемого подхода заключается в формировании классификации вновь возникающих документов на основании множества заданных рубрик на микроуровне. Другими словами, с использованием заданного множества тематических субрубрик последовательность сообщений классифицируется в соответствии с идентификаторами, присвоенными каждой из них. Ключевым аспектом в данном контексте является возможность достижения наибольшей степени точности при отсутствии статистических данных и плохой степени обратной связи между иерархическими уровнями рубрикатора.

В монографии предложен новый метод анализа коротких, неструктурированных текстов, который позволяет повысить эффективность работы различных органов государственной власти с помощью использования современных информационных технологий.

Электронная Книга «Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration» написана автором Т. В. Какатунова в 2019 году.

Минимальный возраст читателя: 0

Язык: Английский

Серии: Прикладная информатика. Научные статьи


Описание книги от Т. В. Какатунова

В статье предложен новый подход к автоматическому анализу коротких сообщений, поступающих на Интернет-порталы и электронную почту органов государственной власти. Разработанная модель позволяет выполнять классификацию коротких неструктурированных текстовых документов при недостатке статистической информации и слабой степени пересечения тематических рубрик. Входными данными для алгоритма построения модели является множество рубрик и обучающая выборка, а его результатом являются нечеткие весовые коэффициенты значимых слов тезаурусов рубрик, что обеспечивает корректное представление характеристик документа и работу алгоритма рубрицирования (классификации).



Похожие книги

Информация о книге

  • Рейтинг Книги:
  • Автор: Т. В. Какатунова
  • Категория: Информатика и вычислительная техника
  • Тип: Электронная Книга
  • Дата выхода: 2019г.
  • Язык: Английский
  • Из Серий: Прикладная информатика. Научные статьи
  • Издатель: Синергия