Формирование структуры интеллектуальной системы анализа и рубрицирования неструктурированной текстовой информации в различных ситуациях - М. И. Дли (2018г.)

Книга посвящена важной проблеме анализа и классификации неструктурированных текстовых документов на естественном языке. Отмечается, что такие тексты могут сильно различаться по размеру, наличию структуры, частоте ключевых слов и другим параметрам. Это делает невозможным создание универсальной модели для их анализа и рубрицирования.

Для решения данной проблемы авторами предлагается мультимодельный подход, сочетающий интеллектуальные и статистические методы обработки текста. Конкретная модель выбирается на основе нечеткой логики с учетом характеристик анализируемого документа. Применение такого комбинированного подхода позволяет повысить точность классификации текстовых документов в соответствии с их особенностями и практическими задачами анализа. Разработанная интеллектуальная система обещает стать эффективным инструментом для автоматизированной обработки и рубрицирования неструктурированных текстов.

Электронная Книга «Формирование структуры интеллектуальной системы анализа и рубрицирования неструктурированной текстовой информации в различных ситуациях» написана автором М. И. Дли в 2018 году.

Минимальный возраст читателя: 0

Язык: Русский

Серии: Прикладная информатика. Научные статьи


Описание книги от М. И. Дли

Анализ электронных текстовых документов, написанных на естественном языке, является одной из важнейших задач, реализуемых в системах автоматизированного анализа лингвистической информации. Известно, что такие документы могут характеризоваться различными параметрами: размер, наличие структуры, частота упоминания ключевых слов и т. п. Проведенный анализ показал невозможность построения единой модели для рубрицирования неструктурированных текстовых документов в различных ситуациях. Для решения указанной проблемы предложен мультимодельный подход к рубрицированию, отличающийся комбинированным использованием интеллектуальных и вероятностно-статистических методов анализа текстовых документов. Конкретная модель выбирается с использованием нечетко-логических алгоритмов на основе предложенных характеристик. Его применение позволит повысить точность отнесения электронных текстовых документов к конкретным рубрикам с учетом их специфики и различных целей практического применения в организации.



Похожие книги

Информация о книге