Книга "Обработка неструктурированных текстов. Поиск, организация и манипулирование" описывает различные инструменты и методы, которые используются для обработки неструктурированных текстов. В ходе чтения книги вы научитесь осуществлять поиск по полнотекстовым документам, распознавать имена собственные, классифицировать тексты по темам, извлекать информацию и создавать авторефераты. Книга содержит много примеров, которые помогут вам понять основы этой темы и применить полученные знания на практике. Книга предназначена для широкой аудитории и не требует специальной подготовки в области математической статистики и обработки естественных языков. Примеры кода в книге написаны на языке Java, но идеи и методы, которые описываются в книге, могут быть реализованы на любом языке программирования.
В книге описан инструментарий и алгоритмы для работы с большими объемами текстов на естественном языке.
Электронная Книга «Обработка неструктурированных текстов. Поиск, организация и манипулирование» написана автором Грант С. Ингерсолл в 2013 году.
Минимальный возраст читателя: 0
Язык: Русский
ISBN: 978-5-97060-144-0
Описание книги от Грант С. Ингерсолл
В книге описаны инструменты и методы обработки неструктурированных текстов. Прочитав ее, вы научитесь пользоваться полнотекстовым поиском, распознавать имена собственные, производить кластеризацию, пометку, извлечение информации и автореферирование. Знакомство с фундаментальными принципами сопровождается изучением реальных применений. Издание предназначено для читателей без подготовки в области математической статистики и обработки естественных языков. Примеры написаны на Java, но сами идеи могут быть реализованы на любом языке программирования.