Текстовая информация в виде цифровых документов быстро накапливается, создавая огромные объемы данных. Большинство этих документов неструктурированные: это свободный текст, который не организован в традиционные базы данных. Поэтому обработка документов - это рутинная задача, в основном из-за отсутствия стандартов. Таким образом, реализация задач автоматического анализа текста стала крайне сложной. Автоматическое реферирование текста (АРТ), сжимая текст и сохраняя релевантную информацию, может помочь обработать эту все возрастающую, труднообрабатываемую массу информации. Эта книга рассматривает мотивации и различные алгоритмы для АРТ. Автор представляет последние достижения в этой области, прежде чем описать основные проблемы АРТ, а также трудности и решения, предоставленные сообществом. Книга дает последние достижения в АРТ, а также текущие приложения и тенденции. Подходы статистические, лингвистические и символьные. Также включено несколько примеров, чтобы прояснить теоретические концепции.
#зарубежная компьютерная литература
#интернет