Книга "Textual Information Access. Statistical Models" представляет собой сборник статистических моделей, разработанных в последнее время в нескольких научных сообществах для доступа к информации, содержащейся в текстовых коллекциях. Рассматриваемые проблемы связаны с приложениями, направленными на облегчение доступа к информации: извлечение и поиск информации, классификация и кластеризация текстов, определение мнений, помощь в понимании (автоматическое резюмирование, машинный перевод, визуализация). Чтобы дать читателю наиболее полное описание, основное внимание уделяется вероятностным моделям, используемым в соответствующих приложениях, подчеркивая связь между моделями и приложениями и иллюстрируя поведение каждой модели на реальных коллекциях. Книга организована вокруг четырех тем: моделей информационного поиска и ранжирования, классификации и кластеризации (регрессионная логистика, ядерные методы, марковские поля и т. д.), многоязычия и машинного перевода, а также новых приложений, таких как исследование информации. В книге представлены следующие главы: В первой части "Информационный поиск" описываются вероятностные модели для информационного поиска и обучаемые модели ранжирования для автоматического резюмирования текста и информационного поиска. Во второй части "Классификация и кластеризация" описываются логистическая регрессия и классификация текстов, ядерные методы для доступа к текстовой информации, тематические генеративные модели для доступа к текстовой информации и условные случайные поля для извлечения информации. В третьей части "Многоязычие" описываются статистические методы машинного перевода. И, наконец, в четвертой части "Новые приложения" описываются методы и интерфейсы для доступа к сложной информации и определение мнений как задача классификации тем.
This book is about some statistical models recently developed in various research fields to help us access information from text sources. These topics include extracting information from texts, helping you find information forms a large database, organizing texts into certain classes or groups, determining how someone feels about something or understand it better, aid you with automatic translations, and exploring information quickly.
Электронная Книга «Textual Information Access. Statistical Models» написана автором Gaussier Eric в году.
Минимальный возраст читателя: 0
Язык: Английский
ISBN: 9781118562833
Описание книги от Gaussier Eric
This book presents statistical models that have recently been developed within several research communities to access information contained in text collections. The problems considered are linked to applications aiming at facilitating information access: – information extraction and retrieval; – text classification and clustering; – opinion mining; – comprehension aids (automatic summarization, machine translation, visualization). In order to give the reader as complete a description as possible, the focus is placed on the probability models used in the applications concerned, by highlighting the relationship between models and applications and by illustrating the behavior of each model on real collections. Textual Information Access is organized around four themes: informational retrieval and ranking models, classification and clustering (regression logistics, kernel methods, Markov fields, etc.), multilingualism and machine translation, and emerging applications such as information exploration. Contents Part 1: Information Retrieval 1. Probabilistic Models for Information Retrieval, Stéphane Clinchant and Eric Gaussier. 2. Learnable Ranking Models for Automatic Text Summarization and Information Retrieval, Massih-Réza Amini, David Buffoni, Patrick Gallinari, Tuong Vinh Truong and Nicolas Usunier. Part 2: Classification and Clustering 3. Logistic Regression and Text Classification, Sujeevan Aseervatham, Eric Gaussier, Anestis Antoniadis, Michel Burlet and Yves Denneulin. 4. Kernel Methods for Textual Information Access, Jean-Michel Renders. 5. Topic-Based Generative Models for Text Information Access, Jean-Cédric Chappelier. 6. Conditional Random Fields for Information Extraction, Isabelle Tellier and Marc Tommasi. Part 3: Multilingualism 7. Statistical Methods for Machine Translation, Alexandre Allauzen and François Yvon. Part 4: Emerging Applications 8. Information Mining: Methods and Interfaces for Accessing Complex Information, Josiane Mothe, Kurt Englmeier and Fionn Murtagh. 9. Opinion Detection as a Topic Classification Problem, Juan-Manuel Torres-Moreno, Marc El-Bèze, Patrice Bellot and Fréderic Béchet.