Добыча данных (Data mining) может быть определена как процесс отбора, исследования и моделирования больших баз данных с целью обнаружения моделей и закономерностей. Растущая доступность данных в современном информационном обществе привела к необходимости валидных инструментов для их моделирования и анализа. Добыча данных и прикладные статистические методы - подходящие инструменты для извлечения таких знаний из данных. Применения встречаются во многих различных областях, включая статистику, информатику, машинное обучение, экономику, маркетинг и финансы. Эта книга является первой, которая описывает прикладные методы добычи данных в единой статистической системе, а затем показывает, как их можно применить на практике. Все описанные методы либо вычислительные, либо статистического моделирования. Сложные вероятностные модели и математические инструменты не используются, поэтому книга доступна широкой аудитории студентов и специалистов промышленности. Вторая половина книги состоит из девяти практических исследований, взятых из собственного опыта автора в промышленности, которые демонстрируют, как описанные методы можно применить к реальным проблемам.
Книга предоставляет основательное введение в прикладные методы добычи данных в единой статистической системе. В ней освещаются классические, многомерные и байесовские статистические методологии. Также включены многие недавние разработки, такие как веб-майнинг, последовательный байесовский анализ и обоснование на основе памяти. Каждый описанный статистический метод иллюстрируется примерами реального применения. Присутствует обсуждение программного обеспечения, используемого в добыче данных, с особым акцентом на SAS.
Книга поддерживается веб-сайтом с наборами данных, программным обеспечением и дополнительными материалами. Включает обширную библиографию и ссылки на дополнительное чтение в тексте. Автор имеет многолетний опыт преподавания вводного и многомерного статистического анализа и добычи данных, а также работы над прикладными проектами в промышленности.
Это ценный ресурс для студентов старших курсов и аспирантов прикладной статистики, добычи данных, информатики и экономики, а также для специалистов, работающих в промышленности над проектами, включающими большие объемы данных, - такими как маркетинг или управление финансовыми рисками.
Data mining может быть определено как процесс отбора, изучения и построения моделей больших баз данных для обнаружения моделей и паттернов. Текущая доступность данных в информационном обществе требует применения валидных инструментов для их анализа и моделирования. Методы data mining и примененные статистические методы являются подходящими инструментами для извлечения этого знания из данных. Приложения возникают во многих различных областях, включая статистику, информатику, машинное обучение, экономику, маркетинг и финансы.
Эта книга вводит впервые методы data mining на согласованной статистической основе и показывает их применение на практике. Все описанные методы являются вычислительными или модельно-статистическими. Сложные вероятностные модели и математические инструменты не используются, так что, книга доступна для широкой аудитории студентов и инжиниринговых профессионалов. Вторая половина книги содержит девять шагов исследования, которые были исследованы в собственной работе автора в индустрии, демонстрируя, как она может быть применена к реальным проблемам.
Вводит крепкое введение в методы applied mining на коррелятивной статистической базе. Охватывает классическую и многомерную статистическую методологию и многие обновленные разработки, такие как web-mining, последовательный байесовский анализ и разумные рассуждения на основании памяти. Каждое описанное статистическое средство изображено с приложениями в реальном мире. Включает в себя ряд определенных шагов исследования, основанных на приложенных проектах в индустрии. Включает обсуждение программного обеспечения, используемого в data mining, с сосредоточением внимания на SAS. Подкрепляется веб-сайтом с наборами данных, программным обеспечением и дополнительными материалами. Включает обширный библиографический список и указатели к дальнейшей литературе в тексте3.
Электронная Книга «Applied Data Mining» написана автором Группа авторов в году.
Минимальный возраст читателя: 0
Язык: Английский
ISBN: 9780470871393
Описание книги от Группа авторов
Data mining can be defined as the process of selection, exploration and modelling of large databases, in order to discover models and patterns. The increasing availability of data in the current information society has led to the need for valid tools for its modelling and analysis. Data mining and applied statistical methods are the appropriate tools to extract such knowledge from data. Applications occur in many different fields, including statistics, computer science, machine learning, economics, marketing and finance. This book is the first to describe applied data mining methods in a consistent statistical framework, and then show how they can be applied in practice. All the methods described are either computational, or of a statistical modelling nature. Complex probabilistic models and mathematical tools are not used, so the book is accessible to a wide audience of students and industry professionals. The second half of the book consists of nine case studies, taken from the author's own work in industry, that demonstrate how the methods described can be applied to real problems. Provides a solid introduction to applied data mining methods in a consistent statistical framework Includes coverage of classical, multivariate and Bayesian statistical methodology Includes many recent developments such as web mining, sequential Bayesian analysis and memory based reasoning Each statistical method described is illustrated with real life applications Features a number of detailed case studies based on applied projects within industry Incorporates discussion on software used in data mining, with particular emphasis on SAS Supported by a website featuring data sets, software and additional material Includes an extensive bibliography and pointers to further reading within the text Author has many years experience teaching introductory and multivariate statistics and data mining, and working on applied projects within industry A valuable resource for advanced undergraduate and graduate students of applied statistics, data mining, computer science and economics, as well as for professionals working in industry on projects involving large volumes of data – such as in marketing or financial risk management.