С появлением компьютеров обработка очень больших наборов данных стала рутинной. Стандартные статистические методы не обладают достаточной мощностью или гибкостью для эффективного анализа таких данных и извлечения необходимых знаний. Альтернативный подход заключается в том, чтобы обобщить большой набор данных таким образом, чтобы полученный обобщенный набор имел управляемый размер, но в то же время сохранял как можно больше знаний из исходного набора. Одним из следствий этого является то, что данные больше не представлены отдельными значениями, а могут быть выражены списками, интервалами, распределениями и т.д. Обобщенные данные имеют свою внутреннюю структуру, которую необходимо учитывать при любом анализе. Этот текст представляет единое описание символьных данных, как они возникают и как структурированы. Читатель знакомится с методами символьного анализа, описанными в последовательной статистической структуре, необходимой для проведения такого обобщения и последующего анализа.
Книга дает детальный обзор методов и применений анализа символьных данных. Включает многочисленные реальные примеры из различных областей применения, от здравоохранения и социальных наук до экономики и информатики. В конце каждой главы приведены упражнения, позволяющие читателю развить понимание теории. Предоставляет дополнительный веб-сайт с ссылками для загрузки программного обеспечения SODAS, разработанного исключительно для анализа символьных данных, наборов данных и дополнительных материалов.
Книга в первую очередь ориентирована на статистиков и аналитиков данных, но также идеально подходит для ученых, работающих с большими объемами данных из различных дисциплин, включая информатику, медицину и социальные науки. Также будет полезна для студентов курсов статистического анализа данных.
Электронная Книга «Symbolic Data Analysis» написана автором Lynne Billard в году.
Минимальный возраст читателя: 0
Язык: Английский
ISBN: 9780470090176
Описание книги от Lynne Billard
With the advent of computers, very large datasets have become routine. Standard statistical methods don’t have the power or flexibility to analyse these efficiently, and extract the required knowledge. An alternative approach is to summarize a large dataset in such a way that the resulting summary dataset is of a manageable size and yet retains as much of the knowledge in the original dataset as possible. One consequence of this is that the data may no longer be formatted as single values, but be represented by lists, intervals, distributions, etc. The summarized data have their own internal structure, which must be taken into account in any analysis. This text presents a unified account of symbolic data, how they arise, and how they are structured. The reader is introduced to symbolic analytic methods described in the consistent statistical framework required to carry out such a summary and subsequent analysis. Presents a detailed overview of the methods and applications of symbolic data analysis. Includes numerous real examples, taken from a variety of application areas, ranging from health and social sciences, to economics and computing. Features exercises at the end of each chapter, enabling the reader to develop their understanding of the theory. Provides a supplementary website featuring links to download the SODAS software developed exclusively for symbolic data analysis, data sets, and further material. Primarily aimed at statisticians and data analysts, Symbolic Data Analysis is also ideal for scientists working on problems involving large volumes of data from a range of disciplines, including computer science, health and the social sciences. There is also much of use to graduate students of statistical data analysis courses.