Кластерный или ко-кластерный анализ - это важные инструменты в различных научных областях. Во введении этой книги представлено современное состояние уже хорошо зарекомендовавших себя, а также более новых методов ко-кластеризации. Авторы в основном рассматривают двухрежимное разбиение по разным подходам, но уделяют особое внимание вероятностному подходу. Глава 1 посвящена кластеризации в целом и модельно-ориентированной кластеризации в частности. Авторы кратко обзор классические методы кластеризации и фокусируются на модели смеси. Они представляют и обсуждают использование различных смесей, адаптированных к разным типам данных. Описываются используемые алгоритмы и проводится сравнение с различными классическими методами. Эта глава полезна для решения проблемы ко-кластеризации с помощью подхода смеси. Глава 2 посвящена латентной блочной модели, предложенной в контексте подхода смеси. Авторы подробно обсуждают эту модель и показывают ее преимущества для ко-кластеризации. Представлены различные алгоритмы в общем контексте. Глава 3 сфокусирована на двоичных и категориальных данных. Подробно представлены соответствующие латентные блочные модели смеси. Описаны варианты этих моделей и алгоритмы, проиллюстрированные примерами. Глава 4 сфокусирована на таблицах сопряженности. Рассмотрены взаимная информация, критерий хи-квадрат и модельно-ориентированная ко-кластеризация. Описаны модели, алгоритмы и связи между различными подходами, проиллюстрированные примерами. Глава 5 представляет случай непрерывных данных. Тем же способом расширены различные подходы, использованные в предыдущих главах, на эту ситуацию.
Книга дает хорошее представление о современных методах кластеризации и ко-кластеризации данных, основанных на вероятностных моделях. Рассмотрен широкий круг подходов и алгоритмов для различных типов данных. Книга будет полезна специалистам в области анализа данных, машинного обучения и статистики.
Co-Кластери, Автор: Жерар ГоверЭта книга посвящена кластерному анализу и моделям кокластеризации в различных научных областях. В ней представлен обзор существующих и новых методов анализа данных, включая двухмодальное разделение с различными подходами, а также особое внимание уделено использованию вероятностного подхода. Первая глава освещает общие аспекты кластеризации и, в частности, основанное на моделировании кластерное моделирование. Затем авторы анализируют процесс применения различных смесей к различным типам данных, описывают используемые алгоритмы и соотносят их с классическими методами. Эта глава полезна для анализа задачи кокластеризация при использовании данного подхода. Во второй главе подробно анализируется латентная блочная модель, представленная в контексте использования моделирования. Авторы обсуждают данную модель и её значение в анализе кокластеров, представляя различные алгоритмы в общем контексте. Третья глава посвящена бинарным и категориальным данным, где подробно рассматриваются соответствующих латентные блочные модели смесей. Также предоставляются варианты таких моделей и алгоритмы с применением примеров. Четвертая глава касается табличных данных. Здесь изучаются информация о взаимной связи, квадрат разности и основанная на моделирешающий анализ кокластеров. Модели, алгоритмы и связи между различными подходами описавыются и иллюстрируются. Пятая глава представляет случай непрерывных данных. Подобно предыдущему главам, различные методы используются в данной ситуации.
В книге "Co-Clustering" автор описывает различные аспекты Ко-кластерного анализа в различных научных областях. В ней описываются уже устоявшиеся и новые методы Ко-кластеризации. Основное внимание уделяется двумерной группировке в разных подходах, при этом особый акцент сделан на вероятностной модели. Глава 1 является введением в ко-кластеризацию и фокусируется на кластерном анализе и моделировании при кластеризации в целом. Подробно описываются классические методы кластеризации и основное внимание уделено смеси моделей. Также представлен и обсуждается подход к использованию различных смесей в зависимости от типа данных. Описываются алгоритмы и рассматривается связь с ранее описанными классическими методами. Эта глава хорошо подходит для разбора проблемы ко-кластеризации на основе подхода со смесью. Глава 2 посвящена скрытому блочному моделированию, разработанному в контексте подхода со смесью и подробно обсужденному авторами. Многочисленные алгоритмы представлены в контексте общего обсуждения. В главе 3 основное внимание уделяется бинарным и категориальным данным. В деталях представлены соответствующие скрытые блочные модели смесей, также представлены варианты таких моделей и алгоритмы с примерами использования. В главе 4 основное внимание уделяется табличным данным. Изучаются взаимная информация, квадратичный коэффициент и модельное ко-кластирование. Описаны модели, алгоритмы и связи между различными моделями.В главе 5 представлено применение этих подходов к непрерывным данным. Автор Gerard Govarete является профессором в Университете Компьенна, Франция, а также частью коллектива исследователей Лаборатории HeudiasyC в рамках CNRS. Его исследовательский акцент сосредоточен на моделировании скрытых структур, выборе моделей, кластерной модели на базе моделей, блочных кластеризациях и статистическом распознавании образов. Он является одним из авторов книги «Введение в Рекуррентные Нейронные Сети».
Электронная Книга «Co-Clustering» написана автором Gérard Govaert в году.
Минимальный возраст читателя: 0
Язык: Английский
ISBN: 9781118649497
Описание книги от Gérard Govaert
Cluster or co-cluster analyses are important tools in a variety of scientific areas. The introduction of this book presents a state of the art of already well-established, as well as more recent methods of co-clustering. The authors mainly deal with the two-mode partitioning under different approaches, but pay particular attention to a probabilistic approach. Chapter 1 concerns clustering in general and the model-based clustering in particular. The authors briefly review the classical clustering methods and focus on the mixture model. They present and discuss the use of different mixtures adapted to different types of data. The algorithms used are described and related works with different classical methods are presented and commented upon. This chapter is useful in tackling the problem of co-clustering under the mixture approach. Chapter 2 is devoted to the latent block model proposed in the mixture approach context. The authors discuss this model in detail and present its interest regarding co-clustering. Various algorithms are presented in a general context. Chapter 3 focuses on binary and categorical data. It presents, in detail, the appropriated latent block mixture models. Variants of these models and algorithms are presented and illustrated using examples. Chapter 4 focuses on contingency data. Mutual information, phi-squared and model-based co-clustering are studied. Models, algorithms and connections among different approaches are described and illustrated. Chapter 5 presents the case of continuous data. In the same way, the different approaches used in the previous chapters are extended to this situation. Contents 1. Cluster Analysis. 2. Model-Based Co-Clustering. 3. Co-Clustering of Binary and Categorical Data. 4. Co-Clustering of Contingency Tables. 5. Co-Clustering of Continuous Data. About the Authors Gérard Govaert is Professor at the University of Technology of Compiègne, France. He is also a member of the CNRS Laboratory Heudiasyc (Heuristic and diagnostic of complex systems). His research interests include latent structure modeling, model selection, model-based cluster analysis, block clustering and statistical pattern recognition. He is one of the authors of the MIXMOD (MIXtureMODelling) software. Mohamed Nadif is Professor at the University of Paris-Descartes, France, where he is a member of LIPADE (Paris Descartes computer science laboratory) in the Mathematics and Computer Science department. His research interests include machine learning, data mining, model-based cluster analysis, co-clustering, factorization and data analysis. Cluster Analysis is an important tool in a variety of scientific areas. Chapter 1 briefly presents a state of the art of already well-established as well more recent methods. The hierarchical, partitioning and fuzzy approaches will be discussed amongst others. The authors review the difficulty of these classical methods in tackling the high dimensionality, sparsity and scalability. Chapter 2 discusses the interests of coclustering, presenting different approaches and defining a co-cluster. The authors focus on co-clustering as a simultaneous clustering and discuss the cases of binary, continuous and co-occurrence data. The criteria and algorithms are described and illustrated on simulated and real data. Chapter 3 considers co-clustering as a model-based co-clustering. A latent block model is defined for different kinds of data. The estimation of parameters and co-clustering is tackled under two approaches: maximum likelihood and classification maximum likelihood. Hard and soft algorithms are described and applied on simulated and real data. Chapter 4 considers co-clustering as a matrix approximation. The trifactorization approach is considered and algorithms based on update rules are described. Links with numerical and probabi