Книга «Обучение на несбалансированных выборочных ансамблях при анализе сети устройства» авторства И.С. Лебедева исследует особенности реализации решения проблем, связанных с классификацией редких ситуаций в условиях отсутствия равновесия между объемами обучающих наборов.
Основным направлением книги является изучение способов обучения классификатора на выборках с дисбалансом данных, который возникает при формировании множеств обучения. Автор предлагает решение этой проблемы на основе применения ансамблей классификаторов на группах разбалансированного уровня.
В книге приводятся предварительные условия, предшествующие появлению дисбалансных данных. Также обсуждается оценка разбалансировки данных, которая включает в себя нарушения соотношения количества событий определенных типов, которые учитываются на одном классе обучающих комплектов. Это связано с отсутствием данных в комплекте обучения, из-за чего увеличивается эффект анормального поведения ответов, что перекрывается усложнением модели и добавлением отличающихся алгоритмов классификации. На следующем этапе читатель может применить полученные знания с целью повышения точности результатов идентификации потенциальных эффектов разрушения.
В статье рассмотрен подход к анализу состояния сетевых сегментов путем обучения на несбалансированных выборка ансамблей классификаторов.
Электронная Книга «Обучение на несбалансированных выборках ансамбля классификаторов при анализе состояния сетевых сегментов» написана автором И. С. Лебедев в 2021 году.
Минимальный возраст читателя: 0
Язык: Русский
Серии: Прикладная информатика. Научные статьи
Описание книги от И. С. Лебедев
Актуальность рассматриваемой в статье темы состоит в решении проблемных вопросов идентификации редких событий в условиях дисбаланса обучающих множеств. Цель исследования – анализ возможностей ансамбля классификаторов, обученных на разных подмножествах разбалансированных данных. Обозначены предпосылки возникновения несбалансированных данных при формировании обучающих выборок. Предложено решение, основанное на применении ансамбля классификаторов, обученных на различных обучающих выборках, в которых имеется дисбаланс классифицируемых событий. Приведен анализ возможности применения несбалансированных тренировочных множеств для ансамбля классификаторов, где усреднение ошибок происходит за счет процедуры коллективного голосования. Осуществлена оценка распределений значений признаков в тестовых и тренировочных подмножествах. Исследована разбалансировка, заключающаяся в нарушении соотношений количества событий определенного вида внутри одного класса в обучающих подмножествах данных. Отсутствие данных в обучающей выборке приводит к увеличению эффекта разброса ответов, который усредняется увеличением сложности модели, включением в ее состав различных классифицирующих алгоритмов. В дальнейшем, в ходе функционирования возможно вносить изменения в состав классифицирующих алгоритмов, что позволяет повышать показатели точности идентификации потенциального деструктивного воздействия.