Всем привет! Сегодня я хочу поговорить о метамоделях в медицине.
Обязательно дочитайте до конца, вас ждет сюрприз! Метамодели в машинном обучении обычно относятся к моделям, которые используют в качестве входных данных прогнозы других алгоритмов.
Метамодель учится оптимально комбинировать эти прогнозы в зависимости от задачи и характеристик конкретного блока данных.
В общем, есть как простые примеры объединения прогнозов (голосование модели), так и более сложные — например, стекирование, при котором метамоделью может быть алгоритм любой сложности — от логистической регрессии до глубокой нейронной сети.
На тему модельных ансамблей уже написано немало статей и постов, поэтому здесь я хочу рассказать о парочке интересных случаев использования метамоделей для медицинских данных.
Обычно метамодели используются, когда хотят объединить предсказания разных алгоритмов — например, логистической регрессии, случайного леса, KNN, нейронов разных архитектур.
Разные модели могут искать разные закономерности в данных и в совокупности давать более точные результаты, чем каждая модель по отдельности.
Этот подход часто используется в медицине, но есть и более интересный случай.
Наборы данных по одной и той же медицинской проблеме часто обозначаются разными шкалами.
Например, шкала Bi-RADS обычно используется для описания результатов маммографии в медицине.
Врач-рентгенолог присваивает исследованию оценку от 1 до 5, что отражает уверенность врача в наличии злокачественного новообразования на снимке.
При этом во многих случаях нам доступна только бинарная информация о наличии рака – да или нет. Если мы хотим использовать все эти наборы данных для обучения, одним из возможных решений является использование метамодели.
Сначала мы обучаем отдельные модели на каждом наборе данных с использованием собственной шкалы или методологии маркировки, а затем используем их прогнозы в качестве функций в метамодели.
Другой распространенный случай — наличие небольшого количества «сильной» разметки и большого количества «слабой» разметки.
Слабая аннотация означает наличие аннотации только на уровне пациента или исследования — например, здоров ли пациент или болен.
А под сильным — более детальная разметка, например, на ббоксах или масках объектов на изображении.
Обучить классификационные нейроны непосредственно на слабых маркировках довольно сложно.
Нейронная сеть должна изолировать, где именно на изображении или во всем 3D-объеме (стеке изображений) расположены интересующие объекты и определить их тип, при этом мы не предоставляем ей эту информацию напрямую во время обучения.
Этот тип проблем в машинном обучении называется множественным обучением.
Метамодели предлагают альтернативный способ использования слабой разметки.
Сначала мы обучаем одну или несколько моделей локализации (детекторов или сегментаторов) на сильных метках с аннотированными объектами, а затем генерируем прогнозы на основе этих моделей на слабых данных.
Эти прогнозы можно использовать для создания различных функций, которые используются для обучения метамодели.
А теперь обещанный сюрприз! Мы вместе с О.
Д.
С.
, подготовлено для вас соревнование , в котором можно обучить медицинскую метамодель именно по последнему сценарию.
Мы взяли несколько наших детекторов различного качества и сгенерировали их прогнозы для большого количества маммографических изображений, для которых доступна только маркировка Bi-RADS.
Этот конкурс позволит вам улучшить свои навыки сразу в двух областях: разработке функций и обучении классических моделей ML. Тем, кто хочет добиться наилучших результатов, придется погрузиться в предметную область, изучить специфику маммографических исследований и сгенерировать крутые функции, которые позволят им строить модели высочайшего качества.
Конкурс продлится до конца лета, после чего мы подведем итоги и наградим победителей крутыми гаджетами и комплектующими для ваших станций DL. Присоединяйтесь к нам ! Теги: #Машинное обучение #медицина #искусственный интеллект #мл #машинное обучение #ИИ #метамодель #онкология
-
Мобильная Активность В Разное Время Суток
19 Oct, 24 -
Google Потребляет 184 Петабайта В Месяц
19 Oct, 24 -
Виртуальная Реальность 2.0
19 Oct, 24 -
Радио-Т №78
19 Oct, 24