Как Обучить Нейросеть, Если Разметка Данных Стоит Столько Же, Сколько Самолет

Искусственный интеллект все чаще используется в медицинских целях, в частности для анализа медицинских изображений.

Это отличный помощник для врачей-рентгенологов, который позволяет определить даже едва заметные человеческому глазу признаки патологий и в целом снимает нагрузку с врачей-специалистов за счет автоматизации ряда рутинных задач.

Мы, в том числе, создаем нейронные сети для обработки КТ-исследований, например, для оценки поражения легких при пневмонии, вызванной COVID-19 (кстати, вы знали, что процент поражения легких у ковидного пациента врачи оценивают «на глазок»).

»?).

Процесс создания качественной и эффективной нейросети долгий и дорогой.

Более того, обучающих данных зачастую недостаточно.

Например, классическое обучение нейронных сетей требует большого количества размеченных данных.

Это ресурсоемкий процесс как по стоимости, так и по времени, поскольку аннотаторами выступают рентгенологи.

Кроме того, отмеченные изображения требуют повторной проверки.

Например, пропущенные диагнозы при анализе КТ-изображений врачом могут составлять до 42% [ 1 ].

Также данные достаточно разнятся, это тоже проблема: разные дозы облучения при исследовании, положение пациента, особенности аппарата КТ.

Именно по этим причинам мы решили изучить различные подходы, которые могли бы помочь уменьшить количество аннотированных данных, необходимых для получения модели того же качества.

Это может не только сократить время и затраты на аннотацию, но и ускорить цикл поставки новых моделей.

В результате наших исследований мы нашли лучший подход, который помог сохранить точность алгоритма при использовании только Наценка 20%.

Магия - нет, мы вам больше расскажем.



Целевая задача

Мы решили создать модель для анализа КТ грудной клетки пациентов с Covid; в качестве патологии мы выбрали матовое стекло.

Почему именно этот симптом? Во-первых, оно часто возникает на фоне COVID-19 (у 61,4-91% пациентов.

2 , 3 ]).

Патология заключается в уплотнении легочной ткани, альвеолы наполняются жидкостью и в результате затрудняется дыхание.

Во-вторых, патология может иметь сложную структуру, что затрудняет обследование (см.

рисунок ниже).

При обнаружении матового стекла пациента необходимо тщательно обследовать, так как он находится в группе большого риска заражения COVID-19.

Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет

КТ-изображение пациента с COVID-19, патология по типу «матового стекла» отмечена цветом.

Источник - Боткин.

AI При анализе изображений необходимо учитывать, что КТ-изображение представляет собой трехмерное изображение (3D), содержащее орган-мишень.

Эту особенность можно использовать при анализе объемных патологий — на вход алгоритму подается не одно изображение, а набор последовательных, что позволяет передать контекст и дает алгоритму больше информации об окружающей среде.



Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет

Пример 5 последовательных картинок.

Источник - Боткин.

AI

Экспериментальный план

По имеющимся данным (КТ-изображениям легких) задача сегментации патологии «матового стекла» решена с использованием классической нейронной сети U-net [ 6 ], что является основой модели.

Для получения эталонных значений мы обучили целевую модель классическим способом (под наблюдением) на данных с полной аннотацией (каждый срез во всех исследованиях помечен).



Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет

Качество работы данной модели взято за эталонное; именно эти показатели мы хотим сохранить или улучшить в дальнейших экспериментах.

На втором этапе мы проверяем, какое качество мы получим, если обучим ту же модель классическим контролируемым способом на данных с 20% аннотаций.

Для этого этапа и последующих экспериментов разделы с аннотациями выбираются не случайно, а по следующему правилу: в каждом исследовании отметка выставляется только для каждого пятого раздела.

Затем мы начали пробовать более современные методы, которые характерны для подходов с самоконтролем и полуконтролем, также используя только часть аннотации.



Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет



Исследование подхода №1



Контрастное обучение с полуконтролем для эффективной сегментации медицинских изображений с использованием меток

Основная идея контрастного обучения — подготовить пространство признаков, используя только исходные данные.

Теперь наша задача — научить сеть создавать похожие векторы признаков на аналогичных примерах.

В этом случае на вход подаются два примера — исходное изображение x и дополненное x’, причем расстояние между векторами должно быть минимальным.

Таким образом, можно быстрее и лучше обучить сеть целевой задаче за счет использования всех неразмеченных данных.

Часто при использовании этого подхода на всех данных предварительно обучается только Encoder (a)[ 4 ], после чего декодер обучается обычным контролируемым способом на помеченных данных (c)[ 4 ].

Метод отличается тем, что авторы статьи придумали, как также обучать Декодера, используя подход локального контрастного обучения (б)[ 4 ].

Это достигается за счет работы не с векторами признаков, полученными от кодера, а с картами признаков, полученными из ветки декодера.



Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет

Таким образом, на первом этапе обучается только Encoder; Характеристики, полученные после слоя AVG, сравниваются с использованием контрастных потерь:

Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет

где z_i и z_j — выходные значения Encoder x и x’, а z_t — все остальные результаты пакетной обработки.

Как упоминалось ранее, первый этап — это просто подготовка части модели, затем следующий шаг — контролируемое обучение модели с помощью аннотации.

На рисунке ниже показан полный конвейер обучения.



Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет

Довольно часто Dice [ используется как функция потерь 7 ], он обозначает меру классового сходства между основной истиной и предсказанием (также известную как мера F-1): D(P, G) = 2 |G∩P| / (|G| + |P|) Однако у него есть несколько недостатков, поскольку он работает с целыми числами и не учитывает значения вероятностного прогнозирования.

Во-первых, необходимо выбрать порог, который будет напрямую влиять на корректность результата.

Во-вторых, для классической кости не имеет значения, какова была вероятность класса, например, если граничное значение равно 0, то значения 0,1 и 0,9 будут в равной степени считаться классом 1.

Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет

а – Continuous Dice учитывает малые вероятности при расчете ошибок, б – все ошибки для Dice эквивалентны [8] Непрерывная игра в кости — более подходящая функция ошибок для этой задачи, поскольку она учитывает вероятности выхода и наказывает ошибки в дополнение к их вероятностям.



Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет

где gi — значение бинарной маски в каждом i пикселе, pi — вероятностное значение результирующей маски нейронной сети

Исследование подхода №2



Трансформационно-согласованная модель самосинхронизации для полуконтролируемой сегментации медицинских изображений

Не менее интересным подходом является самоорганизующаяся модель обучения, согласующаяся с трансформацией, с частичным участием преподавателя.

Идею можно передать на следующем примере — если подать на вход нейронной сети изображение, повернутое на 90 градусов, то мы получим тот же результат, если сначала повернуть изображение на 90 градусов, а затем подать его на нейронную сеть.

.

Таким образом, помимо вращения могут быть и другие преобразования (а)[ 5 ].



Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет

Однако важно понимать, что нейронные сети — это нелинейные алгоритмы, поэтому на выходе мы не получим одинаковые маски (б)[ 5 ].

Эту идею следует сформулировать в виде функции потерь.

На основе этой идеи был создан алгоритм TCSM (Transformation Consistent Self-Ensempleing Model).

Есть сетевой «ученик» и его копия «учитель», которые должны предсказывать маски.

Исходное изображение передается в сеть ученика, модифицированное изображение передается в сеть учителя, затем, используя те же преобразования, мы изменяем выходные данные сети ученика.

Результат должен быть тот же.

Поскольку сеть учителей действует как усредняющий сглаживающий фильтр состояний модели ученика, это позволяет использовать неразмеченные данные без потери согласованности прогнозов модели (учитель, ученик) в процессе обучения.

И поэтому для всех исходных изображений мы обучаем сеть с помощью такого конвейера, соответственно используя Unlabeled loss. Для изображений с аннотациями мы просто сравниваем выходные данные учительской сети с целевой маской и используем помеченные потери для расчета ошибки.



Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет



Результаты

Мы оценивали полученные модели с помощью метрики Dice и объемной Dice (VolDice), которая используется для оценки всего исследования как единого 3D-объекта.

Метрики рассчитывались для каждого класса, где 0 – норма (отсутствие патологии), 1 – матовое стекло.

Кости_0 Кости_1 ВолДице_0 ВолДайс_1
Контролируемые, 100% аннотированные данные 0.997 0.423 0.997 0.627
Контролируемые, 20% аннотированных данных 0.991 0.258 0.99 0.405
Контрастное обучение 0.995 0.315 0.994 0.484
ТЦСМ 0.997 0.43 0.996 0.639
Из таблицы следует, что выбранные алгоритмы обучения позволяют сохранять качество модели при обучении на данных с низкой плотностью аннотаций, при этом по целевым метрикам оба алгоритма превосходят модель, обученную на 20% аннотированных данных.

На рисунке показаны примеры результатов обработки КТ-изображений из тестовой выборки моделью, обученной на данных с полной аннотацией, и моделью TCSM, обученной на данных с в 5 раз меньшим количеством аннотаций.

Примеры показывают, что сопоставленная модель может выполнять задачу сегментации так же, как и эталонная модель, что усиливает достигнутые показатели в таблице.



Как обучить нейросеть, если разметка данных стоит столько же, сколько самолет

Таким образом, использование неразмеченных данных и применение подходов неконтролируемого или частично контролируемого обучения модели для сегментации КТ-изображений позволяет сохранить качество модели, при этом количество требуемых размеченных данных сокращается в 5 раз, что снижает минимально необходимые затраты.

аннотации данных, сокращает время разметки в 3-4 раза, а, следовательно, сокращает время цикла разработки или совершенствования моделей.

Как вам удалось сократить время и затраты на ручное аннотирование данных? Поделитесь своим опытом? :)


Беляков Дмитрий Старобыховская Анастасия Теги: #Машинное обучение #искусственный интеллект #нейронные сети #Большие данные #Телемедицина #медицинские технологии #обучение с учителем #обучение без учителя #радиология #обучение модели
Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.