Точное выделение границ опухолей головного мозга на МРТ-снимках

1 Июл в 07:00 Прокомментировать Просмотры: 8

Одним из критических аспектов при анализе данных МРТ является верификация границ новообразования. Именно четкость контура позволяет определить, какие структуры головного мозга оказались вовлечены в патологический процесс, и оценить степень поражения окружающих тканей. Высокоточная сегментация границ — это залог более точного клинического прогноза, поэтому пренебрежение этим этапом недопустимо.

Хотя стандартные архитектуры сегментации, такие как U-Net, стали своего рода золотым стандартом в медицине, они не лишены изъянов. Достижение высокого уровня соответствия маски (Dice score) не всегда гарантирует анатомическую корректность контура: он может оказаться чрезмерно сглаженным или, наоборот, «шумным» и фрагментарным. При стандартной оптимизации потери могут быть минимальными, однако критическая ошибка в несколько пикселей на снимке в реальности трансформируется в миллиметры пораженной мозговой ткани, что напрямую влияет на тактику лечения.

BISCUIT-Net предлагает принципиально иной подход к решению этой задачи. Базируясь на архитектуре U-Net, модель внедряет механизм облегченного внимания, ориентированный на контур. Нейросеть сначала формирует общий «эскиз», а затем детально прорабатывает границу. Ключевая концепция модели проста: «граница — это не второстепенный результат, а приоритетная задача».

Почему классической сегментации недостаточно

Глиомы представляют собой сложный объект для компьютерного зрения из-за своей морфологии: они обладают неровными краями, вытянутой формой, асимметрией и трудноуловимыми отростками. Весь этот объем информации необходимо интерпретировать по двумерным срезам МРТ.

В медицинской диагностике мы всегда ограничены объемом данных, а для обучения глубоких моделей с нуля их критически мало. В таких условиях использование массивных трансформеров ведет к быстрому переобучению. Проблема усугубляется качеством самих снимков: низкий контраст и размытые границы часто создают трудности даже для опытных радиологов.

U-Net стал популярным выбором не из-за моды, а благодаря своей стабильности при работе с ограниченными выборками. Модификации вроде Attention U-Net позволяют модели фокусироваться на релевантных областях, избегая рассеивания внимания по всему изображению. Тем не менее, как показали наши тесты, даже при хороших значениях Dice-метрики, предсказанные контуры часто отклоняются от клинической нормы.

Это не просто погрешность — это серьезный риск.

Основная проблема заключается в используемых функциях потерь. Стандартная бинарная кросс-энтропия и Dice-коэффициент оптимизируют общую площадь, а не точность границы. Модель получает штраф за «потерю» части региона, но если общая форма совпала, локальное смещение границы моделью практически игнорируется. Ошибка «размывается» в статистике, и нейросеть не осознает, что именно контур является точкой роста качества.

Для перевода визуальной точности в измеримые показатели мы использовали ряд метрик:

HD95 (95-й перцентиль расстояния Хаусдорфа) — критически важный показатель, определяющий максимальное удаление предсказанного контура от истинного (без учета экстремальных выбросов). Чем ниже значение, тем выше точность.

ASSD (Average Surface Distance) — среднее расстояние между поверхностями предсказанного объекта и эталона. Цель — минимизация этого значения.

BF1@1px и BF1@2px — модифицированные F1-меры с допуском в 1 и 2 пикселя соответственно. Они показывают, какая доля граничных пикселей находится в пределах допустимой погрешности.

Результаты испытаний подтвердили эффективность BISCUIT-Net. Ошибка контура существенно сократилась: HD95 снизился до 16.65 пикселей против 44.58 у классического U-Net. Метрика ASSD улучшилась в аналогичной пропорции, а BF1@2px достигла 0.900. Эффект наиболее заметен именно в пограничных областях, что подтверждает успех архитектурного решения.

Визуальный анализ результатов наглядно иллюстрирует преимущество новой архитектуры (зеленый цвет — эталон, пурпурный — результат модели).

В сложных случаях с неровными границами и вогнутыми участками, где стандартные модели теряют детали, BISCUIT-Net сохраняет геометрическую верность контура, значительно минимизируя крупные ошибки разметки.

Третий пример демонстрирует ограниченность Dice: даже если визуально все модели кажутся успешными, метрики контура выявляют систематические смещения у базовых архитектур, тогда как BISCUIT-Net демонстрирует высокую точность по всему периметру.

Граница как структурированное представление

Знаковое поле расстояний (SDF)

Бинарная маска дает лишь общее представление о принадлежности пикселя к опухоли. Для обеспечения высокой точности BISCUIT-Net использует дополнительное представление — **Signed Distance Field (SDF)**. В нем каждый пиксель несет информацию о дистанции до ближайшей точки контура: отрицательные значения для внутренних областей, положительные — для внешних, и ноль на границе.

Это представление не требует дополнительной разметки, поскольку легко вычисляется из исходных бинарных данных, предоставляя модели более глубокий геометрический контекст.

Граничный гейт (Boundary Gate)

Для управления вычислениями используется специальный гейт, который активирует «внимание» модели только вблизи предсказанной границы. Вне этой зоны расчеты выполняются стандартными свертками, что позволяет сэкономить ресурсы и сосредоточить вычислительную мощность на сложных участках.

Архитектурная синергия

Ядром системы является **Boundary-Implicit Fusion**. Мы сочетаем сверточную ветку (для общего контекста) с экспертом, использующим механизм внимания на основе SDF. Это разделение позволяет сохранить высокую скорость обработки, не жертвуя при этом точностью контуров.

Входные данные обрабатываются через стем в стиле **ConvNeXt**, после чего проходят через многомасштабную структуру, вдохновленную **HRNet**. Детальные признаки высокого разрешения сохраняются на протяжении всего пути, а трансформерные механизмы внимания используются только там, где необходим глобальный контекст, что позволяет избежать размытия краев.

Стратегия обучения

Функция потерь объединяет несколько ключевых компонентов: сегментацию региона, предсказание SDF, граничные сигналы и эйкональную регуляризацию, которая гарантирует геометрическую корректность поля расстояний. Такая комплексная оптимизация позволяет модели не просто «закрашивать» область, но и «осознавать» структуру границы.

Результаты

Итоговые тесты на выборке из 2845 обучающих и 544 валидационных срезов показали превосходство BISCUIT-Net над стандартными решениями. Улучшение в три раза по показателю HD95 при одновременном росте Dice-метрики доказывает, что акцент на границе способствует общему повышению качества сегментации.

Модель	Dice	IoU	HD95 ↓	BF1@1px ↑	BF1@2px ↑
U-Net	0.8571	0.7499	44.58	0.7605	0.8093
Attention U-Net	0.8688	0.7681	38.60	0.7823	0.8305
BISCUIT-Net	0.8836	0.7915	16.65	0.8561	0.9005

Заключение

BISCUIT-Net успешно доказывает, что точность контура можно выделить в самостоятельную задачу, существенно повысив качество медицинской сегментации без избыточных затрат вычислительных мощностей. Контур перестает быть абстрактной линией и становится ключевым объектом для анализа нейросетью. В дальнейшем мы планируем расширить применение этого подхода на 3D-данные и другие типы новообразований, требующих прецизионной точности.

Исходный код доступен в репозитории на GitHub. Датасет МРТ-снимков можно найти по ссылке.

Источник