Физиологические и психические состояния человека очень часто отражаются в его поведении, движениях и даже в особенностях его взгляда. И речь идет не о случаях, когда человек хватается за голову и жалуется на боль, а о случаях, когда физиологические состояния проявляются в малозаметных физических изменениях. Невооруженным взглядом это можно не заметить, потому нужен инструмент фиксации и анализа подобных эпизодов. Ученые из Мюнхенского университета (Германия) создали модель ИИ, которая использует поведение человека за рулем в качестве маркеров определения низкого содержания сахара. Как эта модель работает, и насколько ее предсказания точны? Ответы на эти вопросы мы найдем в докладе ученых.
Основа исследования
Несмотря на значительные достижения в лечении диабета, гипогликемия* остается одной из наиболее актуальных проблем. Гипогликемия существенно влияет на когнитивные, исполнительные и психомоторные способности, создавая значительный риск для безопасного выполнения повседневных задач, таких как вождение автомобиля. Нераспознанная гипогликемия может стать причиной значительного числа дорожно-транспортных происшествий среди людей с диабетом.
Гипогликемия* – это патологическое состояние, характеризующееся снижением концентрации глюкозы в крови ниже 3.5 ммоль/л, периферической крови ниже нормы (3.3 ммоль/л).
Существующие методы выявления гипогликемии включают самоконтроль уровня глюкозы в крови (BG от blood glucose) и постоянный мониторинг уровня глюкозы (CGM от continuous glucose monitoring). Данные методы ограничены инвазивностью, доступностью, затратами и задержкой во времени. Последнее особенно актуально при вождении, когда необходимо принять быстрые меры. Значительное количество дорожно-транспортных происшествий с участием людей с диабетом подчеркивает необходимость новых подходов к выявлению гипогликемии. Как было показано ранее, машинное обучение (ML от machine learning) можно использовать для определения соответствующего состояния здоровья с помощью биомедицинских сигналов.
Автомобили в режиме реального времени предоставляют информацию с высоким разрешением о различных характеристиках вождения (например, скорость, торможение, рулевое управление), которая передается через сети контроллеров* (CAN от controller area network).
CAN* (Controller Area Network, т.е. сеть контроллеров) — стандарт промышленной сети, ориентированный, прежде всего, на объединение в единую сеть различных исполнительных устройств и датчиков.
Камеры наблюдения за водителем (DMC от driver-monitoring cameras), фиксирующие взгляд и движения головы, все чаще устанавливаются для отслеживания поведения водителя как в автономных, так и в полуавтономных транспортных средствах. Система обнаружения гипогликемии исключительно на основе данных CAN и DMC (без измерения уровня глюкозы) может предложить новое, неинвазивное и легкодоступное решение для повышения безопасности дорожного движения для людей с диабетом.
Целью рассматриваемого нами исследования была разработка и оценка системы на основе машинного обучения для обнаружения гипогликемии в случаях вождения реальным автомобилем (т. е. не на симуляторе вождения, как было в более ранних трудах).
Подготовка к экспериментам
Изображение №1
В ходе исследования было проведено два типа опытов с участием людей с диабетом I типа, когда они вели автомобиль при различных уровнях гипогликемии (схема выше). В опыте №1 данные CAN и DMC собирались во время вождения испытуемых в состояниях эугликемии (нормальный уровень глюкозы) и выраженной гипогликемии (BG от 2.0 до 2.5 ммоль/л). В опыте №2 данные CAN и DMC собирались в состояниях эугликемии и легкой гипогликемии (BG от 3.0 до 3.5 ммоль/л).
Данные CAN и DMC из обоих опытов были использованы для разработки и оценки моделей машинного обучения, прогнозирующих, был ли человек в состоянии эугликемии или гипогликемии. Чтобы отразить различные поколения транспортных средств, выявление гипогликемии оценивалось с использованием трех различных моделей машинного обучения: модель CAN + DMC, которая интегрировала данные о вождении и движении взгляда/головы, что представляет собой передовую технологию в современных автомобилях; модель CAN, в которой использовались исключительно данные о вождении, поскольку не все современные автомобили имеют DMC; и модель DMC, которая использовала только данные о движении взгляда/головы, поскольку в будущем автономное и полуавтономное вождение может ограничить полезность данных CAN.
Результатом исследования стала диагностическая точность метода машинного обучения при обнаружении гипогликемии, количественно выраженная как площадь под характеристической кривой приемника (AUROC от receiver-operating characteristic curve).
На 1C показан конвейер машинного обучения трех моделей обнаружения гипогликемии с входными данными из автомобиля (CAN), DMC или их комбинации (CAN + DMC). Существующие подходы к выявлению сонливости и вождения в нетрезвом виде повлияли на выбор признаков. Основными сигналами данных CAN были угол поворота рулевого колеса, скорость рулевого колеса, положение педали тормоза, положение педали газа, скорость и ускорение автомобиля. Из видеоданных DMC сигналы взгляда и вращения головы были извлечены с использованием стандартного алгоритма, который коммерчески доступен в автомобильной промышленности.
Алгоритм использует четырехэтапную процедуру (обнаружение лица, локализация области глаз, обнаружение зрачка и расчет вектора взгляда) для определения взгляда и поворота головы участника (обнаружение лица, обнаружение ориентиров лица, расчет положения головы и расчет поворота головы). В конечном итоге были извлечены два сигнала взгляда (скорость взгляда и ускорение взгляда) и пять сигналов вращения головы (скорость вращения головы, ускорение вращения головы, вращение с ускорением головы, шаг ускорения головы и ускорение поворота головы).
Для разработки признаков (т. е. процесса создания входных признаков на основе необработанных данных) ученые использовали подход скользящего окна*.
Метод скользящего окна* — алгоритм трансформации, позволяющий сформировать из членов временного ряда набор данных, который может служить обучающим множеством для построения модели прогнозирования.
Все сигналы были разрезаны на последовательности (окна) по 60 секунд со сдвигом на 1 секунду между соседними окнами. Затем к каждой последовательности были применены статистические функции агрегирования, генерирующие набор интерпретируемых характеристик для каждой последовательности (например, медианная скорость взгляда). В результате появилось шесть функций для CAN и семь функций для DMC. Для каждого окна бинарные выходные переменные были установлены на основе венозного уровня глюкозы (единица при ГК < 3.9 ммоль/л и ноль в противном случае), измеренного с помощью устройства золотого стандарта (Biosen). Модели машинного обучения были реализованы в виде логистической регрессии с гребневой регуляризацией. Эффективность выявления гипогликемии измерялась путем перекрестной проверки с исключением одного человека (n=30); то есть модели машинного обучения были обучены на 29 людях, а затем оценены на неучтенном человеке. Эту процедуру повторяли до тех пор, пока каждый человек не был исключен для оценки один раз. В двух исследованиях не было дублирования участников. Результаты представлены как среднее значение эффективности обнаружения вне выборки по участникам (т. е. макросреднее). Для измерения различий в поведении участников предоставляется стандартное отклонение (SD от standard deviation) на уровне участников. Чтобы обеспечить возможность обобщения, гиперпараметры были фиксированными и, следовательно, одинаковыми для всех моделей и участников. Кроме того, для подтверждения результатов были проведены проверки устойчивости, включая оценку других линейных и нелинейных моделей машинного обучения (например, дерево решений с градиентным усилением), анализ чувствительности для окон различной длины, а также различные процедуры обучения и оценки. Коэффициенты регрессии и отношения шансов были проанализированы для оценки влияния каждой особенности на принятие решений в модели CAN+DMC.
Результаты исследования
В окончательный анализ были включены 30 человек с диабетом I типа. В опыте №1 (20 участников) средний венозный уровень глюкозы составлял 6.38 ± 0.84 ммоль/л при эугликемии и 2.43 ± 0.35 ммоль/л при гипогликемии, с соответствующими значениями CGM 6.81 ± 0.85 ммоль/л и 3.12 ± 0.63 ммоль/л соответственно.
Таблица №1: данные испытуемых.
В опыте №2 (10 участников) средние значения венозного уровня глюкозы при эугликемии и гипогликемии составляли 6.18 ± 0.83 ммоль/л и 3.34 ± 0.20 ммоль/л, с соответствующими показателями CGM 6.±67 ± 1.26 ммоль/л и 3.85 ± 0.50 ммоль/л.
Метод разработки признаков, описанный выше, привел к 32537 наблюдениям для опыта №1, из которых 16196 наблюдений были связаны с вождением автомобиля при эугликемии (класс 0, уровень BG ≥ 3.9 ммоль/л), а 16341 — с вождением автомобиля в условиях гипогликемии (класс 1, уровень BG < 3.9 ммоль/л). В опыте №2 было 15461 наблюдение: 7728 при эугликемии и 7733 при гипогликемии.
Изображение №2
Для выявления гипогликемии модель CAN + DMC давала AUROC 0.80 ± 0.11 (2A). Модель CAN дала AUROC 0.73 ± 0.07, а модель DMC дала AUROC 0.70 ± 0.16. Дополнительные показатели производительности показаны в таблице ниже. Чтобы объяснить, как каждая входная функция влияет на выходные данные модели CAN + DMC, коэффициенты и отношения шансов входных функций представлены на 2B.
Таблица №2
Чтобы обеспечить надежность результатов, ученые провели несколько проверок, включая оценку других линейных и нелинейных моделей машинного обучения (например, дерево решений с градиентным усилением), анализ чувствительности для различной длины окна и различные процедуры обучения и оценки. В целом проверки подтвердили выбор модели машинного обучения и длины окна 60 секунд, использованного для окончательного анализа. При различных процедурах обучения и оценки эффективность моделей оставалась стабильной во всех комбинациях с незначительным снижением для процедур обучения, включающих меньше данных (т. е. только легкая гипогликемия).
Участники опытов недооценивали уровень глюкозы как при выраженной, так и при легкой гипогликемии. Хотя они сообщили о выраженных симптомах гипогликемии, значительно отличающихся от исходного уровня, баллы симптомов не различались между исходным уровнем и легкой гипогликемией. Примечательно, что 40% участников продолжали ехать при легкой гипогликемии.
Для более детального ознакомления с нюансами исследования рекомендую заглянуть в доклад ученых и дополнительные материалы к нему.
Эпилог
В рассмотренном нами сегодня труде ученые создали модель машинного обучения, которая способна использовать данные о поведении человека за рулем (скорость движения, торможение, рулевое управление, положение головы/взгляда и т.д.) для определения возможной гипогликемии.
Дорожно-транспортные пришествия с участием пациентов с диабетом I типа не редкость. В части случаях причиной ДТП являлось резкое снижение уровня глюкозы в крови (гипогликемия). Естественно, использовать классический глюкометр на ходу было бы крайне иррационально и опасно, а делать остановки ради его использования занимало бы время. А вот методика, разработанная учеными, позволяет узнать о наличии гипогликемия прямо на ходу. Это будет сигналом для человека, что необходимо остановиться и принять меры для достижения нормального уровня глюкозы (эугликемия). Кроме вышеописанного применения, данная методика может быть крайне полезной для оценки и анализа поведенческих изменений во время гипогликемии.
Немного рекламы
Спасибо, что остаётесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).
Dell R730xd в 2 раза дешевле в дата-центре Maincubes Tier IV в Амстердаме? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?