
Биомедицина повсеместно опирается на эксперименты с лабораторными грызунами, и это не случайность: геном мыши на 97,5% идентичен человеческому, а количество общих генов достигает 30 000. Эти животные являются незаменимыми моделями для поиска терапии онкологических заболеваний, изучения деменции и, как в нашем случае, исследования биологических основ стресса и агрессивного поведения.
Ученые из новосибирского Института цитологии и генетики СО РАН проводят масштабную работу по выявлению взаимосвязи между хроническим психоэмоциональным напряжением, иммунным откликом и патологической агрессией. Однако научный прогресс упирается в «бутылочное горлышко»: для верификации гипотез необходимо анализировать сотни часов видеоматериалов с поведенческими актами грызунов.
Традиционный метод разметки крайне неэффективен: на детальный анализ всего 10 минут записи у сотрудника уходит до часа кропотливой работы с секундомером и таблицей.
Объединив экспертизу Yandex Cloud и Yandex Crowd Solutions, мы автоматизировали этот процесс, сэкономив исследователям более 500 часов чистого времени. В этой статье мы расскажем, как интеграция облачных мощностей, краудсорсинга и алгоритмов компьютерного зрения на базе DeepLabCut позволила оптимизировать сложную задачу фундаментальной науки.
Научный контекст: зачем это нужно
Исследование сфокусировано на механизмах патологической агрессии. Клиническая практика подтверждает, что длительный стресс у человека часто сопровождается системным воспалением. Ученые предполагают наличие нейровоспалительных процессов, при которых иммунные факторы преодолевают гематоэнцефалический барьер. Механизм влияния этих процессов на развитие патологий остается предметом активного изучения.
Для проверки гипотез и тестирования противовоспалительных препаратов используются стандартные поведенческие тесты. Выбор лабораторных мышей обусловлен их генетической близостью к человеку, что позволяет экстраполировать результаты на клинические сценарии.
В работе используются самцы линии CD1 — этот выбор продиктован их выраженной генетической склонностью к агрессии. Это позволяет получать статистически значимые данные на меньшем числе особей, следуя международным стандартам гуманного обращения с животными 3R: Replacement, Reduction, Refinement.
Моделирование хронического стресса проводится согласно протоколу социального контакта: разделенных перегородкой самцов периодически сводят вместе, провоцируя конфронтацию, что позволяет выявить доминантные и субординантные стратегии поведения.
Классический подход к анализу таких записей выглядит так:
-
Использование ПО BORIS (Behavioral Observation Research Interactive Software) с назначением горячих клавиш для каждого типа поведения (груминг, атака, вертикальная стойка).
-
Просмотр видео на замедленной скорости (0,3x–0,5x), так как высокая динамика движений мышей не позволяет фиксировать их в реальном времени.
-
Ручная фиксация каждого эпизода.
Учитывая объем текущего исследования (90+ часов видео), ручной труд поглощает ресурс, который должен быть направлен на молекулярно-генетическую аналитику и написание научных работ.
Пример такого видео
Наша цель заключалась в создании pipeline-решения, способного автоматически классифицировать поведение животных на видео, освобождая исследователей от монотонных операций.
Решение: синергия данных и кода
Для обучения ML-модели потребовался качественный размеченный датасет. Эту задачу взяла на себя команда Yandex Crowd Solutions, а настройку и дообучение алгоритмов — специалисты Yandex Cloud.
Разметка: создание эталонного набора данных
Специфика биомедицинской задачи потребовала привлечения асессоров с высоким уровнем компетенций, способных различать нюансы: например, отличать гигиенический груминг от простого почесывания. Использование экспертных исполнителей с биологическим бэкграундом позволило оперативно приступить к работе без длительного обучения.
Мы разработали специализированный интерфейс для анализа поведения мышей, минимизирующий лишние действия:

-
Эргономика управления: Выбор действия и автоматическое прерывание записи при отведении курсора из области видео позволяют экономить доли секунд на каждом клике, в сумме давая колоссальный прирост эффективности.
-
Автоматизация таймингов: Система фиксирует временные интервалы с миллисекундной точностью, исключая ошибки ввода.
-
Результативность: Скорость разметки возросла в 3–4 раза; то, на что ранее уходил час, теперь занимает 15–20 минут.
Итогом стала структурированная таблица, готовая для обучения нейросетевых архитектур.
ML: от детекции «скелета» к классификации паттернов
Задача ML-команды состояла в трансформации видеопотока в таблицу поведенческих актов. Мы разделили процесс на два этапа: трекинг (позиционирование частей тела) и классификацию (распознавание действий).
Шаг 1. Детекция скелета — DeepLabCut
В качестве базы мы использовали DeepLabCut — индустриальный стандарт в анализе поведения животных. Режим superanimal позволил нам эффективно определять ключевые точки (нос, конечности, основание хвоста) без необходимости обучения модели с чистого листа под каждую камеру.
Шаг 2. Нормализация данных
Данные, полученные из DeepLabCut, были преобразованы в понятный табличный формат (Pandas DataFrame) с очисткой от избыточной структуры координат для каждого животного.
Шаг 3. Классификация поведения
Для предсказания действий мы применили классификатор на базе XGBoost. Мы намеренно отказались от попыток создания «единой нейросети» для всего видео в пользу последовательной схемы: DeepLabCut преобразует видео в геометрию тела, а классификатор интерпретирует эти данные. Это обеспечивает высокую интерпретируемость и надежность.
Шаг 4. Геометрическое зонирование
Определение зон (интерактивная, периферическая, ближняя) реализовано через анализ координат носа относительно фиксированных порогов. Это прозрачный и легко контролируемый метод для стационарных лабораторных установок.
Шаг 5. Стабилизация предсказаний
Для устранения дрожания меток (шума) мы внедрили алгоритмы сглаживания «скользящим окном» и фильтрацию коротких эпизодов, которые статистически являются помехами. Итоговый отчет представляет собой последовательность логических эпизодов с точной временной привязкой.
Шаг 6. Визуализация и интерфейс
Результаты накладываются поверх видео с помощью OpenCV, что позволяет исследователям визуально верифицировать точность работы алгоритма. Веб-интерфейс, построенный на базе MoviePy, упрощает загрузку и обработку видеофайлов, делая инструмент доступным для широкого круга сотрудников без глубоких познаний в Python.
Итог: технология на службе науки
Наш подход позволил сократить время обработки видео в разы, сэкономив ученым более 500 часов рутинной работы. Автоматизация не только ускоряет процесс, но и минимизирует «человеческий фактор», обеспечивая высокую точность и воспроизводимость данных.
В ближайших планах — масштабирование решения на сложные сценарии конфронтации и интеграция генеративных моделей для автоматического формирования текстовых описаний эксперимента. Данный проект доказывает: сочетание облачных вычислений и методов компьютерного зрения — ключ к освобождению ученых для решения по-настоящему важных исследовательских задач.


