Python-симулятор JWST: как критика на Хабре помогла выучить астрофизику и подготовить открытие быстрее NASA

23 минуты назад

Некоторое время назад я представил сообществу свой ML-алгоритм, предназначенный для идентификации потенциально пригодных для жизни экзопланет. Результаты казались многообещающими — система уверенно выделяла перспективные объекты, однако в комментариях меня ожидала серьезная конструктивная критика.

Пользователь под ником Quiensabe высказал жесткие, но фундаментально обоснованные замечания: «Где проверка устойчивости модели при сдвиге распределения (distribution shift)? Как она функционирует без жестких физических рамок (ablation study)? Насколько достоверна калибровка 95-процентных интервалов, или это просто красивые цифры?».

Этот вызов заставил меня пересмотреть подход. Стало очевидно, что прямолинейное применение XGBoost к необработанным архивам NASA — путь в никуда. Физические процессы не подчиняются исключительно статистическим корреляциям, а машинное обучение в отрыве от физики часто порождает «бумажные» планеты с невозможными характеристиками.

После нескольких дней интенсивной работы, анализа профильных научных трудов (Zeng et al. 2016, Owen & Wu 2017) и проектирования сложной многоуровневой системы, я готов представить ExoLogica AI 2.0: Spectral Biosignature Engine.

**ExoLogica AI 2.0: Spectral Biosignature Engine**

Мы не просто обновили код. Мы разработали 14-этапный астрофизический конвейер, финальным звеном которого является генерация синтетических спектров пропускания, адаптированных под возможности телескопа «Джеймс Уэбб» (JWST). И, что принципиально важно, мы четко определили границы применимости нашей модели.

Часть 1. Работа над ошибками: Валидация и домен применимости (OOD)

Критика Quiensabe относительно «декоративности» доверительных интервалов в условиях OOD (Out-of-Distribution) попала в самую точку. Недостаточно просто получить низкую ошибку MSE на тестовой выборке в рамках Kaggle-подхода. В астрофизике данные редко бывают независимыми и одинаково распределенными (i.i.d.), поэтому важно понимать, когда модель перестает адекватно интерпретировать реальность.

Для решения этой задачи вся аналитическая часть была выделена в специализированный ValidationModule. Обратимся к конкретным метрикам.

1. Ablation Study: Что эффективнее — чистые алгоритмы или физика?

Скептики часто утверждают, что классическая эмпирика надежнее ML. Мы провели сравнительный тест на выборке каменистых экзопланет и мини-нептунов (Радиус < 6 R_⊕, Масса < 50 M_⊕), сопоставив три стратегии:

Physics Only (Chen & Kipping 2017): Традиционные формулы дают среднюю абсолютную ошибку MAE = 7.054 M_⊕. Для маломассивных миров такая погрешность критична.
Pure ML (XGBoost): Алгоритм без внешних ограничений точнее: MAE = 4.200 M_⊕. Однако он склонен предсказывать физически невозможные объекты, нарушающие пределы плотности твердых тел.
ML + Physics Clip (Наше гибридное решение): Модель, результаты которой ограничены байесовскими априорными вероятностями и законами физики плотности. Итог: MAE = 3.998 M_⊕.

Резюме: Интеграция физических констант в процесс обучения не только отсекает аномалии, но и повышает математическую точность прогнозов.

2. Distribution Shift: Когда модель теряет уверенность?

Мы проанализировали работу алгоритма в зависимости от спектрального класса родительской звезды. Результаты оказались весьма поучительными:

Для систем красных (M-класс) и оранжевых карликов (K-класс) точность великолепна: MAE 3.868 и 4.141 M_⊕ соответственно. Это крайне важно, так как именно эти звезды — приоритетные цели для поиска обитаемости.
На звездах типа нашего Солнца (G-класс) ошибка возрастает до 5.160.
В системах горячих звезд (F-класс) модель показывает слабые результаты: MAE прыгает до 8.039 (погрешность свыше 100%).

Мы признаем: пайплайн менее надежен для планет у массивных звезд из-за специфики фотоиспарения и дефицита качественных обучающих данных для таких систем.

3. Uncertainty Calibration: Достоверность прогнозов

Важно не просто заявить доверительный интервал ± 15%, но и подтвердить его валидность. Проверка на отложенной выборке показала, что реальные значения попадают в наш 95% коридор в 90.8% случаев. Несмотря на небольшую избыточную уверенность модели, для зашумленных астрофизических данных это очень высокий показатель надежности.

4. Domain of Applicability: Система контроля границ

Для предотвращения выдачи галлюцинаций мы внедрили модуль «Domain Checker». Он анализирует Z-score параметров в многомерном пространстве (орбитальные периоды, инсоляция и др.). Если вы попытаетесь рассчитать планету с характеристиками, радикально отличающимися от основной базы TESS/Kepler, система выдаст предупреждение Out-of-Distribution и снизит рейтинг доверия к результату.

Часть 3. Астрофизическое ядро: 14 этапов анализа

Первая итерация проекта была упрощенной. Теперь мы рассматриваем планету как сложную многослойную структуру. Ядро системы (PhysicsEngine и AtmosphereSimulator) было полностью переписано, и теперь каждый объект проходит через глубокий анализ, включающий 14 стадий.

Скрины разбора TOI-700 d. Продолжение скриншота

Ключевые аспекты обновленной физической модели:

1. Геофизика недр (Core Mass Fraction)

Используя уравнения состояния из работ Zeng et al. (2016), мы рассчитываем соотношение железного ядра (f_core) и силикатной мантии. Это критически важно для понимания возможности работы магнитного динамо. Планета без мощного ядра или с крайне медленным вращением обречена на потерю атмосферы.

2. Защита от звездного ветра

Для планет у красных карликов мы применяем модели Vidotto et al. (2015), сопоставляя давление звездной плазмы (P_sw) с магнитным сопротивлением планеты (P_mag). Если расчетная магнитопауза оказывается ниже поверхности, такая планета получает статус непригодной из-за радиационной стерилизации.

3. Моделирование атмосферных потерь

Мы больше не предполагаем наличие атмосферы по умолчанию. Газовый состав проверяется двумя фильтрами:

Тепловое убегание (Джинс): Оценка способности гравитации удерживать молекулы при заданной температуре.
Гидродинамическое фотоиспарение: На основе модели Owen & Wu (2017) мы рассчитываем потерю массы под воздействием XUV-излучения звезды на протяжении миллиардов лет.

4. Климатическая модель серой атмосферы

Зная состав сохранившихся газов, система рассчитывает оптическую толщу (τ_IR) для парниковых компонентов (CO₂, H₂O) и определяет реальную температуру поверхности (T_surf), отделяя потенциальные аналоги Земли от раскаленных миров венерианского типа.

5. Индекс CHI (Comprehensive Habitability Index)

Вместо упрощенного ESI мы ввели комплексный индекс CHI. Он учитывает не только физическое сходство с Землей, но и накладывает штрафы за приливный захват, отсутствие магнитного поля и избыточный приливный нагрев.

Часть 4. Инновация: Эмуляция спектров JWST и биосигнатуры

Современная астрономия перешла от простого измерения радиусов к анализу атмосфер через транзитную спектроскопию. Наш SpectralEngine позволяет моделировать то, что увидит телескоп «Джеймс Уэбб» при наблюдении конкретной планеты.

Принципы работы модуля:

Расчет шкалы высот (H): Определение вертикальной протяженности атмосферы на основе гравитации и температуры.

$H = \frac{k_B T_{surf}}{\mu g}$

Моделирование поглощения: Наложение профилей поглощения воды, метана и CO₂ для диапазона 0.6–12 мкм.
Добавление инструментального шума: Имитация погрешностей приборов NIRSpec и MIRI для получения реалистичной картины.

Рассмотрим пример TRAPPIST-1 e:

В спектре четко прослеживаются линии углекислого газа и озона. Сочетание окислителей и восстановителей (например, метана и кислорода) в одной атмосфере — это признак химического неравновесия, который является сильнейшим индикатором биологической активности. ExoLogica AI автоматически ищет такие аномалии.

Часть 5. Независимый рейтинг: 42 кандидата против списка Корнелла

Недавно ученые из Корнеллского университета представили список из 45 перспективных экзопланет. Мы решили сопоставить их выводы с результатами работы ExoLogica AI 2.0. Наш алгоритм, отфильтровав базу NASA, сформировал собственный список из 42 приоритетных объектов.

✅ Точки соприкосновения

Наши данные совпали с университетскими по ключевым целям, таким как TOI-700 d/e, TRAPPIST-1 d/e и Kepler-442 b. Эти миры действительно заслуживают пристального внимания телескопов.

❌ Расхождения и их причины

Ряд популярных объектов был исключен нашей моделью из списка «райских уголков»:

TRAPPIST-1 f и g: Согласно нашему симулятору, из-за ранней активности звезды и нехватки парниковых газов эти планеты превратились в безжизненные ледяные пустыни.
Proxima Centauri b: Мощный звездный ветер, вероятнее всего, полностью сорвал атмосферу с нашей ближайшей соседки.
LHS 1140 b: Наш анализ классифицирует этот объект как водный мир с экстремальным давлением, непригодным для привычной нам биохимии.

📋 Итоговый каталог ExoLogica AI (42 объекта)

Мы открыто публикуем список систем, успешно прошедших все этапы физической и ML-валидации. Именно здесь, по мнению алгоритма, шансы обнаружить жизнь наиболее высоки:

Приоритетные системы: Семейства TOI-700, TRAPPIST-1 (d, e), Kepler-442, Kepler-452, GJ 1061, Luyten’s Star b, Teegarden’s b.

Полные данные в формате CSV доступны для скачивания на Яндекс.Диске.

Заключение: Новая эра открытой науки

Этот проект доказывает, что современная наука перестает быть монополией закрытых институтов. Инструменты машинного обучения и открытые данные позволяют энтузиастам проводить исследования, сопоставимые по глубине с работой профессиональных групп.

Благодаря обратной связи от читателей SE7ENа, мы создали не просто скрипт, а полноценный исследовательский инструмент. В планах — выпуск автономного приложения для macOS и Windows, которое позволит любому желающему изучать экзопланеты через призму нашей модели.

Мы продолжаем ждать ваших замечаний и предложений. Только через критику и проверку гипотез мы сможем приблизиться к ответу на вопрос: одиноки ли мы во Вселенной?

Источник