Крах индекса обитаемости: парадокс ESI и 9600 ложных миров в объективе Physics-Informed ML

В предыдущей публикации мы описывали разработку системы ExoLogica AI, предназначенной для глубокого анализа экзопланет. Тогда мы допустили неосторожное высказывание: «Машинное обучение в отрыве от физических законов — это не более чем генератор случайных чисел».

В комментариях специалисты уровня Senior Data Scientist справедливо подвергли нашу терминологию критике. Нам указали на то, что ML-модели не генерируют энтропию, а занимаются аппроксимацией вероятностных распределений. Основная проблема нашей ранней модели заключалась не в «случайности», а в отсутствии адекватного физического индуктивного смещения (inductive bias). Алгоритм попросту переобучался (overfitting) на группе каменистых планет, не имея представления об уравнениях состояния вещества.

Приняв конструктивную критику, мы пересмотрели архитектуру и реализовали полноценный Physics-Informed ML. Однако запуск обновленной гибридной модели (v2.0) вскрыл проблему куда более серьезную, чем несовершенство XGBoost.

Мы обнаружили, что общепринятый Индекс подобия Земле (ESI) систематически вводит исследователей в заблуждение.

В этой статье мы раскроем суть «Парадокса ESI», представим наш авторский индекс физической реализуемости (PRI) и покажем, как мы бросили вызов актуальному списку приоритетных целей телескопа «Джеймс Уэбб», сократив перечень из 9600 кандидатов до 37 действительно перспективных миров.

Культ, требующий переосмысления: Индекс ESI

Если вы следите за астрономическими новостями, то наверняка встречали заголовки: «Открыт двойник Земли! Индекс подобия ESI достигает 0.95!»

Индекс подобия Земле (Earth Similarity Index) — это негласный стандарт в астробиологии, предложенный в 2011 году. Его расчет базируется на следующей зависимости:

ESI = \left( 1 - \left| \frac{R_p - R_\oplus}{R_p + R_\oplus} \right| \right)^{0.57} \cdot \left( 1 - \left| \frac{T_{eq} - 255}{T_{eq} + 255} \right| \right)^{1.07}

где Rp — радиус экзопланеты, а Teq — её равновесная температура.

Заметили ли вы фундаментальное упущение в этой формуле? Данный индекс оперирует исключительно геометрическими параметрами и температурой. Он игнорирует внутренний состав объекта: будь то силикатная порода, лед, газ или чистый металл.

Рассмотрим «эталонного» кандидата из архивов: KOI-4878 b.

  • Радиус: 1.04 земного.

  • Температура: 246 K (-27 °C).

  • Показатель ESI = 0.972.

Перед нами практически идеальный геометрический клон нашей планеты. Но стоит ли спешить с выводами о его обитаемости?

Техническая экспертиза: симбиоз ML и физики

Для KOI-4878 b (как и для большинства планет, обнаруженных транзитным методом) известен только радиус. Для оценки массы мы применили наш ансамбль моделей на базе XGBoostRegressor, обученный на верифицированных астрофизических данных. Мы также внедрили расчет 95% доверительных интервалов для адекватной работы с эпистемической неопределенностью (epistemic uncertainty), на чем настаивало сообщество в комментариях.

Прогноз массы от XGBoost составил 1.71 M.

Далее в расчет вступает классическая физика плотности:

\rho = \frac{M}{V}

Плотность этого «близнеца» оказалась равной 8.40 г/см³. Для сравнения: плотность железа составляет 7.87 г/см³. KOI-4878 b — это не цветущий мир, а колоссальное железное ядро с поверхностной гравитацией 15.56 м/с², условия на котором исключают привычные формы жизни.

Мы определили это явление как Парадокс ESI: планета с высочайшим внешним сходством может быть физически непригодна для жизни из-за экстремального внутреннего состава. Подобных «лже-земель» в каталогах выявлено множество.

Технический паспорт объекта KOI-4878 b, сформированный ExoLogica AI. Математические расчеты опровергают гипотезы об обитаемости.
Технический паспорт объекта KOI-4878 b, сформированный ExoLogica AI. Математические расчеты опровергают гипотезы об обитаемости.

Решение проблемы: Индекс физической реализуемости (PRI)

Чтобы исключить «галлюцинации» нейросетей и повысить достоверность классификации, мы разработали и интегрировали в пайплайн новый критерий — PRI (Physical Realizability Index).

Алгоритм оценки следующий: сначала рассчитывается эталонная плотность каменистого тела с учетом гравитационного сжатия (согласно эмпирическим моделям Сигера и соавторов):

\rho_{rocky} = 5.51 \cdot R_p^{0.3}

Затем анализируется степень отклонения реальной (или предсказанной ИИ) плотности ρ от этого эталона:

PRI = 1 - \frac{|\rho - \rho_{rocky}|}{5.0}

Фундаментальное ограничение нашей архитектуры: если значение PRI опускается ниже 0.50, объект автоматически дисквалифицируется из списка потенциально обитаемых, независимо от его рейтинга ESI.

Для KOI-4878 b целевая плотность должна была составить около 5.58 г/см³, однако фактические 8.40 г/см³ обрушили PRI до уровня 0.435. Система мгновенно присвоила объекту статус [Anomaly].

Масштабная ревизия: 9600 экзопланет сквозь фильтр PRI

Мы пропустили массив данных из крупнейших архивов (NASA Exoplanet Archive, ESA, ExoKyoto) через двойной фильтр: ESI ≥ 0.75 И PRI ≥ 0.50.

Итоги исследования заставляют пересмотреть текущие представления об обитаемости:

  1. Классический подход (только ESI) выделял 127 перспективных кандидатов.

  2. После верификации через PRI их число сократилось до 37.

Выяснилось, что 71% «топовых» объектов являются физическими аномалиями. При этом программа полностью автономно подтвердила статус ключевых целей NASA:

Сравнительный анализ: Выдача ExoLogica AI

Объект

ESI

PRI

Плотность

Заключение ИИ

KOI-4878 b

0.972

0.435

8.40 г/см³

❌ Металлическое ядро (Аномалия)

TOI-700 d

0.959

0.504

8.11 г/см³

❌ Критическое (Избыток железа)

Kepler-442 b

0.888

0.517

8.43 г/см³

❌ Критическое (Избыток железа)

Proxima b

0.923

0.981

5.72 г/см³

✅ Силикатный состав

TRAPPIST-1 e

0.919

0.905

4.90 г/см³

✅ Землеподобная структура

Сводная таблица результатов ExoLogica AI v2.0. Красным отмечены ложные кандидаты с аномальной плотностью. Зеленым — физически обоснованные цели.
Сводная таблица результатов ExoLogica AI v2.0. Красным отмечены ложные кандидаты с аномальной плотностью. Зеленым — физически обоснованные цели.

Крах иллюзий: Пересмотр статуса TOI-700 d

Обратите внимание на проблемные зоны в нашей таблице. Системы TOI-700 d и Kepler-442 b часто фигурируют в СМИ как океанические миры.

Однако наша модель Neuro-Physical Synthesis после реконструкции массы выносит им вердикт о непригодности. Мы выдвигаем гипотезу: будущие замеры лучевых скоростей покажут, что эти планеты — сверхплотные образования с доминирующим железным ядром. Прежде чем классифицировать их как «вторые Земли», необходимо дождаться наблюдательного подтверждения их реальной структуры.

Итоги

ML-моделирование без физического контекста ведет к опасным заблуждениям. Но и классические метрики вроде ESI создают лишь иллюзию сходства.

Один час работы телескопа JWST оценивается примерно в $60 000. Наведение столь дорогостоящего прибора на планету с ESI 0.97, которая в действительности является раскаленным слитком железа — это нерациональное использование ресурсов. Интеграция машинного обучения и фундаментальной физики уже сегодня позволяет оптимизировать стратегию поиска внеземной жизни.

Материалы для изучения:

  1. База данных NASA Exoplanet Archive.

  2. Научная работа: A Two-Tiered Approach to Assessing the Habitability of Exoplanets (2011).

  3. The Priority Exoplanet List — приоритеты для JWST.

P.S. Мы открыты для сотрудничества со специалистами в области астрометрии для тестирования списков кандидатов через алгоритмы ExoLogica AI v2.0.

P.P.S. Выражаем благодарность сообществу за конструктивную критику первой версии архитектуры. Именно замечания об индуктивном смещении позволили нам углубиться в проблему и выявить Парадокс ESI.

 

Источник

Читайте также