В предыдущей публикации мы описывали разработку системы ExoLogica AI, предназначенной для глубокого анализа экзопланет. Тогда мы допустили неосторожное высказывание: «Машинное обучение в отрыве от физических законов — это не более чем генератор случайных чисел».
В комментариях специалисты уровня Senior Data Scientist справедливо подвергли нашу терминологию критике. Нам указали на то, что ML-модели не генерируют энтропию, а занимаются аппроксимацией вероятностных распределений. Основная проблема нашей ранней модели заключалась не в «случайности», а в отсутствии адекватного физического индуктивного смещения (inductive bias). Алгоритм попросту переобучался (overfitting) на группе каменистых планет, не имея представления об уравнениях состояния вещества.
Приняв конструктивную критику, мы пересмотрели архитектуру и реализовали полноценный Physics-Informed ML. Однако запуск обновленной гибридной модели (v2.0) вскрыл проблему куда более серьезную, чем несовершенство XGBoost.
Мы обнаружили, что общепринятый Индекс подобия Земле (ESI) систематически вводит исследователей в заблуждение.
В этой статье мы раскроем суть «Парадокса ESI», представим наш авторский индекс физической реализуемости (PRI) и покажем, как мы бросили вызов актуальному списку приоритетных целей телескопа «Джеймс Уэбб», сократив перечень из 9600 кандидатов до 37 действительно перспективных миров.
Культ, требующий переосмысления: Индекс ESI
Если вы следите за астрономическими новостями, то наверняка встречали заголовки: «Открыт двойник Земли! Индекс подобия ESI достигает 0.95!»
Индекс подобия Земле (Earth Similarity Index) — это негласный стандарт в астробиологии, предложенный в 2011 году. Его расчет базируется на следующей зависимости:
где Rp — радиус экзопланеты, а Teq — её равновесная температура.
Заметили ли вы фундаментальное упущение в этой формуле? Данный индекс оперирует исключительно геометрическими параметрами и температурой. Он игнорирует внутренний состав объекта: будь то силикатная порода, лед, газ или чистый металл.
Рассмотрим «эталонного» кандидата из архивов: KOI-4878 b.
-
Радиус: 1.04 земного.
-
Температура: 246 K (-27 °C).
-
Показатель ESI = 0.972.
Перед нами практически идеальный геометрический клон нашей планеты. Но стоит ли спешить с выводами о его обитаемости?
Техническая экспертиза: симбиоз ML и физики
Для KOI-4878 b (как и для большинства планет, обнаруженных транзитным методом) известен только радиус. Для оценки массы мы применили наш ансамбль моделей на базе XGBoostRegressor, обученный на верифицированных астрофизических данных. Мы также внедрили расчет 95% доверительных интервалов для адекватной работы с эпистемической неопределенностью (epistemic uncertainty), на чем настаивало сообщество в комментариях.
Прогноз массы от XGBoost составил 1.71 M⊕.
Далее в расчет вступает классическая физика плотности:
Плотность этого «близнеца» оказалась равной 8.40 г/см³. Для сравнения: плотность железа составляет 7.87 г/см³. KOI-4878 b — это не цветущий мир, а колоссальное железное ядро с поверхностной гравитацией 15.56 м/с², условия на котором исключают привычные формы жизни.
Мы определили это явление как Парадокс ESI: планета с высочайшим внешним сходством может быть физически непригодна для жизни из-за экстремального внутреннего состава. Подобных «лже-земель» в каталогах выявлено множество.

Решение проблемы: Индекс физической реализуемости (PRI)
Чтобы исключить «галлюцинации» нейросетей и повысить достоверность классификации, мы разработали и интегрировали в пайплайн новый критерий — PRI (Physical Realizability Index).
Алгоритм оценки следующий: сначала рассчитывается эталонная плотность каменистого тела с учетом гравитационного сжатия (согласно эмпирическим моделям Сигера и соавторов):
Затем анализируется степень отклонения реальной (или предсказанной ИИ) плотности ρ от этого эталона:
Фундаментальное ограничение нашей архитектуры: если значение PRI опускается ниже 0.50, объект автоматически дисквалифицируется из списка потенциально обитаемых, независимо от его рейтинга ESI.
Для KOI-4878 b целевая плотность должна была составить около 5.58 г/см³, однако фактические 8.40 г/см³ обрушили PRI до уровня 0.435. Система мгновенно присвоила объекту статус [Anomaly].
Масштабная ревизия: 9600 экзопланет сквозь фильтр PRI
Мы пропустили массив данных из крупнейших архивов (NASA Exoplanet Archive, ESA, ExoKyoto) через двойной фильтр: ESI ≥ 0.75 И PRI ≥ 0.50.
Итоги исследования заставляют пересмотреть текущие представления об обитаемости:
-
Классический подход (только ESI) выделял 127 перспективных кандидатов.
-
После верификации через PRI их число сократилось до 37.
Выяснилось, что 71% «топовых» объектов являются физическими аномалиями. При этом программа полностью автономно подтвердила статус ключевых целей NASA:
Сравнительный анализ: Выдача ExoLogica AI
|
Объект |
ESI |
PRI |
Плотность |
Заключение ИИ |
|
KOI-4878 b |
0.972 |
0.435 |
8.40 г/см³ |
❌ Металлическое ядро (Аномалия) |
|
TOI-700 d |
0.959 |
0.504 |
8.11 г/см³ |
❌ Критическое (Избыток железа) |
|
Kepler-442 b |
0.888 |
0.517 |
8.43 г/см³ |
❌ Критическое (Избыток железа) |
|
Proxima b |
0.923 |
0.981 |
5.72 г/см³ |
✅ Силикатный состав |
|
TRAPPIST-1 e |
0.919 |
0.905 |
4.90 г/см³ |
✅ Землеподобная структура |

Крах иллюзий: Пересмотр статуса TOI-700 d
Обратите внимание на проблемные зоны в нашей таблице. Системы TOI-700 d и Kepler-442 b часто фигурируют в СМИ как океанические миры.
Однако наша модель Neuro-Physical Synthesis после реконструкции массы выносит им вердикт о непригодности. Мы выдвигаем гипотезу: будущие замеры лучевых скоростей покажут, что эти планеты — сверхплотные образования с доминирующим железным ядром. Прежде чем классифицировать их как «вторые Земли», необходимо дождаться наблюдательного подтверждения их реальной структуры.
Итоги
ML-моделирование без физического контекста ведет к опасным заблуждениям. Но и классические метрики вроде ESI создают лишь иллюзию сходства.
Один час работы телескопа JWST оценивается примерно в $60 000. Наведение столь дорогостоящего прибора на планету с ESI 0.97, которая в действительности является раскаленным слитком железа — это нерациональное использование ресурсов. Интеграция машинного обучения и фундаментальной физики уже сегодня позволяет оптимизировать стратегию поиска внеземной жизни.
Материалы для изучения:
-
База данных NASA Exoplanet Archive.
-
Научная работа: A Two-Tiered Approach to Assessing the Habitability of Exoplanets (2011).
-
The Priority Exoplanet List — приоритеты для JWST.
P.S. Мы открыты для сотрудничества со специалистами в области астрометрии для тестирования списков кандидатов через алгоритмы ExoLogica AI v2.0.
P.P.S. Выражаем благодарность сообществу за конструктивную критику первой версии архитектуры. Именно замечания об индуктивном смещении позволили нам углубиться в проблему и выявить Парадокс ESI.


