Группа из 21 учёного — сотрудников NASA, Калтеха, Института SETI, Университета Карнеги-Меллон и других организаций — опубликовала обзорную статью по итогам воркшопа, прошедшего в феврале 2025 года в Исследовательском центре Эймса. Документ описывает, как фундаментальные модели машинного обучения могут изменить подход к одной из самых амбициозных задач науки — поиску свидетельств жизни за пределами Земли.
Фундаментальные модели (Foundation Models) — это нейросети, обученные на очень больших и разнородных наборах данных с огромным числом параметров. Их ключевое свойство — универсальность: однажды обученная модель может быть адаптирована для множества прикладных задач с относительно небольшими вычислительными затратами и без необходимости глубокой экспертизы в машинном обучении. Именно эта гибкость делает их привлекательными для астробиологии, где данные поступают из принципиально разных источников — от масс-спектрометров на марсоходах до телескопических наблюдений атмосфер экзопланет.
| Документ | Цель/Задача/Рекомендация | Подробности | Соответствие результатам семинара |
|---|---|---|---|
| Стратегия SMD по управлению данными и вычислениями для прорывной науки 2019–2024 | №5 | «[…]настоятельно рекомендовать сотрудничество и кооперацию специалистов по работе с данными в академических кругах, промышленности и других сферах для обеспечения междисциплинарных научных открытий.» | Наши участники представляют собой смесь астробиологов и специалистов по обработке данных. Мы считаем такое сотрудничество необходимым для полного понимания проблем и решений, связанных с реализацией фундаментальных моделей. |
| Стратегия SMD по управлению данными и вычислениями для прорывной науки 2019–2024 | №11 | «[…]стимулировать и обучать сообщество использованию ИИ/МО для нового подхода к науке[…]» | Фундаментальные модели представляют собой новый подход на основе ИИ/МО к астробиологии, который может применяться к различным методам анализа и инструментам (например, масс-спектрометрия, газовые хроматографы). |
| «Истоки, миры и жизнь»: Десятилетняя стратегия по планетологии и астробиологии 2023–2032 | Область технологий общего назначения: автономность | «[…]выполнять запланированные операции в рамках удаленных, но сложных планетологических и астробиологических миссий. Машинное обучение и искусственный интеллект могут поддержать внедрение автономности в таких условиях.» | Одним из потенциальных применений фундаментальной модели является принятие решений и их выполнение на месте в ходе планетарных миссий. |
Проблема, которую авторы ставят в центр работы, — многомерность и мультимодальность астробиологических данных. Жизнь как явление проявляется одновременно на нескольких масштабах: атомном и молекулярном, клеточном, организменном и планетарном. На каждом уровне — свои типы данных, свои методы измерения и своя логика интерпретации. Классические алгоритмы машинного обучения плохо справляются с интеграцией таких разрозненных потоков. Фундаментальные модели, по мнению авторов, способны кодировать «латентное пространство» этих данных — то есть выявлять скрытые закономерности, которые могут соответствовать фундаментальным свойствам живых систем.
NASA уже разрабатывает несколько таких моделей: LLM Goddard, INDUS и геопространственную модель Prithvi; ESA создала TerraMind.

NASA уже ведёт разработку подобных моделей в нескольких подразделениях Директората научных миссий. Среди них — большие языковые модели NASA Goddard и INDUS, а также геопространственная фундаментальная модель Prithvi. Европейское космическое агентство (ESA) в рамках инициатив по наблюдению Земли создало модель TerraMind. Авторы статьи рассматривают эти разработки как инфраструктурную основу, на которой можно строить специализированные астробиологические приложения.
Воркшоп определил три основных направления применения: обнаружение биосигнатур — химических, физических или иных признаков жизни в данных с планет и их атмосфер; поддержка планирования и проведения космических миссий; обработка научной литературы и интеграция исследовательских данных с помощью инструментов обработки естественного языка. Существующие примеры применения ИИ в астробиологии уже включают анализ молекулярной сложности органических соединений, изучение экологических биосигнатур в экстремальных земных средах и автоматическое обнаружение экзопланет.
Авторы подчёркивают, что объём астробиологически значимых данных продолжает расти — за счёт полевых экспедиций, лабораторных экспериментов и численного моделирования. По их оценке, без инструментов ИИ интеграция этих потоков становится практически невозможной. Статья позиционируется как первая в серии: последующие работы должны детализировать архитектуру и обучающие данные для специализированной астробиологической фундаментальной модели.



