Национальный исследовательский ресурс по искусственному интеллекту (NAIRR) — пилотная программа Национального научного фонда США, запущенная два года назад. За это время она профинансировала более 700 проектов, предоставив учёным доступ к вычислительной инфраструктуре NVIDIA. Каждый проект получает минимум четыре узла DGX с гарантированным доступом на месяц и техническую поддержку от NVIDIA. Это позволяет резко сократить сроки исследований в таких областях, как медицина, сельское хозяйство и энергетика.
Один из проектов — Polymathic ИИ, международный консорциум учёных из Института Флэтайрон, Кембриджского университета и Национальной лаборатории Лоуренса Беркли. С помощью GPU NVIDIA и технологии NVLink они создали масштабный датасет Well для симуляции поведения жидкостей. На его основе строится фундаментальная модель Walrus, которая станет крупнейшей открытой моделью для прогнозирования гидродинамики. Модель, данные и код опубликованы в открытом доступе. Polymathic ИИ планирует изучить законы масштабирования для ускорения разработки подобных моделей.
| Проект | Организация | Цель | Используемая технология |
|---|---|---|---|
| Polymathic AI | Flatiron Institute, Cambridge, LBNL | Создание фундаментальной модели для симуляции жидкостей | NVIDIA DGX, NVLink, датасет Well |
| MIST + LLM фьюжн | University of Michigan | Поиск материалов для энергоносителей | MIST, токенизатор Smirk, LLM, DGX |
| BEACON | Boston University | Мониторинг вспышек инфекций с помощью ИИ | LLM, HealthMap, NVIDIA accelerated compute |
Второй проект — Университет Мичигана под руководством профессора Венката Вишванатана. Исследователи разрабатывают гибридную структуру, объединяющую доменно-специфичную молекулярную модель MIST и большие языковые модели общего назначения. MIST предобучена на неразмеченных молекулярных данных с использованием токенизатора Smirk, который учитывает ядерные, электронные и стереохимические свойства. Модель уже прошла тонкую настройку на более чем 400 структурно-свойственных зависимостях и превосходит существующие решения в задачах электрохимии и квантовой химии. Разработка велась на кластере из 40 GPU DGX, выделенном по программе NAIRR, и дополнительно на 200 000 GPU-часах суперкомпьютера Polaris.
Polymathic ИИ разрабатывает фундаментальную модель Walrus для физических симуляций на основе датасета Well.
Третий проект — Бостонский университет. Центр вычислительных исследований и Центр по изучению новых инфекционных заболеваний создают ИИ-конвейер BEACON (Biothreats Emergence, Analysis and Communications Network). Он обучает большую языковую модель на корпусе документов об инфекционных заболеваниях и патогенах. Модель будет анализировать глобальные данные из платформы HealthMap, новостей и соцсетей, чтобы генерировать сводки о вспышках. Это поможет экспертам быстрее реагировать на угрозы.
Все три проекта демонстрируют, как специализированное оборудование NVIDIA позволяет решать задачи, требующие огромных вычислительных ресурсов. Программа NAIRR продолжает расширяться, и в будущем возможно её превращение из пилотной в постоянную.



