Национальный исследовательский ресурс по искусственному интеллекту (NAIRR) — пилотная программа Национального научного фонда США, запущенная два года назад. За это время она профинансировала более 700 проектов, предоставив учёным доступ к вычислительной инфраструктуре NVIDIA. Каждый проект получает минимум четыре узла DGX с гарантированным доступом на месяц и техническую поддержку от NVIDIA. Это позволяет резко сократить сроки исследований в таких областях, как медицина, сельское хозяйство и энергетика.

Один из проектов — Polymathic ИИ, международный консорциум учёных из Института Флэтайрон, Кембриджского университета и Национальной лаборатории Лоуренса Беркли. С помощью GPU NVIDIA и технологии NVLink они создали масштабный датасет Well для симуляции поведения жидкостей. На его основе строится фундаментальная модель Walrus, которая станет крупнейшей открытой моделью для прогнозирования гидродинамики. Модель, данные и код опубликованы в открытом доступе. Polymathic ИИ планирует изучить законы масштабирования для ускорения разработки подобных моделей.

ПроектОрганизацияЦельИспользуемая технология
Polymathic AIFlatiron Institute, Cambridge, LBNLСоздание фундаментальной модели для симуляции жидкостейNVIDIA DGX, NVLink, датасет Well
MIST + LLM фьюжнUniversity of MichiganПоиск материалов для энергоносителейMIST, токенизатор Smirk, LLM, DGX
BEACONBoston UniversityМониторинг вспышек инфекций с помощью ИИLLM, HealthMap, NVIDIA accelerated compute

Второй проект — Университет Мичигана под руководством профессора Венката Вишванатана. Исследователи разрабатывают гибридную структуру, объединяющую доменно-специфичную молекулярную модель MIST и большие языковые модели общего назначения. MIST предобучена на неразмеченных молекулярных данных с использованием токенизатора Smirk, который учитывает ядерные, электронные и стереохимические свойства. Модель уже прошла тонкую настройку на более чем 400 структурно-свойственных зависимостях и превосходит существующие решения в задачах электрохимии и квантовой химии. Разработка велась на кластере из 40 GPU DGX, выделенном по программе NAIRR, и дополнительно на 200 000 GPU-часах суперкомпьютера Polaris.

Polymathic ИИ разрабатывает фундаментальную модель Walrus для физических симуляций на основе датасета Well.

Третий проект — Бостонский университет. Центр вычислительных исследований и Центр по изучению новых инфекционных заболеваний создают ИИ-конвейер BEACON (Biothreats Emergence, Analysis and Communications Network). Он обучает большую языковую модель на корпусе документов об инфекционных заболеваниях и патогенах. Модель будет анализировать глобальные данные из платформы HealthMap, новостей и соцсетей, чтобы генерировать сводки о вспышках. Это поможет экспертам быстрее реагировать на угрозы.

Все три проекта демонстрируют, как специализированное оборудование NVIDIA позволяет решать задачи, требующие огромных вычислительных ресурсов. Программа NAIRR продолжает расширяться, и в будущем возможно её превращение из пилотной в постоянную.