Специализированная версия ChatGPT для медицинских специалистов стала доступна в США — бесплатно для верифицированных врачей, медсестёр с расширенной клинической квалификацией, фельдшеров и фармацевтов. Одновременно OpenAI опубликовала результаты нового benchmark HealthBench Professional, согласно которым GPT-5.4 в клинической среде превзошёл живых докторов даже при условии, что те работали без ограничений по времени и с полным доступом в интернет.

HealthBench Professional оценивает модели по трём направлениям: клинические консультации, медицинская документация и исследовательская работа с литературой. Около трети примеров получены через «красное тестирование» — врачи целенаправленно искали слабые места моделей, а наиболее сложные сценарии представлены в выборке в 3,5 раза чаще обычного. GPT-5.4 в среде ChatGPT for Clinicians набрал 59,0 баллов; врачи — 43,7. Базовая версия GPT-5.4 без клинической настройки показала 48,1, Claude Opus 4.7 от Anthropic — 47,0, Gemini 3.1 Pro от Google — 43,8, Grok 4.2 от xAI — 36,1. Разрыв в 11 пунктов между клинической и базовой версиями GPT-5.4 указывает на то, что специализированная настройка среды существенно влияет на результат, хотя точное соотношение вклада настройки и методологии benchmark остаётся неясным.

Здесь есть очевидная оговорка: OpenAI сама разработала benchmark и тестировала на нём собственные модели. Компания ссылается на независимые оценки — Stanford MedHELM и MedMarks, где модели OpenAI также занимают верхние строчки, — и публикует данные benchmark в открытом доступе. До запуска врачи протестировали 6 924 диалога в реальной клинической работе: 99,6% ответов были признаны безопасными и точными. В подвыборке из 355 примеров, где три независимых врача указывали корректные источники, ChatGPT for Clinicians цитировал их чаще, чем сами доктора. Суммарно более 700 000 ответов модели прошли врачебную проверку.

Конкуренты отстают: Claude Opus 4.7 — 47,0, Gemini 3.1 Pro — 43,8, Grok 4.2 — 36,1.

Image description
Image description · Источник: The Decoder

Инструмент включает клинический поиск по миллионам рецензируемых публикаций с цитированием в реальном времени, функцию углублённого анализа медицинской литературы и «навыки» — шаблоны для повторяющихся задач вроде направлений, предварительных авторизаций или инструкций для пациентов. Необычная деталь: исследовательская работа в ChatGPT for Clinicians может засчитываться как непрерывное медицинское образование (CME) в США. Разговоры не используются для обучения моделей; для работы с персональными медицинскими данными доступно соглашение о деловом партнёрстве по HIPAA.

Запуск происходит на фоне быстрого роста использования ИИ в медицине. По данным опроса Американской медицинской ассоциации 2026 года, 72% врачей в США применяют ИИ в клинической практике — против 48% годом ранее. OpenAI сообщает, что миллионы медицинских специалистов по всему миру уже используют ChatGPT еженедельно, а использование за последний год удвоилось. Ранее компания запустила ChatGPT for Healthcare для организаций — с административными инструментами и соответствием требованиям на уровне учреждений. Anthropic, Microsoft и Google также активно развивают медицинские направления: Google через подразделение DeepMind делает акцент на разработке лекарств. Международное расширение ChatGPT for Clinicians запланировано, пилотные проекты за пределами США ведутся совместно с Better Evidence Network.