За привычным интерфейсом ChatGPT стоит многоуровневая система, которую OpenAI описала в своём вводном материале по основам ИИ. Понять её устройство полезно даже тем, кто не пишет код: это помогает грамотнее формулировать запросы и выбирать подходящий инструмент.

Искусственный интеллект — широкая категория программного обеспечения, способного распознавать паттерны, учиться на данных и производить полезные результаты. Внутри этой категории существуют модели — обученные системы, применяющие усвоенные закономерности к новым ситуациям. Среди них выделяются большие языковые модели (LLM): они специализируются на тексте и составляют основу таких продуктов, как ChatGPT. Принципиальный момент: LLM не хранит факты в памяти, как человек. Она вычисляет наиболее вероятное продолжение текста, опираясь на контекст запроса.

Обучение любой LLM проходит в два этапа. На первом — предобучении — модель обрабатывает колоссальные объёмы текста из разных источников и усваивает общие языковые паттерны: умение резюмировать, переводить, объяснять, составлять тексты. Это можно сравнить с новым сотрудником, который несколько недель изучает всю доступную документацию компании. На втором этапе — постобучении — модель учится точнее следовать инструкциям, выдерживать нужный тон и корректно реагировать на чувствительные темы. Именно здесь закладываются механизмы безопасности: модель учится избегать вредоносных ответов и проявлять осторожность в неоднозначных ситуациях. Этим объясняется, почему при обновлениях модели пользователи иногда замечают изменения в её поведении.

Academy > Applications of AI > Cover Image
Academy > Applications of AI > Cover Image · Источник: OpenAI News

Современные модели делятся на два функциональных класса. Быстрые модели (в интерфейсе ChatGPT они обозначены как Instant) оптимизированы для скорости и плавности: они хорошо справляются с черновиками, перефразированием, брейнштормингом и извлечением ключевых тезисов. Рассуждающие модели (Thinking) тратят больше вычислительных ресурсов на пошаговый анализ задачи перед ответом — это повышает надёжность при планировании, сложной отладке кода или принятии решений с множеством ограничений. По умолчанию ChatGPT переключается между режимами автоматически, так что начинающему пользователю не нужно вникать в эти настройки сразу.

OpenAI и другие исследовательские лаборатории делают свои модели доступными двумя способами: через пользовательские продукты вроде ChatGPT и через API — программный интерфейс, позволяющий разработчикам встраивать те же модели в собственные приложения. Новые версии моделей выходят после прохождения внутреннего тестирования и проверки на безопасность. Конкуренты OpenAI — Anthropic с семейством Claude, Google с Gemini и Meta с открытыми моделями Llama — используют схожую двухэтапную схему обучения, хотя детали постобучения у каждой лаборатории свои.

Для практического применения из этого следует простое правило: чем точнее сформулированы цель, аудитория, формат и ограничения запроса, тем предсказуемее результат — особенно при переходе между версиями модели. Режим Thinking имеет смысл включать тогда, когда задача многошаговая или цена ошибки высока; для повседневных текстовых задач достаточно стандартного режима.