На одном из российских металлургических предприятий запущена корпоративная LLM-система, которая анализирует аудиозаписи инструктажей по охране труда и выявляет пробелы в содержании. Ядро системы — модель Gemma 3, третья версия малой языковой модели от Google, вышедшая 12 марта 2025 года. Модель выбрана в том числе потому, что оптимизирована для работы на серверах с базовыми GPU — без дорогостоящей инфраструктуры.

Металлургия — одна из наиболее травмоопасных отраслей: горячие процессы, плавка и разливка металла, перемещение массивных заготовок и вагонеток создают постоянный риск ожогов, механических повреждений и аварий. Инструктажи по охране труда здесь обязательны и фиксируются в журнале, однако традиционный контроль сводился к проверке самого факта проведения беседы. Содержание устного разговора при этом никто системно не анализировал: формулировки в журнале могли кочевать из записи в запись, а реальная глубина проработки рисков оставалась неизвестной.

Технически процесс выстроен как сквозной цифровой конвейер. Запись инструктажа — со стационарного оборудования, носимых устройств или заводской системы видеонаблюдения — загружается в защищённый веб-интерфейс корпоративной сети вручную или автоматически. Модуль ASR (автоматическое распознавание речи) выделяет нужный фрагмент, сегментирует речь, расшифровывает профессиональный сленг и формирует текст с временны́ми метками. Этот текст поступает в Gemma 3, которая оценивает его в контексте производственного участка, типа инструктажа и состава бригады.

Аудиозапись инструктажа проходит через модуль ASR: расшифровка, сегментация речи, временны́е метки — затем текст поступает в LLM.

Оценка строится на отраслевой базе знаний, привязанной к конкретному предприятию. База включает ключевые термины по каждому цеху и агрегату, перечень типовых опасностей (ожоги, выбросы расплава, поражение движущимися механизмами, падение заготовок, удар электрическим током), обязательные пункты внутренних регламентов, аварийные сценарии и порядок действий персонала. Анализ не ограничивается поиском ключевых слов — модель оценивает контекст и логику изложения. По итогам формируется структурированный отчёт, доступный в веб-интерфейсе и пригодный для внутреннего аудита.

Практическое значение системы — в переходе от эпизодического контроля к постоянному и масштабируемому. Раньше качество инструктажа можно было оценить только при личном присутствии старшего инструктора, что по определению не охватывало все смены и участки. Теперь каждая запись проходит одинаковую проверку независимо от того, кто и когда проводил инструктаж. База знаний обновляется по мере изменения регламентов, что позволяет системе учитывать новые требования к оборудованию и технологиям без ручной перенастройки логики анализа.