Технический писатель из российской IT-команды опубликовал на Хабре результаты самостоятельного стилометрического эксперимента — после того как редакция одного из порталов отклонила его статью как «написанную с высокой долей вероятности с помощью ИИ». Автор собрал три корпуса по пять текстов: свои старые рекламные и сценарные материалы (до массового распространения ChatGPT), свои новые технические и продуктовые тексты, а также статьи, полностью сгенерированные GPT на похожие темы.

Для сравнения он использовал шесть стилистических признаков: среднюю длину предложения, «бурстность» (неровность ритма), долю вводных конструкций на 1000 слов, плотность технических терминов, частоту запятых и средних тире. Из этих признаков формировался вектор, а расстояние между корпусами считалось через косинусное сходство. Результат оказался неожиданным: косинусное расстояние между новыми текстами автора и ИИ-генерациями составило 0,03 — фактически вплотную. Расстояние между старыми и новыми текстами того же человека — 0,20, между старыми текстами и ИИ — 0,22.

МетрикаСтарые текстыНовые текстыИИ
Средняя длина предложения, слов11,413,611,3
Бурстность (неровность ритма)0,600,550,57
Вводные конструкции на 1000 слов3,31,915,2
Технические термины на 1000 слов3,964,485,8
Запятые на 1000 слов75,869,899,8
Средние тире на 1000 слов21,629,712,1

По отдельным метрикам различия есть: ИИ значительно чаще использует вводные конструкции (15,2 на 1000 слов против 1,9 у новых текстов автора), у ИИ выше плотность запятых (99,8 против 69,8), а автор заметно чаще ставит среднее тире (29,7 против 12,1). Но когда все признаки сводятся в один вектор, жанровое сходство перекрывает индивидуальные различия.

Старые рекламные тексты того же автора отстоят от ИИ на 0,22 — в семь раз дальше, чем технические.

Автор объясняет это устройством самого жанра. Хорошая техническая документация по определению стремится к ясности, структуре, единообразной терминологии и отсутствию авторского самовыражения — именно к тому, что языковые модели научились воспроизводить. Техписатель годами вырабатывает стиль, который «почти не виден», а потом оказывается, что этот невидимый стиль и есть то, что имитирует ИИ.

Проблема не нова и не ограничивается одним автором. В 2023 году несколько университетов обвиняли студентов в использовании ИИ на основании результатов детекторов GPTZero и Turnitin — часть обвинений впоследствии рассыпалась. OpenAI в том же году закрыла собственный ИИ-классификатор: он давал ложноположительные срабатывания в 9% случаев, то есть каждый одиннадцатый честный текст помечался как машинный. Для технической документации этот процент, по логике автора, должен быть ещё выше — жанр просто устроен так.

Автор формулирует ключевое различие через условные вероятности: вероятность того, что текст похож на ИИ-генерацию, не равна вероятности того, что текст написал ИИ. Первое — впечатление от поверхности, второе — факт о происхождении. Детекторы и читатели, как правило, оценивают первое и делают вывод о втором. Из этого следует парадоксальная мотивация: чтобы текст не приняли за машинный, нужно намеренно оставить в нём неровности — примерно как оставлять кривые места в коде, чтобы ревьюер убедился в человеческом авторстве. Автор считает такой подход деградацией профессионального стандарта.