404 Media опубликовал материал о группе профессоров американских университетов, которые обнаружили записи своих лекций в данных, использованных для обучения языковых моделей. По словам преподавателей, никто не обращался к ним за разрешением, а некоторые узнали о происходящем случайно — обнаружив свои фразы или характерные примеры в ответах ИИ-ассистентов.
Ситуация обнажает правовую неопределённость вокруг академических материалов. С одной стороны, многие лекции доступны публично — на YouTube, Coursera, MIT OpenCourseWare. С другой, это не означает разрешения на коммерческое использование: преподаватели сохраняют авторские права на своё содержание, даже если записи размещены в открытом доступе. В академической среде интеллектуальная собственность на лекции традиционно принадлежит преподавателю, а не университету.
ИИ-компании, краулящие открытый веб для формирования обучающих датасетов, попадают в эту зону риска массово. Механизма opt-out, сопоставимого с robots.txt для поисковиков, для обучающих данных де-факто не существует: указать свои материалы как «не использовать для обучения» технически возможно только через специальные атрибуты, которые мало кто знает и применяет.
Материалы использовались без разрешения авторов или согласования с университетами

Часть профессоров рассматривает судебные иски; другие присоединились к организациям, лоббирующим законодательное регулирование использования учебных материалов в тренировочных датасетах. На фоне нескольких крупных судебных дел 2025 года (The New York Times против OpenAI, Getty Images против Stability AI) академический сектор превращается в следующий фронт дискуссии об авторских правах и ИИ.
Для образовательных платформ этот случай означает необходимость пересмотра условий размещения: без чётких правил о допустимости использования их контента для обучения ИИ риски будут накапливаться у каждого преподавателя, разместившего материал онлайн.



