Андрей Бурков известен в ML-сообществе прежде всего благодаря «The Hundred-Page Machine Learning Book» — учебнику, который стал стандартом быстрого входа в профессию и был переведён на 12 языков. Новая книга «Языковые модели без лишних слов: Практика на PyTorch» продолжает ту же философию: минимум воды, максимум инженерии.
Бурков — доктор философии в области ИИ, руководитель ML-команд в Gartner и TalentNeuron. В своих интервью и еженедельной рассылке True Positive Weekly (более 20 000 подписчиков на Substack) он последовательно критикует хайп вокруг ИИ-агентов и позиционирует языковую модель как математическую функцию, а не магию. Эта установка определяет и структуру книги.
Материал выстроен последовательно: от градиентного спуска и нейронных сетей — через эмбеддинги (word2vec, GloVe, FastText, токенизация методом BPE) — к архитектуре трансформеров. Отдельно разобраны механизм самовнимания, многопотоковое внимание (multi-head attention), поворотные позиционные эмбеддинги RoPE и остаточные связи. Раздел о больших языковых моделях включает методы тонкой настройки — в том числе LoRA, — промпт-инжиниринг, управление генерацией через температуру, top-k и top-p, а также разбор практических проблем: галлюцинации, авторское право, этика. Финальные главы касаются продвинутых тем: Mixture of Experts, слияние моделей, сжатие, RLHF и визуально-языковые модели.
Каждая концепция сопровождается готовым кодом на PyTorch в формате Jupyter-блокнотов, запускаемых в Google Colab.
Каждая концепция сопровождается работающим кодом на PyTorch. Механизм самовнимания, который в академических текстах занимает десятки страниц формул, в книге реализован в виде класса Python из 15 строк — с пояснением, зачем нужна маска (masked_fill) и почему Rotary Position Embedding улучшает позиционные эмбеддинги по сравнению с классическим подходом. Блокноты Jupyter можно запустить бесплатно в Google Colab.
Предисловие написал Томаш Миколов — старший научный сотрудник Чешского института информатики, робототехники и кибернетики, создатель word2vec и FastText. Миколов начинал работу с нейронными языковыми моделями два десятилетия назад, когда это направление считалось тупиковым, и называет книгу Буркова оптимальной точкой входа для новичков. Среди других рецензентов — руководители Weaviate, MindsDB, Dataiku, Qdrant и LlamaIndex.
Книга адресована разработчикам, дата-сайентистам и ML-инженерам, которые хотят не просто вызывать API, а понимать устройство моделей и обучать их самостоятельно. По данным книжных сервисов, в 2025 году спрос на литературу об ИИ и LLM в России вырос кратно — книга выходит в момент, когда русскоязычная аудитория активно ищет структурированные технические источники. Издаётся в России издательством «БХВ».


