Доцент Корнеллского университета Иммануэль Труммер выпустил книгу «Анализ данных с LLM. Текст, таблицы, изображения и аудио», посвящённую интеграции больших языковых моделей (LLM) в повседневную работу специалиста по данным. В книге рассматриваются методы обработки текстовых, табличных, графовых данных, изображений и видео с помощью запросов на естественном языке и нескольких строк кода на Python. Труммер демонстрирует использование библиотеки OpenAI для Python, а также инструментов LangChain и LlamaIndex. Отдельные главы посвящены моделям от Anthropic, Cohere и Hugging Face. Читатели научатся получать структурированные и неструктурированные данные, анализировать звук и изображения, а также оптимизировать затраты и качество анализа.

Книга охватывает такие темы, как классификация, кластеризация, преобразование и анализ мультимодальных данных, создание интерфейсов запросов на естественном языке для работы со структурированными источниками, а также создание агентов на основе LLM для автономного анализа данных. Особое внимание уделяется промпт-инжинирингу и настройке моделей. Издание рассчитано на разработчиков программного обеспечения, специалистов по работе с данными и всех, кто интересуется использованием LLM для анализа данных. Для чтения достаточно базового опыта программирования на Python.

Эксперты высоко оценили книгу. Орен Этциони из Института искусственного интеллекта Аллена назвал её «весьма содержательной и практической». Эндрю Карр из Cartwheel отметил, что книга «глубоко исследует интереснейшие области, которые другие книги обходят стороной». Адитья Парамесваран из Калифорнийского университета в Беркли подчеркнул, что книга «поможет сделать LLM незаменимым инструментом для обработки любых данных». Сумит Бхаттачарья из TELUS Health назвал издание «ценным источником знаний».

Автор показывает интеграцию инструментов LangChain, LlamaIndex и моделей OpenAI, Anthropic, Cohere, Hugging Face.

Автор — доцент факультета компьютерных наук Корнеллского университета, его исследования находятся на стыке анализа данных и машинного обучения. Труммер имеет ряд награждённых публикаций и сотрудничает с компаниями. Его видеоуроки на YouTube набрали более миллиона просмотров.