Malakhov AI

Hugging Face Blog

22 материала

Nemotron 30b не смог генерировать игры на Three.js: разбор провального эксперимента
ИсследованияКод

Nemotron 30b не смог генерировать игры на Three.js: разбор провального эксперимента

Что происходит, когда просишь LLM написать игру на Three.js: честный разбор провала с Nemotron 30b

Hugging Face Blog
7 июн.
Her: инструмент анализа сессий Claude Code на локальной модели Nemotron-Mini-4B
ИсследованияКод

Her: инструмент анализа сессий Claude Code на локальной модели Nemotron-Mini-4B

Зачем читать 4000 строк JSON вручную — Her сделает это за вас и найдёт, где агент сжёг бюджет

Hugging Face Blog
7 июн.
Четыре модели от разных лабораторий в одной экономической симуляции: как это устроено
ИсследованияКод

Четыре модели от разных лабораторий в одной экономической симуляции: как это устроено

Что происходит, когда агенты в одной симуляции думают на моделях от четырёх разных лабораторий

Hugging Face Blog
6 июн.
EVA-Bench 2.0: benchmark для голосовых ИИ-агентов расширился до 213 сценариев
ИсследованияКод

EVA-Bench 2.0: benchmark для голосовых ИИ-агентов расширился до 213 сценариев

Как оценить голосового ИИ-агента в корпоративной среде: 213 сценариев, три домена, open-source

Hugging Face Blog
4 июн.
Специализированная модель на 3 млрд параметров обошла топовые API по качеству
ИсследованияКод

Специализированная модель на 3 млрд параметров обошла топовые API по качеству

3 млрд параметров против GPT-5.4 и Claude Opus: специализация выиграла по всем трём метрикам

Hugging Face Blog
22 мая
OlmoEarth v1.1: спутниковый ИИ стал втрое дешевле без потери точности
ИсследованияКод

OlmoEarth v1.1: спутниковый ИИ стал втрое дешевле без потери точности

Allen ИИ сделала спутниковый ИИ втрое дешевле — как им удалось не потерять точность

Hugging Face Blog
19 мая
IBM выпустила мультиязычные эмбеддинг-модели Granite R2 на базе ModernBERT с контекстом
ИсследованияКод

IBM выпустила мультиязычные эмбеддинг-модели Granite R2 на базе ModernBERT с контекстом

IBM открыла мультиязычные эмбеддинги с 32K-контекстом: лучший результат в классе до 100M параметров

Hugging Face Blog
14 мая
AWS раскрыл архитектуру инфраструктуры для обучения и инференса больших моделей
ИсследованияКод

AWS раскрыл архитектуру инфраструктуры для обучения и инференса больших моделей

Как AWS соединяет GPU, сеть и хранилище для обучения фундаментальных моделей — технический разбор

Hugging Face Blog
11 мая
CyberSecQwen-4B: специализированная 4B-модель для киберзащиты обходит 8B-конкурента
ИсследованияКод

CyberSecQwen-4B: специализированная 4B-модель для киберзащиты обходит 8B-конкурента

4B-модель для SOC-аналитиков работает локально и обходит 8B-конкурента от Cisco на ключевых benchmark

Hugging Face Blog
8 мая
EMO: модель с 128 экспертами, где 12,5% заменяют целое
ИсследованияКод

EMO: модель с 128 экспертами, где 12,5% заменяют целое

Модель с 128 экспертами, где можно взять 16 — и почти не потерять в качестве

Hugging Face Blog
8 мая
LoRA-дообучение клинической модели на AMD MI300X без CUDA
ИсследованияКод

LoRA-дообучение клинической модели на AMD MI300X без CUDA

Медицинский ИИ на AMD без CUDA: LoRA-дообучение за 5 минут и три строки настройки

Hugging Face Blog
8 мая
Как миграция vLLM V0→V1 ломала обучение с подкреплением и как это починили
ИсследованияКод

Как миграция vLLM V0→V1 ломала обучение с подкреплением и как это починили

Четыре скрытых бага vLLM V1, которые ломали RL-обучение до того, как кто-то успевал тронуть алгоритм

Hugging Face Blog
6 мая
Gemma 4 на Jetson Orin Nano Super: голосовой ИИ-ассистент с камерой без облака
ИсследованияКод

Gemma 4 на Jetson Orin Nano Super: голосовой ИИ-ассистент с камерой без облака

Голосовой ассистент с камерой на $250 одноплатнике — без облака и без жёстко прописанной логики

Hugging Face Blog
22 апр.
Safetensors вошёл в PyTorch Foundation и получил нейтральное управление
ИсследованияКод

Safetensors вошёл в PyTorch Foundation и получил нейтральное управление

Safetensors уходит от Hugging Face к сообществу — что изменится для разработчиков моделей

Hugging Face Blog
8 апр.
Waypoint-1.5: генерация интерактивных миров в реальном времени на обычном GPU
ИсследованияКод

Waypoint-1.5: генерация интерактивных миров в реальном времени на обычном GPU

Интерактивный генеративный мир в реальном времени — теперь на домашнем GPU без дата-центра

Hugging Face Blog
9 апр.
HoloTab: расширение для Chrome управляет браузером вместо пользователя
ИсследованияКод

HoloTab: расширение для Chrome управляет браузером вместо пользователя

Расширение для Chrome само заходит на сайты, заполняет формы и собирает данные — покажи один раз, дальше оно справится само

Hugging Face Blog
15 апр.
VAKRA: как новый benchmark выявляет слабые места ИИ-агентов при работе с API
ИсследованияКод

VAKRA: как новый benchmark выявляет слабые места ИИ-агентов при работе с API

VAKRA тестирует ИИ-агентов на реальных API и документах — и большинство моделей проваливается

Hugging Face Blog
15 апр.
Sentence Transformers научили дообучать мультимодальные эмбеддинг-модели на своих данных
ИсследованияКод

Sentence Transformers научили дообучать мультимодальные эмбеддинг-модели на своих данных

Как дообучить мультимодальную модель и обойти конкурентов вчетверо крупнее — разбор на реальном примере

Hugging Face Blog
16 апр.
Hugging Face научил ИИ-агента портировать модели в MLX так, чтобы не злить ревьюеров
ИсследованияКод

Hugging Face научил ИИ-агента портировать модели в MLX так, чтобы не злить ревьюеров

Hugging Face сделал агента, который портирует модели в MLX и не раздражает ревьюеров — вот как это устроено

Hugging Face Blog
16 апр.
Ecom-RLVE: как обучают ИИ-агентов для интернет-магазинов через проверяемые награды
ИсследованияКод

Ecom-RLVE: как обучают ИИ-агентов для интернет-магазинов через проверяемые награды

Как научить ИИ собирать корзину без галлюцинаций — 8 сред и 12 осей сложности

Hugging Face Blog
16 апр.
NVIDIA обучила многоязычный OCR на 12 млн синтетических изображений и получила 34,7 стр/с
ИсследованияКод

NVIDIA обучила многоязычный OCR на 12 млн синтетических изображений и получила 34,7 стр/с

Как синтетические данные решили проблему многоязычного OCR там, где архитектура оказалась бессильна

Hugging Face Blog
17 апр.
NVIDIA выпустила GR00T N1.7 — открытую модель управления гуманоидными роботами
ИсследованияКод

NVIDIA выпустила GR00T N1.7 — открытую модель управления гуманоидными роботами

NVIDIA открыла модель для гуманоидных роботов: обучена на видео людей, готова к заводу

Hugging Face Blog
17 апр.