Malakhov AI

Hugging Face Blog

15 материалов

AWS раскрыл архитектуру инфраструктуры для обучения и инференса больших моделей
ИсследованияКод

AWS раскрыл архитектуру инфраструктуры для обучения и инференса больших моделей

Как AWS соединяет GPU, сеть и хранилище для обучения фундаментальных моделей — технический разбор

Hugging Face Blog
2 дня назад
CyberSecQwen-4B: специализированная 4B-модель для киберзащиты обходит 8B-конкурента
ИсследованияКод

CyberSecQwen-4B: специализированная 4B-модель для киберзащиты обходит 8B-конкурента

4B-модель для SOC-аналитиков работает локально и обходит 8B-конкурента от Cisco на ключевых benchmark

Hugging Face Blog
5 дней назад
EMO: модель с 128 экспертами, где 12,5% заменяют целое
ИсследованияКод

EMO: модель с 128 экспертами, где 12,5% заменяют целое

Модель с 128 экспертами, где можно взять 16 — и почти не потерять в качестве

Hugging Face Blog
5 дней назад
LoRA-дообучение клинической модели на AMD MI300X без CUDA
ИсследованияКод

LoRA-дообучение клинической модели на AMD MI300X без CUDA

Медицинский ИИ на AMD без CUDA: LoRA-дообучение за 5 минут и три строки настройки

Hugging Face Blog
6 дней назад
Как миграция vLLM V0→V1 ломала обучение с подкреплением и как это починили
ИсследованияКод

Как миграция vLLM V0→V1 ломала обучение с подкреплением и как это починили

Четыре скрытых бага vLLM V1, которые ломали RL-обучение до того, как кто-то успевал тронуть алгоритм

Hugging Face Blog
6 мая
Gemma 4 на Jetson Orin Nano Super: голосовой ИИ-ассистент с камерой без облака
ИсследованияКод

Gemma 4 на Jetson Orin Nano Super: голосовой ИИ-ассистент с камерой без облака

Голосовой ассистент с камерой на $250 одноплатнике — без облака и без жёстко прописанной логики

Hugging Face Blog
22 апр.
Safetensors вошёл в PyTorch Foundation и получил нейтральное управление
ИсследованияКод

Safetensors вошёл в PyTorch Foundation и получил нейтральное управление

Safetensors уходит от Hugging Face к сообществу — что изменится для разработчиков моделей

Hugging Face Blog
8 апр.
Waypoint-1.5: генерация интерактивных миров в реальном времени на обычном GPU
ИсследованияКод

Waypoint-1.5: генерация интерактивных миров в реальном времени на обычном GPU

Интерактивный генеративный мир в реальном времени — теперь на домашнем GPU без дата-центра

Hugging Face Blog
9 апр.
HoloTab: расширение для Chrome управляет браузером вместо пользователя
ИсследованияКод

HoloTab: расширение для Chrome управляет браузером вместо пользователя

Расширение для Chrome само заходит на сайты, заполняет формы и собирает данные — покажи один раз, дальше оно справится само

Hugging Face Blog
15 апр.
VAKRA: как новый benchmark выявляет слабые места ИИ-агентов при работе с API
ИсследованияКод

VAKRA: как новый benchmark выявляет слабые места ИИ-агентов при работе с API

VAKRA тестирует ИИ-агентов на реальных API и документах — и большинство моделей проваливается

Hugging Face Blog
15 апр.
Sentence Transformers научили дообучать мультимодальные эмбеддинг-модели на своих данных
ИсследованияКод

Sentence Transformers научили дообучать мультимодальные эмбеддинг-модели на своих данных

Как дообучить мультимодальную модель и обойти конкурентов вчетверо крупнее — разбор на реальном примере

Hugging Face Blog
16 апр.
Hugging Face научил ИИ-агента портировать модели в MLX так, чтобы не злить ревьюеров
ИсследованияКод

Hugging Face научил ИИ-агента портировать модели в MLX так, чтобы не злить ревьюеров

Hugging Face сделал агента, который портирует модели в MLX и не раздражает ревьюеров — вот как это устроено

Hugging Face Blog
16 апр.
Ecom-RLVE: как обучают ИИ-агентов для интернет-магазинов через проверяемые награды
ИсследованияКод

Ecom-RLVE: как обучают ИИ-агентов для интернет-магазинов через проверяемые награды

Как научить ИИ собирать корзину без галлюцинаций — 8 сред и 12 осей сложности

Hugging Face Blog
16 апр.
NVIDIA обучила многоязычный OCR на 12 млн синтетических изображений и получила 34,7 стр/с
ИсследованияКод

NVIDIA обучила многоязычный OCR на 12 млн синтетических изображений и получила 34,7 стр/с

Как синтетические данные решили проблему многоязычного OCR там, где архитектура оказалась бессильна

Hugging Face Blog
17 апр.
NVIDIA выпустила GR00T N1.7 — открытую модель управления гуманоидными роботами
ИсследованияКод

NVIDIA выпустила GR00T N1.7 — открытую модель управления гуманоидными роботами

NVIDIA открыла модель для гуманоидных роботов: обучена на видео людей, готова к заводу

Hugging Face Blog
17 апр.