
AWS раскрыл архитектуру инфраструктуры для обучения и инференса больших моделей
Как AWS соединяет GPU, сеть и хранилище для обучения фундаментальных моделей — технический разбор
15 материалов

Как AWS соединяет GPU, сеть и хранилище для обучения фундаментальных моделей — технический разбор
4B-модель для SOC-аналитиков работает локально и обходит 8B-конкурента от Cisco на ключевых benchmark

Модель с 128 экспертами, где можно взять 16 — и почти не потерять в качестве
Медицинский ИИ на AMD без CUDA: LoRA-дообучение за 5 минут и три строки настройки
Четыре скрытых бага vLLM V1, которые ломали RL-обучение до того, как кто-то успевал тронуть алгоритм
Голосовой ассистент с камерой на $250 одноплатнике — без облака и без жёстко прописанной логики
Safetensors уходит от Hugging Face к сообществу — что изменится для разработчиков моделей

Интерактивный генеративный мир в реальном времени — теперь на домашнем GPU без дата-центра
Расширение для Chrome само заходит на сайты, заполняет формы и собирает данные — покажи один раз, дальше оно справится само

VAKRA тестирует ИИ-агентов на реальных API и документах — и большинство моделей проваливается
Как дообучить мультимодальную модель и обойти конкурентов вчетверо крупнее — разбор на реальном примере
Hugging Face сделал агента, который портирует модели в MLX и не раздражает ревьюеров — вот как это устроено
Как научить ИИ собирать корзину без галлюцинаций — 8 сред и 12 осей сложности
Как синтетические данные решили проблему многоязычного OCR там, где архитектура оказалась бессильна
NVIDIA открыла модель для гуманоидных роботов: обучена на видео людей, готова к заводу