Fireworks AI в Microsoft Foundry для инференса в Azure
Кратко
Microsoft открыла публичную предварительную версию Fireworks AI в Microsoft Foundry, добавив в Azure высокопроизводительный инференс открытых моделей через единую конечную точку и централизованное управление всем жизненным циклом ИИ. Это важно для компаний, потому что упрощает переход от экспериментов к промышленной эксплуатации, сочетая скорость и низкую задержку с корпоративными возможностями Azure по безопасности, governance и гибкому развертыванию, включая BYOW и serverless-подход.
Fireworks AI приходит в Microsoft Foundry
Введение
Организациям, внедряющим открытые модели, нужна не только высокая производительность — им необходим практичный способ безопасно запускать эти модели, единообразно управлять ими и переходить от тестирования к промышленной эксплуатации без объединения множества отдельных инструментов. Новая публичная предварительная версия Fireworks AI в Microsoft Foundry призвана решить эту задачу, объединяя быстрый инференс открытых моделей с корпоративными возможностями управления и governance Azure.
Что нового
Microsoft Foundry теперь включает Fireworks AI как опцию публичной предварительной версии для инференса открытых моделей в Azure. Это объявление позиционирует Foundry как централизованную control plane для полного жизненного цикла AI, включая оценку моделей, развертывание, настройку и эксплуатацию.
Ключевые обновления включают:
- Публичная предварительная версия Fireworks AI в Microsoft Foundry для высокопроизводительного инференса открытых моделей с высокой пропускной способностью и низкой задержкой
- Доступ к поддерживаемым открытым моделям через единую конечную точку Azure в Foundry
- На сегодня поддерживаются следующие модели:
- DeepSeek V3.2
- OpenAI gpt-oss-120b
- Kimi K2.5
- MiniMax M2.5
- MiniMax M2.5 недавно добавлена в Foundry с поддержкой serverless
- Поддержка bring-your-own-weights (BYOW) для квантованных или дообученных моделей, обученных в других средах
- Гибкость развертывания с вариантами:
- Serverless, pay-per-token инференс для быстрого экспериментирования
- Provisioned Throughput Units (PTUs) для предсказуемой производительности в production
Microsoft также подчеркнула возможности Fireworks AI для крупномасштабного инференса, включая обработку токенов интернет-масштаба и лидирующую в бенчмарках пропускную способность для открытых моделей.
Почему это важно для IT- и platform-команд
Для администраторов Azure, AI platform teams и корпоративных архитекторов это снижает операционную сложность поддержки открытых моделей. Вместо создания отдельных стеков serving или framework'ов governance команды могут использовать Foundry как единую среду для доступа к моделям, развертывания, observability и управления политиками.
Это особенно актуально для организаций, которые хотят:
- Стандартизировать использование open models без vendor lock-in
- Поддерживать custom fine-tuned models, сохраняя при этом единую платформу serving
- Балансировать затраты и производительность между экспериментальными и production-нагрузками
- Применять корпоративные средства governance и security controls к AI-развертываниям в Azure
Рекомендуемые следующие шаги
Администраторам и AI-командам следует:
- Изучить каталог моделей Microsoft Foundry для моделей, размещенных в Fireworks.
- Оценить, какие развертывания — serverless или на базе PTU — лучше соответствуют требованиям рабочих нагрузок.
- Протестировать сценарии BYOW, если в вашей организации уже есть дообученные или квантованные открытые модели.
- Проверить требования к governance, observability и эксплуатации перед выводом в production.
- Следить за дополнительными рекомендациями Microsoft по настройке моделей и управлению жизненным циклом в Foundry.
Fireworks AI в Microsoft Foundry дает клиентам Azure более надежный путь к внедрению открытых моделей в промышленную эксплуатацию в масштабе — без ущерба для производительности, гибкости или корпоративного контроля.
Нужна помощь с Azure?
Наши эксперты помогут вам внедрить и оптимизировать решения Microsoft.
Поговорить с экспертомБудьте в курсе технологий Microsoft