Azure

Fireworks AI в Microsoft Foundry для инференса в Azure

3 мин. чтения

Кратко

Microsoft открыла публичную предварительную версию Fireworks AI в Microsoft Foundry, добавив в Azure высокопроизводительный инференс открытых моделей через единую конечную точку и централизованное управление всем жизненным циклом ИИ. Это важно для компаний, потому что упрощает переход от экспериментов к промышленной эксплуатации, сочетая скорость и низкую задержку с корпоративными возможностями Azure по безопасности, governance и гибкому развертыванию, включая BYOW и serverless-подход.

Нужна помощь с Azure?Поговорить с экспертом

Fireworks AI приходит в Microsoft Foundry

Введение

Организациям, внедряющим открытые модели, нужна не только высокая производительность — им необходим практичный способ безопасно запускать эти модели, единообразно управлять ими и переходить от тестирования к промышленной эксплуатации без объединения множества отдельных инструментов. Новая публичная предварительная версия Fireworks AI в Microsoft Foundry призвана решить эту задачу, объединяя быстрый инференс открытых моделей с корпоративными возможностями управления и governance Azure.

Что нового

Microsoft Foundry теперь включает Fireworks AI как опцию публичной предварительной версии для инференса открытых моделей в Azure. Это объявление позиционирует Foundry как централизованную control plane для полного жизненного цикла AI, включая оценку моделей, развертывание, настройку и эксплуатацию.

Ключевые обновления включают:

  • Публичная предварительная версия Fireworks AI в Microsoft Foundry для высокопроизводительного инференса открытых моделей с высокой пропускной способностью и низкой задержкой
  • Доступ к поддерживаемым открытым моделям через единую конечную точку Azure в Foundry
  • На сегодня поддерживаются следующие модели:
    • DeepSeek V3.2
    • OpenAI gpt-oss-120b
    • Kimi K2.5
    • MiniMax M2.5
  • MiniMax M2.5 недавно добавлена в Foundry с поддержкой serverless
  • Поддержка bring-your-own-weights (BYOW) для квантованных или дообученных моделей, обученных в других средах
  • Гибкость развертывания с вариантами:
    • Serverless, pay-per-token инференс для быстрого экспериментирования
    • Provisioned Throughput Units (PTUs) для предсказуемой производительности в production

Microsoft также подчеркнула возможности Fireworks AI для крупномасштабного инференса, включая обработку токенов интернет-масштаба и лидирующую в бенчмарках пропускную способность для открытых моделей.

Почему это важно для IT- и platform-команд

Для администраторов Azure, AI platform teams и корпоративных архитекторов это снижает операционную сложность поддержки открытых моделей. Вместо создания отдельных стеков serving или framework'ов governance команды могут использовать Foundry как единую среду для доступа к моделям, развертывания, observability и управления политиками.

Это особенно актуально для организаций, которые хотят:

  • Стандартизировать использование open models без vendor lock-in
  • Поддерживать custom fine-tuned models, сохраняя при этом единую платформу serving
  • Балансировать затраты и производительность между экспериментальными и production-нагрузками
  • Применять корпоративные средства governance и security controls к AI-развертываниям в Azure

Рекомендуемые следующие шаги

Администраторам и AI-командам следует:

  1. Изучить каталог моделей Microsoft Foundry для моделей, размещенных в Fireworks.
  2. Оценить, какие развертывания — serverless или на базе PTU — лучше соответствуют требованиям рабочих нагрузок.
  3. Протестировать сценарии BYOW, если в вашей организации уже есть дообученные или квантованные открытые модели.
  4. Проверить требования к governance, observability и эксплуатации перед выводом в production.
  5. Следить за дополнительными рекомендациями Microsoft по настройке моделей и управлению жизненным циклом в Foundry.

Fireworks AI в Microsoft Foundry дает клиентам Azure более надежный путь к внедрению открытых моделей в промышленную эксплуатацию в масштабе — без ущерба для производительности, гибкости или корпоративного контроля.

Нужна помощь с Azure?

Наши эксперты помогут вам внедрить и оптимизировать решения Microsoft.

Поговорить с экспертом

Будьте в курсе технологий Microsoft

AzureMicrosoft FoundryFireworks AIopen modelsAI inference

Похожие статьи

Azure

Подкаст Microsoft The Shift об agentic AI и Azure

Microsoft запустила новый подкаст The Shift, посвящённый agentic AI в Azure и корпоративной AI-архитектуре, где в восьми эпизодах обсудят данные, координацию агентов, context engineering, governance и роль платформ вроде Postgres, Microsoft Fabric и OneLake. Это важно, потому что AI-агенты переходят из стадии концепции в практическую задачу для IT-команд, требуя переосмысления архитектуры, безопасности, наблюдаемости и операционных процессов на уровне всей организации.

Azure

Azure и agentic AI для модернизации в регулируемых отраслях

Microsoft заявляет, что Azure в сочетании с agentic AI может ускорить модернизацию облака в регулируемых отраслях, где миграцию обычно тормозят устаревшая инфраструктура, требования соответствия и критически важные системы. Это важно, потому что облачная трансформация все чаще рассматривается не только как способ снизить IT-затраты, но и как основа для операционной устойчивости, соблюдения нормативных требований и масштабного внедрения AI.

Azure

Azure Copilot для миграции и модернизации приложений

Microsoft представила новые агентные возможности в Azure Copilot и GitHub Copilot, которые помогают автоматизировать миграцию и модернизацию инфраструктуры, приложений, баз данных и кода — от обнаружения и оценки до планирования и развертывания. Это важно для компаний, потому что снижает сложность и стоимость перехода к современным AI-готовым системам, а также делает модернизацию не разовым проектом, а непрерывным процессом.

Azure

Azure IaaS Resource Center для устойчивой инфраструктуры

Microsoft представила Azure IaaS Resource Center — единый центр с рекомендациями, демо-материалами, архитектурными ресурсами и best practices по compute, storage и networking для проектирования и эксплуатации инфраструктуры Azure. Это важно, потому что компания продвигает Azure IaaS как целостную платформу для повышения устойчивости, производительности и контроля затрат, что особенно актуально для смешанных корпоративных и AI-нагрузок.

Azure

Microsoft Foundry и ROI 327%: платформа AI для Azure

Microsoft продвигает Foundry как единую AI-платформу для Azure, а исследование Forrester TEI оценивает её потенциальный эффект в 327% ROI за три года, окупаемость за шесть месяцев и $49,5 млн совокупной выгоды при инвестициях $11,6 млн. Это важно для IT-администраторов и руководителей AI-направлений, потому что основная ценность Foundry — сокращение времени на инфраструктуру, governance и повторяющиеся инженерные задачи, что повышает продуктивность команд и снижает затраты на инструменты и workflows.

Azure

Microsoft Foundry с GPT-5.4 для корпоративного AI

Microsoft представила GPT-5.4 в Foundry как модель для production-сценариев: с более стабильным следованием инструкциям, лучшим удержанием контекста в длинных workflow, сниженной задержкой и надежной работой с инструментами, файлами и кодом. Это важно для компаний, потому что делает корпоративных AI-агентов более предсказуемыми и пригодными для автоматизации сложных бизнес-процессов, а версия GPT-5.4 Pro расширяет возможности для наиболее требовательных задач.