Fireworks AIをMicrosoft FoundryでAzure推論に活用

March 16, 20263分で読める

概要

Microsoftは、Microsoft Foundry上でのFireworks AIのパブリックプレビューを開始しました。これにより、高スループットかつ低遅延のオープンモデル推論を、単一のマネージドエンドポイントを通じてAzureで利用できます。企業は、DeepSeek V3.2、gpt-oss-120b、Kimi K2.5、MiniMax M2.5といったモデルに、Azureのガバナンス、サーバーレスまたはプロビジョニング済みの展開オプション、さらにbring-your-own-weightsサポートとともにアクセス可能になります。これにより、オープンモデルAIを実験段階から本番環境へ移行しやすくなります。

Fireworks AIがMicrosoft Foundryに登場

はじめに

オープンモデルを導入する組織が求めているのは、単なる生のパフォーマンスではありません。そうしたモデルを安全に実行し、一貫した形で管理し、複数のツールをつなぎ合わせることなくテストから本番環境へ移行できる実用的な方法が必要です。Microsoft Foundry上のFireworks AIに関するMicrosoftの新しいパブリックプレビューは、高速なオープンモデル推論とAzureのエンタープライズ管理およびガバナンス機能を組み合わせることで、この課題の解決を目指しています。

新機能

Microsoft Foundryには、Azureでのオープンモデル推論向けパブリックプレビューオプションとしてFireworks AIが追加されました。この発表では、モデル評価、展開、カスタマイズ、運用を含むAIライフサイクル全体のための一元化されたコントロールプレーンとしてFoundryが位置付けられています。

主な更新内容は次のとおりです。

高スループットかつ低遅延のオープンモデル推論向けに、Microsoft Foundry上のFireworks AIをパブリックプレビューで提供
Foundry内の単一のAzureエンドポイントを通じて、サポート対象のオープンモデルにアクセス可能
現時点で以下のモデルをサポート:
- DeepSeek V3.2
- OpenAI gpt-oss-120b
- Kimi K2.5
- MiniMax M2.5
MiniMax M2.5が新たにFoundryに追加され、serverlessサポートを提供
別の場所でトレーニングされた量子化モデルまたは微調整済みモデル向けに、bring-your-own-weights (BYOW) をサポート
以下の柔軟な展開オプションを提供:
- 迅速な実験に適した serverless、pay-per-token 推論
- 予測可能な本番パフォーマンスに対応する Provisioned Throughput Units (PTUs)

Microsoftはまた、インターネット規模のトークン処理や、オープンモデル向けベンチマークをリードするスループットなど、Fireworks AIの大規模推論機能も強調しています。

IT部門とプラットフォームチームにとって重要な理由

Azure管理者、AIプラットフォームチーム、エンタープライズアーキテクトにとって、これはオープンモデルをサポートする際の運用の複雑さを軽減します。個別のサービングスタックやガバナンスフレームワークを構築する代わりに、チームはFoundryを、モデルアクセス、展開、可観測性、ポリシー制御のための単一環境として利用できます。

これは特に、次のような要件を持つ組織に関連します。

ベンダーロックインを回避しながらオープンモデルを標準化したい
一貫したサービングプラットフォームを維持しつつ、カスタム微調整モデルをサポートしたい
実験ワークロードと本番ワークロード全体でコストとパフォーマンスのバランスを取りたい
AzureでのAI展開にエンタープライズガバナンスとセキュリティ制御を適用したい

推奨される次のステップ

管理者とAIチームは、次の対応を検討してください。

Fireworksがホストするモデルについて、Microsoft Foundryのモデルカタログを確認する。
ワークロード要件に対して、serverless と PTUベースの展開のどちらが適しているか評価する。
組織がすでに微調整済みまたは量子化済みのオープンモデルを保有している場合は、BYOWシナリオをテストする。
本番展開前に、ガバナンス、可観測性、運用要件を検証する。
Foundryにおけるモデルカスタマイズとライフサイクル管理に関するMicrosoftの追加ガイダンスを追跡する。

Microsoft Foundry上のFireworks AIは、Azureの顧客に対し、パフォーマンス、柔軟性、エンタープライズ制御を犠牲にすることなく、オープンモデルを大規模に運用へ載せるためのより強力な道筋を提供します。

Fireworks AIをMicrosoft FoundryでAzure推論に活用

Fireworks AIがMicrosoft Foundryに登場

はじめに

新機能

IT部門とプラットフォームチームにとって重要な理由

推奨される次のステップ

Azureでお困りですか？

関連記事

Agentic AI 課題を探る Microsoft The Shift Podcast

Azure agentic AIで規制業界のモダナイゼーションを加速

Azure Copilot 移行エージェントでアプリ最新化を加速

Azure IaaS Resource Center：レジリエントな基盤設計ガイド

Microsoft Foundry ROI調査：企業AIで327%の成果

Microsoft Foundry GPT-5.4：企業向けAI運用を強化

Fireworks AIがMicrosoft Foundryに登場

はじめに

新機能

IT部門とプラットフォーム チームにとって重要な理由

推奨される次のステップ

Azureでお困りですか？

関連記事

Agentic AI 課題を探る Microsoft The Shift Podcast

Azure agentic AIで規制業界のモダナイゼーションを加速

Azure Copilot 移行エージェントでアプリ最新化を加速

Azure IaaS Resource Center：レジリエントな基盤設計ガイド

Microsoft Foundry ROI調査：企業AIで327%の成果

Microsoft Foundry GPT-5.4：企業向けAI運用を強化

IT部門とプラットフォームチームにとって重要な理由