Fireworks AIをMicrosoft FoundryでAzure推論に活用
概要
Microsoftは、Microsoft Foundry上でのFireworks AIのパブリック プレビューを開始しました。これにより、高スループットかつ低遅延のオープンモデル推論を、単一のマネージド エンドポイントを通じてAzureで利用できます。企業は、DeepSeek V3.2、gpt-oss-120b、Kimi K2.5、MiniMax M2.5といったモデルに、Azureのガバナンス、サーバーレスまたはプロビジョニング済みの展開オプション、さらにbring-your-own-weightsサポートとともにアクセス可能になります。これにより、オープンモデルAIを実験段階から本番環境へ移行しやすくなります。
Fireworks AIがMicrosoft Foundryに登場
はじめに
オープンモデルを導入する組織が求めているのは、単なる生のパフォーマンスではありません。そうしたモデルを安全に実行し、一貫した形で管理し、複数のツールをつなぎ合わせることなくテストから本番環境へ移行できる実用的な方法が必要です。Microsoft Foundry上のFireworks AIに関するMicrosoftの新しいパブリック プレビューは、高速なオープンモデル推論とAzureのエンタープライズ管理およびガバナンス機能を組み合わせることで、この課題の解決を目指しています。
新機能
Microsoft Foundryには、Azureでのオープンモデル推論向けパブリック プレビュー オプションとしてFireworks AIが追加されました。この発表では、モデル評価、展開、カスタマイズ、運用を含むAIライフサイクル全体のための一元化されたコントロール プレーンとしてFoundryが位置付けられています。
主な更新内容は次のとおりです。
- 高スループットかつ低遅延のオープンモデル推論向けに、Microsoft Foundry上のFireworks AIをパブリック プレビューで提供
- Foundry内の単一のAzureエンドポイントを通じて、サポート対象のオープンモデルにアクセス可能
- 現時点で以下のモデルをサポート:
- DeepSeek V3.2
- OpenAI gpt-oss-120b
- Kimi K2.5
- MiniMax M2.5
- MiniMax M2.5が新たにFoundryに追加され、serverlessサポートを提供
- 別の場所でトレーニングされた量子化モデルまたは微調整済みモデル向けに、bring-your-own-weights (BYOW) をサポート
- 以下の柔軟な展開オプションを提供:
- 迅速な実験に適した serverless、pay-per-token 推論
- 予測可能な本番パフォーマンスに対応する Provisioned Throughput Units (PTUs)
Microsoftはまた、インターネット規模のトークン処理や、オープンモデル向けベンチマークをリードするスループットなど、Fireworks AIの大規模推論機能も強調しています。
IT部門とプラットフォーム チームにとって重要な理由
Azure管理者、AIプラットフォーム チーム、エンタープライズ アーキテクトにとって、これはオープンモデルをサポートする際の運用の複雑さを軽減します。個別のサービング スタックやガバナンス フレームワークを構築する代わりに、チームはFoundryを、モデル アクセス、展開、可観測性、ポリシー制御のための単一環境として利用できます。
これは特に、次のような要件を持つ組織に関連します。
- ベンダー ロックインを回避しながらオープンモデルを標準化したい
- 一貫したサービング プラットフォームを維持しつつ、カスタム微調整モデルをサポートしたい
- 実験ワークロードと本番ワークロード全体でコストとパフォーマンスのバランスを取りたい
- AzureでのAI展開にエンタープライズ ガバナンスとセキュリティ制御を適用したい
推奨される次のステップ
管理者とAIチームは、次の対応を検討してください。
- Fireworksがホストするモデルについて、Microsoft Foundryのモデル カタログを確認する。
- ワークロード要件に対して、serverless と PTUベースの展開のどちらが適しているか評価する。
- 組織がすでに微調整済みまたは量子化済みのオープンモデルを保有している場合は、BYOWシナリオをテストする。
- 本番展開前に、ガバナンス、可観測性、運用要件を検証する。
- Foundryにおけるモデル カスタマイズとライフサイクル管理に関するMicrosoftの追加ガイダンスを追跡する。
Microsoft Foundry上のFireworks AIは、Azureの顧客に対し、パフォーマンス、柔軟性、エンタープライズ制御を犠牲にすることなく、オープンモデルを大規模に運用へ載せるためのより強力な道筋を提供します。
Microsoftテクノロジーの最新情報を入手