Azure

Fireworks AIをMicrosoft FoundryでAzure推論に活用

3分で読める

概要

Microsoftは、Microsoft Foundry上でのFireworks AIのパブリック プレビューを開始しました。これにより、高スループットかつ低遅延のオープンモデル推論を、単一のマネージド エンドポイントを通じてAzureで利用できます。企業は、DeepSeek V3.2、gpt-oss-120b、Kimi K2.5、MiniMax M2.5といったモデルに、Azureのガバナンス、サーバーレスまたはプロビジョニング済みの展開オプション、さらにbring-your-own-weightsサポートとともにアクセス可能になります。これにより、オープンモデルAIを実験段階から本番環境へ移行しやすくなります。

Azureでお困りですか?専門家に相談する

Fireworks AIがMicrosoft Foundryに登場

はじめに

オープンモデルを導入する組織が求めているのは、単なる生のパフォーマンスではありません。そうしたモデルを安全に実行し、一貫した形で管理し、複数のツールをつなぎ合わせることなくテストから本番環境へ移行できる実用的な方法が必要です。Microsoft Foundry上のFireworks AIに関するMicrosoftの新しいパブリック プレビューは、高速なオープンモデル推論とAzureのエンタープライズ管理およびガバナンス機能を組み合わせることで、この課題の解決を目指しています。

新機能

Microsoft Foundryには、Azureでのオープンモデル推論向けパブリック プレビュー オプションとしてFireworks AIが追加されました。この発表では、モデル評価、展開、カスタマイズ、運用を含むAIライフサイクル全体のための一元化されたコントロール プレーンとしてFoundryが位置付けられています。

主な更新内容は次のとおりです。

  • 高スループットかつ低遅延のオープンモデル推論向けに、Microsoft Foundry上のFireworks AIをパブリック プレビューで提供
  • Foundry内の単一のAzureエンドポイントを通じて、サポート対象のオープンモデルにアクセス可能
  • 現時点で以下のモデルをサポート:
    • DeepSeek V3.2
    • OpenAI gpt-oss-120b
    • Kimi K2.5
    • MiniMax M2.5
  • MiniMax M2.5が新たにFoundryに追加され、serverlessサポートを提供
  • 別の場所でトレーニングされた量子化モデルまたは微調整済みモデル向けに、bring-your-own-weights (BYOW) をサポート
  • 以下の柔軟な展開オプションを提供:
    • 迅速な実験に適した serverless、pay-per-token 推論
    • 予測可能な本番パフォーマンスに対応する Provisioned Throughput Units (PTUs)

Microsoftはまた、インターネット規模のトークン処理や、オープンモデル向けベンチマークをリードするスループットなど、Fireworks AIの大規模推論機能も強調しています。

IT部門とプラットフォーム チームにとって重要な理由

Azure管理者、AIプラットフォーム チーム、エンタープライズ アーキテクトにとって、これはオープンモデルをサポートする際の運用の複雑さを軽減します。個別のサービング スタックやガバナンス フレームワークを構築する代わりに、チームはFoundryを、モデル アクセス、展開、可観測性、ポリシー制御のための単一環境として利用できます。

これは特に、次のような要件を持つ組織に関連します。

  • ベンダー ロックインを回避しながらオープンモデルを標準化したい
  • 一貫したサービング プラットフォームを維持しつつ、カスタム微調整モデルをサポートしたい
  • 実験ワークロードと本番ワークロード全体でコストとパフォーマンスのバランスを取りたい
  • AzureでのAI展開にエンタープライズ ガバナンスとセキュリティ制御を適用したい

推奨される次のステップ

管理者とAIチームは、次の対応を検討してください。

  1. Fireworksがホストするモデルについて、Microsoft Foundryのモデル カタログを確認する。
  2. ワークロード要件に対して、serverlessPTUベースの展開のどちらが適しているか評価する。
  3. 組織がすでに微調整済みまたは量子化済みのオープンモデルを保有している場合は、BYOWシナリオをテストする。
  4. 本番展開前に、ガバナンス、可観測性、運用要件を検証する。
  5. Foundryにおけるモデル カスタマイズとライフサイクル管理に関するMicrosoftの追加ガイダンスを追跡する。

Microsoft Foundry上のFireworks AIは、Azureの顧客に対し、パフォーマンス、柔軟性、エンタープライズ制御を犠牲にすることなく、オープンモデルを大規模に運用へ載せるためのより強力な道筋を提供します。

Azureでお困りですか?

私たちの専門家がMicrosoftソリューションの導入と最適化をお手伝いします。

専門家に相談する

Microsoftテクノロジーの最新情報を入手

AzureMicrosoft FoundryFireworks AIopen modelsAI inference

関連記事

Azure

Agentic AI 課題を探る Microsoft The Shift Podcast

Microsoft は、agentic AI に焦点を当てた The Shift podcast の新シーズンを開始しました。毎週配信される全8話で、AI agents がどのようにデータを利用し、相互に連携し、Postgres、Microsoft Fabric、OneLake などのプラットフォームに依存するのかを掘り下げます。このシリーズが重要なのは、企業で agents を導入するにはモデルだけでなく、Azure とデータ スタック全体にわたるアーキテクチャ、ガバナンス、セキュリティ、IT ワークフローの見直しが必要であることを示しているためです。

Azure

Azure agentic AIで規制業界のモダナイゼーションを加速

Microsoftは、Azureとagentic AIを組み合わせることで、規制業界がコンプライアンスを維持しながら、ワークロード評価、移行、継続的な運用を自動化し、レガシーシステムのモダナイゼーションをより迅速に進められるとしています。このアップデートが重要なのは、クラウド移行を単なるコスト削減策ではなく、医療などの高度に規制された業界にとって、レジリエンス、ガバナンス、そして大規模なAI導入に向けた準備に不可欠な取り組みとして位置付けている点です。

Azure

Azure Copilot 移行エージェントでアプリ最新化を加速

Microsoft は、Azure Copilot と GitHub Copilot に新たな最新化エージェントのパブリック プレビューを導入しました。これにより、組織は検出、評価、計画、展開、コード更新にわたる移行とアプリ変革を自動化できます。この発表は、複雑で分断されがちな最新化作業を、連携した AI 支援ワークフローへと変えることを目指している点で重要です。企業はレガシー インフラストラクチャとアプリを、コスト、依存関係、優先順位に関するより明確な洞察を得ながら、より迅速に Azure へ移行できるようになります。

Azure

Azure IaaS Resource Center:レジリエントな基盤設計ガイド

Microsoft は、インフラ チーム向けに設計ガイダンス、デモ、アーキテクチャ リソース、compute・storage・networking のベスト プラクティスを集約したハブである Azure IaaS Resource Center を発表しました。この公開により、Azure IaaS がレジリエントで高性能、かつコスト最適化されたインフラを構築するための統合プラットフォームであることが改めて強調され、従来の業務アプリから AI ワークロードまで幅広く支援しやすくなります。

Azure

Microsoft Foundry ROI調査:企業AIで327%の成果

Microsoft Foundryに関して委託されたForrester Total Economic Impact調査によると、モデル化された企業は3年間で327%のROIを達成し、約6か月で投資回収し、生産性向上とインフラ削減により4,950万ドルの効果を得られる可能性があります。この結果は、企業AIのコストの多くが開発者の時間と分断されたツール群に左右されることを示しており、Foundryのような統合プラットフォームがITチームのAI提供を加速しつつ、ガバナンスと効率性を向上できることを示唆しています。

Azure

Microsoft Foundry GPT-5.4:企業向けAI運用を強化

Microsoft は Microsoft Foundry に GPT-5.4 を導入し、より強力な指示追従、長いコンテキスト処理、低遅延、そしてより信頼性の高いツールおよびファイルオーケストレーションを備えた、企業ワークロード向けの本番運用重視AIモデルとして位置付けました。この更新により、AI エージェントは現実の業務自動化により確実に対応できる段階へ近づきます。さらに、新しい GPT-5.4 Pro は、より高い安定性と完全性が求められる複雑な分析業務や意思決定中心のワークフローを対象としています。