Azure

Fireworks AI en Microsoft Foundry para Azure en preview

3 min de lectura

Resumen

Microsoft anunció la vista previa pública de Fireworks AI en Microsoft Foundry para Azure, una integración que permite ejecutar modelos abiertos con alta velocidad y baja latencia desde un único endpoint, con capacidades empresariales de evaluación, implementación, personalización y gobernanza. Esto importa porque facilita llevar modelos abiertos a producción de forma más segura y centralizada en Azure, incluyendo soporte para BYOW y nuevos modelos como MiniMax M2.5 con opción serverless.

¿Necesita ayuda con Azure?Hablar con un experto

Fireworks AI llega a Microsoft Foundry

Introducción

Las organizaciones que adoptan modelos abiertos quieren más que rendimiento bruto: necesitan una forma práctica de ejecutar esos modelos de manera segura, gobernarlos de forma coherente y pasar de las pruebas a producción sin tener que unir múltiples herramientas. La nueva vista previa pública de Microsoft de Fireworks AI en Microsoft Foundry busca resolver ese problema al combinar inferencia rápida de modelos abiertos con las capacidades empresariales de administración y gobernanza de Azure.

Qué hay de nuevo

Microsoft Foundry ahora incluye Fireworks AI como una opción en vista previa pública para inferencia de modelos abiertos en Azure. El anuncio posiciona a Foundry como un plano de control centralizado para todo el ciclo de vida de la IA, incluida la evaluación, implementación, personalización y operación de modelos.

Las actualizaciones clave incluyen:

  • Vista previa pública de Fireworks AI en Microsoft Foundry para inferencia de modelos abiertos de alto rendimiento y baja latencia
  • Acceso a modelos abiertos compatibles mediante un único endpoint de Azure en Foundry
  • Compatibilidad actual con estos modelos:
    • DeepSeek V3.2
    • OpenAI gpt-oss-120b
    • Kimi K2.5
    • MiniMax M2.5
  • MiniMax M2.5 se agrega recientemente a Foundry con soporte serverless
  • Soporte de bring-your-own-weights (BYOW) para modelos cuantizados o ajustados con fine-tuning entrenados en otros entornos
  • Flexibilidad de implementación con:
    • Inferencia serverless, pay-per-token para experimentación rápida
    • Provisioned Throughput Units (PTUs) para un rendimiento predecible en producción

Microsoft también destacó las capacidades de inferencia a gran escala de Fireworks AI, incluido el procesamiento de tokens a escala de internet y un throughput líder en benchmarks para modelos abiertos.

Por qué esto importa para los equipos de TI y plataforma

Para administradores de Azure, equipos de plataforma de IA y arquitectos empresariales, esto reduce la complejidad operativa de dar soporte a modelos abiertos. En lugar de crear stacks de serving o marcos de gobernanza por separado, los equipos pueden usar Foundry como un único entorno para acceso a modelos, implementación, observabilidad y control de políticas.

Esto es especialmente relevante para organizaciones que quieren:

  • Estandarizar en modelos abiertos sin vendor lock-in
  • Dar soporte a modelos personalizados ajustados con fine-tuning manteniendo una plataforma de serving coherente
  • Equilibrar costo y rendimiento entre cargas de trabajo de experimentación y producción
  • Aplicar controles empresariales de gobernanza y seguridad a implementaciones de IA en Azure

Próximos pasos recomendados

Los administradores y equipos de IA deberían:

  1. Revisar el catálogo de modelos de Microsoft Foundry para los modelos hospedados por Fireworks.
  2. Evaluar si las implementaciones serverless o las implementaciones basadas en PTU se ajustan mejor a los requisitos de la carga de trabajo.
  3. Probar escenarios de BYOW si su organización ya cuenta con modelos abiertos cuantizados o ajustados con fine-tuning.
  4. Validar los requisitos de gobernanza, observabilidad y operación antes del despliegue en producción.
  5. Seguir la orientación adicional de Microsoft sobre personalización de modelos y gestión del ciclo de vida en Foundry.

Fireworks AI en Microsoft Foundry ofrece a los clientes de Azure una vía más sólida para operacionalizar modelos abiertos a escala, sin sacrificar rendimiento, flexibilidad ni control empresarial.

¿Necesita ayuda con Azure?

Nuestros expertos pueden ayudarle a implementar y optimizar sus soluciones Microsoft.

Hablar con un experto

Manténgase actualizado sobre tecnologías Microsoft

AzureMicrosoft FoundryFireworks AIopen modelsAI inference

Artículos relacionados

Azure

Microsoft The Shift: pódcast sobre agentic AI y Azure

Microsoft lanzó The Shift, una nueva serie de pódcast centrada en agentic AI dentro de Azure, con ocho episodios semanales sobre coordinación entre agentes, datos, arquitecturas, gobernanza y observabilidad. Esto importa porque muestra que la AI basada en agentes está pasando de ser una idea emergente a un reto real de diseño empresarial, obligando a equipos de IT y plataforma a replantear infraestructura, procesos y control operativo.

Azure

Azure y AI agentic para modernización en industrias reguladas

Microsoft destaca que Azure, combinado con AI agentic, puede ayudar a las industrias reguladas a pasar de migraciones manuales y puntuales a una modernización continua de la nube, incluso frente a exigencias de cumplimiento, infraestructura heredada y cargas críticas. Esto importa porque, además de reducir costos operativos, la nube se está consolidando como base para mejorar la resiliencia, la agilidad y la preparación para adoptar AI en sectores altamente regulados.

Azure

Azure Copilot: agentes de migración y modernización

Microsoft anunció nuevas capacidades agénticas en Azure Copilot y GitHub Copilot para acelerar la migración y modernización de infraestructura, aplicaciones, bases de datos y código, con especial foco en llevar estos procesos a un flujo de trabajo continuo de extremo a extremo. La novedad importa porque reduce la complejidad y fragmentación de los proyectos de modernización, aportando inventario automatizado, análisis de dependencias, visibilidad de costos y planes accionables que pueden ayudar a las organizaciones a adoptar IA a escala con mayor rapidez.

Azure

Azure IaaS Resource Center: guías para infraestructura resiliente

Microsoft presentó Azure IaaS Resource Center, un nuevo hub que centraliza guías, demos, arquitecturas de referencia y mejores prácticas para diseñar, optimizar y operar infraestructura en Azure. La novedad importa porque ayuda a los equipos a gestionar compute, storage y networking como una plataforma integrada, mejorando resiliencia, rendimiento y control de costos en cargas empresariales, distribuidas y de IA.

Azure

Microsoft Foundry: ROI del 327% en IA empresarial

Un estudio TEI de Forrester señala que Microsoft Foundry podría generar un ROI del 327% en tres años, recuperar la inversión en seis meses y aportar 49,5 millones de dólares en beneficios cuantificados, principalmente por mejoras de productividad y ahorro de infraestructura. Esto importa a los administradores de TI porque refuerza la idea de que una plataforma unificada de IA puede reducir el tiempo que los equipos dedican a integrar herramientas, gobernanza y datos, acelerando así la entrega de valor al negocio.

Azure

Microsoft Foundry con GPT-5.4 para IA empresarial

Microsoft anunció GPT-5.4 en Microsoft Foundry como un modelo orientado a entornos empresariales de producción, con mejoras en razonamiento sostenido, seguimiento de instrucciones, latencia y uso confiable de herramientas en flujos de trabajo complejos. Esto importa porque facilita crear agentes de IA más estables, predecibles y automatizables, reduciendo la supervisión manual y mejorando la calidad de los resultados en operaciones reales.