Fireworks AI u Microsoft Foundry na Azure preview

March 16, 20263 min čitanja

Sažetak

Microsoft je pokrenuo javni preview Fireworks AI u okviru Microsoft Foundry na Azure, omogućavajući brzu inferenciju otvorenih modela preko jednog Azure endpointa uz enterprise upravljanje, governance i lakši prelazak iz testiranja u produkciju. Ovo je važno jer organizacijama pojednostavljuje rad sa otvorenim modelima, nudi fleksibilne modele implementacije poput serverless i PTU opcija, kao i podršku za prilagođene modele kroz BYOW pristup.

Fireworks AI stiže u Microsoft Foundry

Uvod

Organizacije koje usvajaju otvorene modele žele više od sirovih performansi — potreban im je praktičan način da te modele pokreću bezbedno, dosledno njima upravljaju i pređu sa testiranja u produkciju bez povezivanja više različitih alata. Microsoftov novi javni preview Fireworks AI na Microsoft Foundry platformi usmeren je na rešavanje tog problema kombinovanjem brze inferencije otvorenih modela sa Azure mogućnostima za upravljanje i governance na nivou preduzeća.

Šta je novo

Microsoft Foundry sada uključuje Fireworks AI kao opciju u javnom preview izdanju za inferenciju otvorenih modela u Azure. Najava pozicionira Foundry kao centralizovanu kontrolnu ravan za ceo AI životni ciklus, uključujući procenu modela, primenu, prilagođavanje i operacije.

Ključna ažuriranja uključuju:

Javni preview Fireworks AI na Microsoft Foundry za inferenciju otvorenih modela sa visokim protokom i niskom latencijom
Pristup podržanim otvorenim modelima kroz jedan Azure endpoint u Foundry
Podrška za ove modele danas:
- DeepSeek V3.2
- OpenAI gpt-oss-120b
- Kimi K2.5
- MiniMax M2.5
MiniMax M2.5 je novo dodat u Foundry sa serverless podrškom
Podrška za bring-your-own-weights (BYOW) za kvantizovane ili fine-tuned modele trenirane na drugim mestima
Fleksibilnost primene uz:
- Serverless, pay-per-token inferenciju za brzo eksperimentisanje
- Provisioned Throughput Units (PTUs) za predvidive performanse u produkciji

Microsoft je takođe istakao Fireworks AI mogućnosti inferencije velikih razmera, uključujući obradu tokena na nivou interneta i vodeći throughput u benchmark testovima za otvorene modele.

Zašto je ovo važno za IT i platform timove

Za Azure administratore, AI platform timove i enterprise arhitekte, ovo smanjuje operativnu složenost podrške za otvorene modele. Umesto izgradnje odvojenih serving stack-ova ili governance okvira, timovi mogu koristiti Foundry kao jedinstveno okruženje za pristup modelima, primenu, observability i kontrolu politika.

Ovo je posebno relevantno za organizacije koje žele da:

Standardizuju otvorene modele bez vendor lock-in pristupa
Podrže prilagođene fine-tuned modele uz zadržavanje konzistentne serving platforme
Uravnoteže trošak i performanse kroz eksperimentalna i produkciona opterećenja
Primene enterprise governance i bezbednosne kontrole na AI primene u Azure

Preporučeni sledeći koraci

Administratori i AI timovi treba da:

Pregledaju Microsoft Foundry katalog modela za modele hostovane putem Fireworks.
Procene da li serverless ili PTU-based deployments najbolje odgovaraju zahtevima opterećenja.
Testiraju BYOW scenarije ako vaša organizacija već ima fine-tuned ili kvantizovane otvorene modele.
Validiraju governance, observability i operativne zahteve pre uvođenja u produkciju.
Prate dodatne Microsoft smernice o prilagođavanju modela i upravljanju životnim ciklusom u Foundry.

Fireworks AI na Microsoft Foundry daje Azure korisnicima snažniji put za operacionalizaciju otvorenih modela u velikim razmerama — bez žrtvovanja performansi, fleksibilnosti ili enterprise kontrole.

Fireworks AI u Microsoft Foundry na Azure preview

Fireworks AI stiže u Microsoft Foundry

Uvod

Šta je novo

Zašto je ovo važno za IT i platform timove

Preporučeni sledeći koraci

Trebate pomoć sa Azure?

Povezani članci

Microsoft The Shift podcast o izazovima agentic AI

Azure i agentic AI za modernizaciju clouda

Azure Copilot agenti za migraciju i modernizaciju

Azure IaaS Resource Center za otpornu infrastrukturu

Microsoft Foundry ROI 327%: Forrester AI studija

Microsoft Foundry GPT-5.4 za enterprise AI u Azure