Fireworks AI u Microsoft Foundry na Azure preview
Sažetak
Microsoft je pokrenuo javni preview Fireworks AI u okviru Microsoft Foundry na Azure, omogućavajući brzu inferenciju otvorenih modela preko jednog Azure endpointa uz enterprise upravljanje, governance i lakši prelazak iz testiranja u produkciju. Ovo je važno jer organizacijama pojednostavljuje rad sa otvorenim modelima, nudi fleksibilne modele implementacije poput serverless i PTU opcija, kao i podršku za prilagođene modele kroz BYOW pristup.
Fireworks AI stiže u Microsoft Foundry
Uvod
Organizacije koje usvajaju otvorene modele žele više od sirovih performansi — potreban im je praktičan način da te modele pokreću bezbedno, dosledno njima upravljaju i pređu sa testiranja u produkciju bez povezivanja više različitih alata. Microsoftov novi javni preview Fireworks AI na Microsoft Foundry platformi usmeren je na rešavanje tog problema kombinovanjem brze inferencije otvorenih modela sa Azure mogućnostima za upravljanje i governance na nivou preduzeća.
Šta je novo
Microsoft Foundry sada uključuje Fireworks AI kao opciju u javnom preview izdanju za inferenciju otvorenih modela u Azure. Najava pozicionira Foundry kao centralizovanu kontrolnu ravan za ceo AI životni ciklus, uključujući procenu modela, primenu, prilagođavanje i operacije.
Ključna ažuriranja uključuju:
- Javni preview Fireworks AI na Microsoft Foundry za inferenciju otvorenih modela sa visokim protokom i niskom latencijom
- Pristup podržanim otvorenim modelima kroz jedan Azure endpoint u Foundry
- Podrška za ove modele danas:
- DeepSeek V3.2
- OpenAI gpt-oss-120b
- Kimi K2.5
- MiniMax M2.5
- MiniMax M2.5 je novo dodat u Foundry sa serverless podrškom
- Podrška za bring-your-own-weights (BYOW) za kvantizovane ili fine-tuned modele trenirane na drugim mestima
- Fleksibilnost primene uz:
- Serverless, pay-per-token inferenciju za brzo eksperimentisanje
- Provisioned Throughput Units (PTUs) za predvidive performanse u produkciji
Microsoft je takođe istakao Fireworks AI mogućnosti inferencije velikih razmera, uključujući obradu tokena na nivou interneta i vodeći throughput u benchmark testovima za otvorene modele.
Zašto je ovo važno za IT i platform timove
Za Azure administratore, AI platform timove i enterprise arhitekte, ovo smanjuje operativnu složenost podrške za otvorene modele. Umesto izgradnje odvojenih serving stack-ova ili governance okvira, timovi mogu koristiti Foundry kao jedinstveno okruženje za pristup modelima, primenu, observability i kontrolu politika.
Ovo je posebno relevantno za organizacije koje žele da:
- Standardizuju otvorene modele bez vendor lock-in pristupa
- Podrže prilagođene fine-tuned modele uz zadržavanje konzistentne serving platforme
- Uravnoteže trošak i performanse kroz eksperimentalna i produkciona opterećenja
- Primene enterprise governance i bezbednosne kontrole na AI primene u Azure
Preporučeni sledeći koraci
Administratori i AI timovi treba da:
- Pregledaju Microsoft Foundry katalog modela za modele hostovane putem Fireworks.
- Procene da li serverless ili PTU-based deployments najbolje odgovaraju zahtevima opterećenja.
- Testiraju BYOW scenarije ako vaša organizacija već ima fine-tuned ili kvantizovane otvorene modele.
- Validiraju governance, observability i operativne zahteve pre uvođenja u produkciju.
- Prate dodatne Microsoft smernice o prilagođavanju modela i upravljanju životnim ciklusom u Foundry.
Fireworks AI na Microsoft Foundry daje Azure korisnicima snažniji put za operacionalizaciju otvorenih modela u velikim razmerama — bez žrtvovanja performansi, fleksibilnosti ili enterprise kontrole.
Trebate pomoć sa Azure?
Naši stručnjaci mogu vam pomoći da implementirate i optimizujete vaša Microsoft rešenja.
Razgovarajte sa stručnjakomBudite u toku sa Microsoft tehnologijama