Azure

Fireworks AI u Microsoft Foundry na Azure preview

3 min čitanja

Sažetak

Microsoft je pokrenuo javni preview Fireworks AI u okviru Microsoft Foundry na Azure, omogućavajući brzu inferenciju otvorenih modela preko jednog Azure endpointa uz enterprise upravljanje, governance i lakši prelazak iz testiranja u produkciju. Ovo je važno jer organizacijama pojednostavljuje rad sa otvorenim modelima, nudi fleksibilne modele implementacije poput serverless i PTU opcija, kao i podršku za prilagođene modele kroz BYOW pristup.

Trebate pomoć sa Azure?Razgovarajte sa stručnjakom

Fireworks AI stiže u Microsoft Foundry

Uvod

Organizacije koje usvajaju otvorene modele žele više od sirovih performansi — potreban im je praktičan način da te modele pokreću bezbedno, dosledno njima upravljaju i pređu sa testiranja u produkciju bez povezivanja više različitih alata. Microsoftov novi javni preview Fireworks AI na Microsoft Foundry platformi usmeren je na rešavanje tog problema kombinovanjem brze inferencije otvorenih modela sa Azure mogućnostima za upravljanje i governance na nivou preduzeća.

Šta je novo

Microsoft Foundry sada uključuje Fireworks AI kao opciju u javnom preview izdanju za inferenciju otvorenih modela u Azure. Najava pozicionira Foundry kao centralizovanu kontrolnu ravan za ceo AI životni ciklus, uključujući procenu modela, primenu, prilagođavanje i operacije.

Ključna ažuriranja uključuju:

  • Javni preview Fireworks AI na Microsoft Foundry za inferenciju otvorenih modela sa visokim protokom i niskom latencijom
  • Pristup podržanim otvorenim modelima kroz jedan Azure endpoint u Foundry
  • Podrška za ove modele danas:
    • DeepSeek V3.2
    • OpenAI gpt-oss-120b
    • Kimi K2.5
    • MiniMax M2.5
  • MiniMax M2.5 je novo dodat u Foundry sa serverless podrškom
  • Podrška za bring-your-own-weights (BYOW) za kvantizovane ili fine-tuned modele trenirane na drugim mestima
  • Fleksibilnost primene uz:
    • Serverless, pay-per-token inferenciju za brzo eksperimentisanje
    • Provisioned Throughput Units (PTUs) za predvidive performanse u produkciji

Microsoft je takođe istakao Fireworks AI mogućnosti inferencije velikih razmera, uključujući obradu tokena na nivou interneta i vodeći throughput u benchmark testovima za otvorene modele.

Zašto je ovo važno za IT i platform timove

Za Azure administratore, AI platform timove i enterprise arhitekte, ovo smanjuje operativnu složenost podrške za otvorene modele. Umesto izgradnje odvojenih serving stack-ova ili governance okvira, timovi mogu koristiti Foundry kao jedinstveno okruženje za pristup modelima, primenu, observability i kontrolu politika.

Ovo je posebno relevantno za organizacije koje žele da:

  • Standardizuju otvorene modele bez vendor lock-in pristupa
  • Podrže prilagođene fine-tuned modele uz zadržavanje konzistentne serving platforme
  • Uravnoteže trošak i performanse kroz eksperimentalna i produkciona opterećenja
  • Primene enterprise governance i bezbednosne kontrole na AI primene u Azure

Preporučeni sledeći koraci

Administratori i AI timovi treba da:

  1. Pregledaju Microsoft Foundry katalog modela za modele hostovane putem Fireworks.
  2. Procene da li serverless ili PTU-based deployments najbolje odgovaraju zahtevima opterećenja.
  3. Testiraju BYOW scenarije ako vaša organizacija već ima fine-tuned ili kvantizovane otvorene modele.
  4. Validiraju governance, observability i operativne zahteve pre uvođenja u produkciju.
  5. Prate dodatne Microsoft smernice o prilagođavanju modela i upravljanju životnim ciklusom u Foundry.

Fireworks AI na Microsoft Foundry daje Azure korisnicima snažniji put za operacionalizaciju otvorenih modela u velikim razmerama — bez žrtvovanja performansi, fleksibilnosti ili enterprise kontrole.

Trebate pomoć sa Azure?

Naši stručnjaci mogu vam pomoći da implementirate i optimizujete vaša Microsoft rešenja.

Razgovarajte sa stručnjakom

Budite u toku sa Microsoft tehnologijama

AzureMicrosoft FoundryFireworks AIopen modelsAI inference

Povezani članci

Azure

Microsoft The Shift podcast o izazovima agentic AI

Microsoft je pokrenuo podcast The Shift, novu verziju serijala Leading the Shift, sa osam nedeljnih epizoda fokusiranih na agentic AI i praktične izazove njegove primene u Azure i enterprise okruženjima. Ovo je važno jer pokazuje da AI agenti više nisu samo eksperimentalna funkcija, već arhitektonski i operativni izazov koji traži kvalitetne podatke, orkestraciju, bezbednost, upravljanje i jasne platformske odluke.

Azure

Azure i agentic AI za modernizaciju clouda

Microsoft poručuje da Azure u kombinaciji sa agentic AI može da ubrza modernizaciju clouda, posebno u regulisanim industrijama gde migracije koče zastarela infrastruktura, usklađenost i kritični sistemi. Vest je važna jer pokazuje da cloud više nije samo pitanje smanjenja troškova, već i osnove za veću operativnu agilnost, otpornost i spremnost za širu primenu AI u sektorima poput zdravstva i finansija.

Azure

Azure Copilot agenti za migraciju i modernizaciju

Microsoft je predstavio nove Azure Copilot i GitHub Copilot agente za migraciju i modernizaciju, koji su sada u public preview fazi i pomažu timovima da automatizuju otkrivanje, procenu, planiranje i primenu promena kroz ceo proces. Ovo je važno jer organizacijama olakšava prelazak sa sporih i fragmentisanih modernizacionih projekata na povezan, kontinuiran tok rada, što ubrzava usvajanje AI-ja i smanjuje troškove i složenost transformacije.

Azure

Azure IaaS Resource Center za otpornu infrastrukturu

Microsoft je predstavio Azure IaaS Resource Center kao centralno mesto za smernice, arhitektonske resurse, demo sadržaje i preporuke za optimizaciju compute, storage i networking okruženja u Azure-u. Ovo je važno jer pomaže infrastrukturnim timovima da Azure IaaS planiraju i vode kao jedinstvenu, otpornu i troškovno efikasnu platformu, posebno za kritične poslovne, analitičke i AI workloadove.

Azure

Microsoft Foundry ROI 327%: Forrester AI studija

Nova Forrester TEI studija pokazuje da Microsoft Foundry može da donese 327% ROI u periodu od tri godine, uz povraćaj investicije za šest meseci, kroz veće uštede na infrastrukturi i značajan rast produktivnosti tehničkih timova. Ovo je važno jer ukazuje da najveći trošak enterprise AI projekata često nije sam model, već vreme koje developeri troše na infrastrukturu, integracije i upravljanje, pa objedinjena platforma može ubrzati isporuku poslovne vrednosti.

Azure

Microsoft Foundry GPT-5.4 za enterprise AI u Azure

Microsoft je u Azure Foundry predstavio GPT-5.4 i GPT-5.4 Pro, modele usmerene na enterprise AI scenarije gde su pouzdanost, praćenje instrukcija, održavanje konteksta i stabilan rad kroz duge, višestepene tokove važniji od samog „pametnog“ odgovora. Ovo je značajno jer firmama omogućava da grade produkcione AI agente sa boljim pozivanjem alata, radom nad fajlovima i kvalitetnijim izlazima, uz manje potrebe za ručnim podešavanjem i nadzorom.