Uvod
4. rujna 2025. Microsoft je predstavio Azure AI Translator API u javnom pregledu, pozicionirajući ga kao sljedeću generaciju krajnje točke za strojni prijevod na razini poduzeća. Azure AI Translator API spaja Microsoftov dokazan sustav neuronskog strojnog prijevoda s pristupom generativnim LLM-ovima poput GPT‑4o i GPT‑4o‑mini. Omogućujući pristup obiteljima modela putem jednog poziva, Azure AI Translator API obećava detaljnu kontrolu nad troškovima, latencijom i jezičnim nijansama. Ovaj izvještaj analizira Azure AI Translator API, prikazujući njegovu arhitekturu, skup značajki i rane poslovne implikacije.
Pozadina
Prije Azure AI Translator API-ja, korisnici su se oslanjali na opće NMT krajnje točke koje su vraćale jednu determinističku prijevodnu verziju s vrlo niskom latencijom. Najava naglašava da takav izlaz odgovara sinkronim chat i titlovnim iskustvima, dok lokalizacijski tijekovi zahtijevaju veću stilsku fleksibilnost.
Azure AI Translator API uvodi opcionalne generativne načine prijevoda pokretane modelima klase GPT‑4o, koji generiraju tečne, na ton osjetljive varijante uz veću latenciju. Dokumentacija pregleda označava verziju izdanja kao 2025‑05‑01‑preview i potvrđuje podršku za više od 100 izvornim jezika.
Ključno je da Azure AI Translator API radi ili putem tradicionalnog Translator resursa ili Azure AI Foundry resursa, pri čemu je za LLM prijevod potreban potonji. Autentifikacija sada prihvaća i ključeve resursa i Microsoft Entra ID tokene, usklađujući se s općim konvencijama Azure AI usluga.
Metodologija
Za evaluaciju Azure AI Translator API-ja koristili smo tijela zahtjeva identična Microsoftovim objavljenim curl primjerima, prebacujući se između NMT i GPT‑4o implementacija. API očekuje parametre u JSON nizovima, omogućujući svakom ciljanom jeziku da specificira svoj model, ton i rodne atribute.
Mjerenje naplate temeljilo se na broju znakova za NMT zahtjeve i tokenima za GPT‑4o zahtjeve, kako je navedeno u Microsoftovoj bilješci o cijenama. Ograničenja usluge tijekom pregleda postavljaju maksimalno 1.000 elemenata niza od 50 kB za NMT serijske zahtjeve, dok generativni zahtjevi imaju limit od 50 elemenata od 5 kB.
Benchmarkovi latencije variraju jer korisnici dodjeljuju GPT‑4o kapacitet unutar istog Azure AI Foundry resursa gdje je njihov model hostan. Naši testovi ciljali su španjolski i njemački jezik, replicirajući Microsoftov dvojezični primjer koji kombinira NMT i GPT‑4o u jednom pozivu. Također smo dostavili pet referentnih parova za promatranje prilagodbe stila putem referenceTextPairs kako je dokumentirano.
Analiza/Rasprava
Azure AI Translator API proizveo je španjolski tekst formalnog tona kada je atribut tona postavljen na formalni, što odgovara Microsoftovim primjerima iz pretpregleda. Prebacivanje atributa na neformalni generiralo je kolokvijalne zamjenice, naglašavajući prednost kontrole stila velikih jezičnih modela (LLM). Prijevod roda bio je podjednako dosljedan: dodavanje oznaka za ženski ili muški rod rezultiralo je rodno specifičnim imenica na španjolskom, kao što ilustrira najava.
Budući da Azure AI Translator API omogućuje svakom ciljanom jeziku da odabere vlastiti model, mješoviti radni opterećenja mogu istovremeno koristiti niskolatentnu neuronsku strojnu prijevod (NMT) za njemačke korisničke sučelje i GPT‑4o za španjolski marketinški sadržaj. Takva razina detaljnosti po zahtjevu znači da inženjerski timovi ne trebaju zasebne krajnje točke ili cjevovode, što smanjuje složenost integracije. Microsoft strukturira cijene duž dvije osi — znakova za NMT i tokena za LLM — što odražava postojeće sheme naplate Translatora i Azure OpenAI-ja. Naplata po tokenima usklađuje Azure AI Translator API s ostalim generativnim Azure uslugama, omogućujući objedinjeno praćenje financijskih operacija (FinOps).
Međutim, dodatna latencija GPT‑4o, eksplicitno napomenuta u pretpregledu, ostaje kompromis za scenarije u stvarnom vremenu. Zahtjev za postavljanjem privatnog GPT‑4o okruženja unutar Azure AI Foundry također postavlja pitanja o planiranju kapaciteta za tvrtke koje se bave lokalizacijom velikog obujma. S druge strane, Azure AI Translator API nasljeđuje robusnu jezičnu pokrivenost — preko sto jezika — koju nudi Microsoftova naslijeđena usluga Translator. Verzija pretpregleda 2025‑05‑01‑preview sugerira da se API ugovor još razvija, pa bi rani korisnici trebali pratiti bilješke o izdanju zbog mogućih značajnih promjena.
S aspekta sigurnosti, autentifikacija Entra ID-om omogućuje detaljnu kontrolu pristupa unutar višekorisničkih sadržajnih cjevovoda. Programeri mogu ugrađivati primjere rečenica putem referenceTextPairs kako bi usmjerili LLM prema stilu specifičnom za brend, učinkovito pretvarajući Azure AI Translator API u mali motor za učenje u kontekstu. Ta sposobnost nagovještava buduću konvergenciju između prijevoda i generativne lokalizacije, potencijalno brišući granice s širim alatima za prilagodbu sadržaja. Ukratko, Azure AI Translator API proširuje Microsoftov AI portfelj objedinjavanjem determinističkog i generativnog prijevoda pod jednim modelom naplate i upravljanja.
Zaključak
Azure AI Translator API ulazi u pretpregled kao najsvestranija prijevodna krajnja točka koju je Microsoft dosad lansirao. Njegov hibridni NMT–LLM dizajn omogućuje timovima optimizaciju troškova, latencije i kreativne vjernosti u jednom pozivu. Iako postavljanje GPT‑4o putem Azure AI Foundry uvodi dodatni sloj konfiguracije, nagrada je lokalizacija nalik ljudskoj, svjesna tona. Ako pretpregled stabilizira do opće dostupnosti (GA), Azure AI Translator API mogao bi redefinirati način na koji enterprise lokalizacijski tijekovi rada balansiraju brzinu i nijanse.
Često postavljana pitanja (FAQ)
P1: Što je Azure AI Translator API?
Azure AI Translator API je javna pretpregledna krajnja točka lansirana 4. rujna 2025. koja kombinira neuronski strojni prijevod s generativnim prijevodom temeljenim na GPT‑4o u jednoj usluzi.
P2: Kako se naplaćuje Azure AI Translator API?
Zahtjevi za NMT naplaćuju se po znaku izvornog teksta, dok se zahtjevi za GPT‑4o naplaćuju po ulaznim i izlaznim tokenima, u skladu s cjenovnim smjernicama iz Microsoftova priopćenja.
P3: Mogu li kombinirati NMT i GPT-4o prijevode unutar istog poziva?
Da—jedan JSON niz može, na primjer, ciljati njemački jezik s NMT-om i španjolski s GPT‑4o, kao što je prikazano u Microsoftovom dvojezičnom primjeru.
P4: Koja su trenutačna ograničenja usluge tijekom pregleda?
NMT pozivi dopuštaju do 1.000 elemenata niza od po 50 kB svaki, dok GPT‑4o pozivi dopuštaju 50 elemenata od po 5 kB, kako je navedeno u tablici ograničenja usluge.
P5: Trebam li Azure AI Foundry za korištenje generativnog prijevoda?
Da, za pristup značajkama generativnog prijevoda potrebno je implementirati GPT‑4o ili GPT‑4o‑mini unutar Azure AI Foundry resursa.