Uvod
4. septembra 2025. Microsoft je predstavio Azure AI Translator API u javnoj verziji, pozicionirajući ga kao sledeću generaciju krajnje tačke za mašinski prevod na nivou preduzeća. Azure AI Translator API kombinuje Microsoftov dokazan sistem neuronskog mašinskog prevođenja sa pristupom generativnim LLM modelima kao što su GPT‑4o i GPT‑4o‑mini. Omogućavajući pristup obe porodice modela kroz jedan poziv, Azure AI Translator API obećava detaljnu kontrolu nad troškovima, latencijom i jezičkim nijansama. Ovaj izveštaj detaljno analizira Azure AI Translator API, mapirajući njegovu arhitekturu, skup funkcija i prve poslovne implikacije.
Pozadina
Pre Azure AI Translator API-ja, korisnici su se oslanjali na opšte NMT krajnje tačke koje su vraćale jednu determinističku prevodilačku verziju sa vrlo niskom latencijom. Objavljivanje naglašava da je takav izlaz pogodan za sinhrone čet i titlovanje, dok lokalizacijski tokovi rada zahtevaju veću stilsku fleksibilnost.
Azure AI Translator API uvodi opciona generativna prevodilačka režima pokretana modelima klase GPT‑4o, koji generišu tečne, tonalno prilagođene varijante uz veću latenciju. Dokumentacija za preview označava verziju izdanja kao 2025‑05‑01‑preview i potvrđuje podršku za više od 100 izvornog jezika.
Ključno je da Azure AI Translator API funkcioniše ili kroz tradicionalni Translator resurs ili kroz Azure AI Foundry resurs, pri čemu je za LLM prevod potreban potonji. Autentifikacija sada prihvata kako ključeve resursa tako i Microsoft Entra ID tokene, usklađujući se sa širim konvencijama Azure AI servisa.
Metodologija
Da bismo evaluirali Azure AI Translator API, poslali smo zahteve identične Microsoftovim objavljenim curl primerima, menjajući između NMT i GPT‑4o implementacija. API očekuje parametre u JSON nizovima, omogućavajući svakom ciljanom jeziku da specificira svoj model, ton i atribute pola.
Merili smo naplatu po broju karaktera za NMT prevode i po tokenima za GPT‑4o prevode, kako je navedeno u Microsoftovoj cenovnoj napomeni. Ograničenja servisa u preview fazi postavljaju limit za NMT serijske zahteve na 1.000 elemenata niza od po 50 kB, dok je za generativne zahteve limit 50 elemenata od po 5 kB.
Benchmark testovi latencije variraju jer korisnici obezbeđuju GPT‑4o kapacitet unutar istog Azure AI Foundry resursa koji hostuje njihov model. Naši testovi su ciljali na španski i nemački jezik, replicirajući Microsoftov dvojezični primer koji kombinuje NMT i GPT‑4o u jednom pozivu. Takođe smo dostavili pet referentnih parova za stilsku adaptaciju putem referenceTextPairs kako je dokumentovano.
Analiza/Diskusija
Azure AI Translator API je prilikom podešavanja atributa tona na formalan proizveo španski prevod sa formalnim stilom, što je u skladu sa Microsoftovim primerima iz pregleda. Promena atributa na neformalni ton generisala je kolokvijalne zamenice, što ističe prednost kontrole stila velikih jezičkih modela (LLM). Prevod po rodu bio je podjednako dosledan: unošenje oznaka za ženski ili muški rod rezultiralo je imenima specifičnim za rod na španskom, kao što najava ilustruje.
Pošto Azure AI Translator API omogućava svakom ciljanom jeziku da izabere svoj model, mešoviti zadaci mogu istovremeno koristiti NMT sa niskom latencijom za nemačke UI stringove i GPT‑4o za španske marketinške tekstove. Takva granularnost po zahtevu znači da inženjerski timovi ne moraju imati posebne krajnje tačke ili pipeline-ove, što smanjuje integracioni dug. Microsoft određuje cenu duž dve ose — karakteri za NMT i tokeni za LLM — što prati postojeće šeme naplate za Translator i Azure OpenAI. Naplata po tokenima usklađuje Azure AI Translator API sa ostalim generativnim Azure uslugama, omogućavajući objedinjeno praćenje FinOps-a.
Međutim, dodatna latencija GPT‑4o modela, jasno naznačena u pregledu, ostaje kompromis za scenarije u realnom vremenu. Zahtev za postavkom privatnog GPT‑4o okruženja unutar Azure AI Foundry takođe postavlja pitanja o planiranju kapaciteta za lokalizacione firme sa velikim obimom posla. Nasuprot tome, Azure AI Translator API nasleđuje robusnu podršku za preko stotinu jezika koju nudi Microsoftova prethodna Translator usluga. Verzija pregleda 2025‑05‑01‑preview sugeriše da se API ugovor još razvija, pa bi rani korisnici trebalo da prate beleške o izdanju zbog mogućih značajnih promena.
Sa aspekta bezbednosti, Entra ID autentifikacija omogućava detaljnu kontrolu pristupa u višekorisničkim sadržajnim pipeline-ovima. Programeri mogu da ugrađuju primer rečenica putem referenceTextPairs kako bi usmerili LLM ka stilu specifičnom za brend, efektivno pretvarajući Azure AI Translator API u mini mehanizam za učenje u kontekstu. Ta funkcionalnost nagoveštava buduću konvergenciju između prevoda i generativne lokalizacije, potencijalno brišući granice sa širim alatima za adaptaciju sadržaja. Sve zajedno, Azure AI Translator API proširuje Microsoftov AI portfolio objedinjavanjem determinističkog i generativnog prevođenja pod jednim modelom naplate i upravljanja.
Zaključak
Azure AI Translator API ulazi u fazu pregleda kao najfleksibilnija prevodilačka krajnja tačka koju je Microsoft do sada lansirao. Njegov hibridni NMT–LLM dizajn omogućava timovima da optimizuju troškove, latenciju i kreativnu verodostojnost u jednom pozivu. Iako postavljanje GPT‑4o preko Azure AI Foundry uvodi dodatni sloj konfiguracije, nagrada je lokalizacija nalik ljudskoj, svesna tona. Ukoliko pregled stabilizuje u opštu dostupnost, Azure AI Translator API bi mogao redefinisati kako enterprise lokalizacioni tokovi rada balansiraju brzinu i nijanse.
Česta pitanja
P1: Šta je Azure AI Translator API?
Azure AI Translator API je javna preview krajnja tačka lansirana 4. septembra 2025. koja kombinuje neuronski mašinski prevod sa generativnim prevođenjem zasnovanim na GPT‑4o u jednoj usluzi.
P2: Kako se naplaćuje Azure AI Translator API?
NMT zahtevi se naplaćuju po karakteru izvornog teksta, dok se GPT‑4o zahtevi naplaćuju po ulaznim i izlaznim tokenima, u skladu sa smernicama za cenu iz Microsoftove objave.
P3: Mogu li kombinovati NMT i GPT-4o prevode unutar istog poziva?
Da—jedan JSON niz može ciljati, na primer, nemački jezik sa NMT i španski sa GPT‑4o, kao što je prikazano u Microsoftovom bilingvalnom primeru.
P4: Koja su trenutna ograničenja servisa tokom pregleda?
NMT pozivi dozvoljavaju do 1.000 elemenata niza od po 50 kB, dok GPT‑4o pozivi dozvoljavaju 50 elemenata od po 5 kB, kako je navedeno u tabeli ograničenja servisa.
P5: Da li mi je potreban Azure AI Foundry za korišćenje generativnog prevođenja?
Da, potrebno je da se GPT‑4o ili GPT‑4o‑mini implementira unutar Azure AI Foundry resursa da biste pristupili funkcijama generativnog prevođenja.