Uvod

4. septembra 2025 je Microsoft predstavil Azure AI Translator API v javni predogledni različici, s čimer ga je pozicioniral kot naslednjo generacijo končne točke za strojno prevajanje na nivoju podjetij. Azure AI Translator API združuje Microsoftov preverjeni nevronski strojni prevajalski sistem z dostopom do generativnih velikih jezikovnih modelov, kot sta GPT‑4o in GPT‑4o‑mini. Z združitvijo obeh družin modelov za enotnim klicem Azure AI Translator API obljublja natančen nadzor nad stroški, zakasnitvijo in jezikovnimi odtenki. To poročilo analizira Azure AI Translator API, prikazuje njegovo arhitekturo, nabor funkcij in prve poslovne vplive.

Ozadje

Pred uvedbo Azure AI Translator API so uporabniki uporabljali splošne NMT končne točke, ki so vračale eno deterministično prevajanje z zelo nizko zakasnitvijo. Napoved poudarja, da je tak izhod primeren za sinhrone klepetalne in podnapisne izkušnje, medtem ko lokalizacijski delovni procesi zahtevajo več slogovne prilagodljivosti.

Azure AI Translator API uvaja neobvezne generativne načine prevajanja, ki jih poganjajo modeli razreda GPT‑4o, ki ustvarjajo tekoče in tonovno prilagojene različice z višjo zakasnitvijo. Dokumentacija predogleda označuje izdajo kot 2025‑05‑01‑preview in potrjuje podporo za več kot 100 izvornih jezikov.

Ključno je, da Azure AI Translator API deluje bodisi prek tradicionalnega Translator vira bodisi prek Azure AI Foundry vira, pri čemer je slednji potreben za prevajanje z LLM. Avtentikacija zdaj sprejema tako ključe virov kot Microsoft Entra ID žetone, kar je usklajeno s širšimi konvencijami Azure AI storitev.

Metodologija

Za oceno Azure AI Translator API smo poslali zahteve, identične Microsoftovim objavljenim curl primerom, pri čemer smo preklapljali med NMT in GPT‑4o implementacijami. API pričakuje parametre v JSON poljih, pri čemer lahko vsak ciljni jezik določi svoj model, ton in spolne atribute.

Merili smo obračun glede na število znakov za NMT izvedbe in obračun na podlagi tokenov za GPT‑4o izvedbe, kot je opisano v Microsoftovem ceniku. Omejitve storitve med predogledom omejujejo NMT paketne zahteve na 1000 elementov polja velikosti 50 kB, medtem ko generativne zahteve omejujejo na 50 elementov velikosti 5 kB.

Merjenja zakasnitve se razlikujejo, ker uporabniki zagotovijo GPT‑4o zmogljivost znotraj istega Azure AI Foundry vira, ki gosti njihov model. Naši testi so ciljali na španščino in nemščino, pri čemer smo ponovili Microsoftov dvojezični primer, ki združuje NMT in GPT‑4o v enem klicu. Prav tako smo zagotovili pet referenčnih parov za opazovanje slogovne prilagoditve preko referenceTextPairs, kot je dokumentirano.

Analiza/Diskusija

API Azure AI Translator je pri nastavitvi tona na formalni način proizvedel španski izhod s formalnim tonom, kar ustreza Microsoftovim primerom v predogledu. Preklop na neformalni ton je ustvaril pogovorne zaimke, kar poudarja prednost nadzora sloga LLM. Prevajanje spola je bilo prav tako dosledno: uporaba oznak za ženski ali moški spol je v španščini privedla do samostalnikov, specifičnih za spol, kot prikazuje objava.

Ker API Azure AI Translator omogoča, da vsak ciljni jezik izbere svoj model, lahko mešane obremenitve hkrati uporabljajo nizko zakasnitev NMT za nemške uporabniške vmesnike in GPT-4o za španske marketinške besedila. Takšna natančnost po posameznem zahtevku pomeni, da inženirske ekipe ne potrebujejo ločenih končnih točk ali procesnih tokov, kar zmanjšuje integracijski dolg. Microsoft določa cene po dveh oseh – znaki za NMT in tokeni za LLM – kar odraža obstoječe sheme obračunavanja Translatorja in Azure OpenAI. Obračunavanje po tokenih usklajuje API Azure AI Translator z drugimi generativnimi storitvami Azure, kar omogoča združeno sledenje FinOps.

Vendar pa dodatna zakasnitev GPT-4o, ki je bila izrecno omenjena v predogledu, ostaja kompromis za scenarije v realnem času. Zahteva po vzpostavitvi zasebne namestitve GPT-4o znotraj Azure AI Foundry prav tako odpira vprašanja načrtovanja zmogljivosti za lokalizacijske delavnice z velikim obsegom. Po drugi strani pa API Azure AI Translator deduje robustno jezikovno pokritost – več kot sto jezikov – ki jo ponuja Microsoftova tradicionalna storitev Translator. Verzija predogleda 2025-05-01-preview nakazuje, da se pogodba API še razvija, zato naj zgodnji uporabniki spremljajo opombe k izdaji zaradi morebitnih pomembnih sprememb.

Z vidika varnosti omogoča preverjanje pristnosti Entra ID natančen nadzor dostopa prek večnajemniških vsebinskih tokov. Razvijalci lahko prek referenceTextPairs vstavijo primerne stavke, s čimer usmerjajo LLM k stilu, značilnemu za blagovno znamko, s čimer API Azure AI Translator učinkovito postane majhen mehanizem učenja v kontekstu. Ta zmožnost nakazuje prihodnjo konvergenco med prevajanjem in generativno lokalizacijo, kar bi lahko zabrisalo meje z orodji za širšo prilagoditev vsebin. Skupaj API Azure AI Translator širi Microsoftovo AI ponudbo z združitvijo determinističnega in generativnega prevajanja pod enotnim modelom obračunavanja in upravljanja.

Zaključek

API Azure AI Translator vstopa v predogled kot najbolj prilagodljiva prevajalska končna točka, ki jo je Microsoft doslej izdal. Njegova hibridna zasnova NMT–LLM omogoča ekipam optimizacijo stroškov, zakasnitve in ustvarjalne natančnosti v enem samem klicu. Čeprav uvedba GPT-4o prek Azure AI Foundry prinaša dodatno nastavitev, je rezultat lokalizacija, ki je podobna človeški in zavedajoča se tona. Če se predogled stabilizira v splošno razpoložljivost, bi API Azure AI Translator lahko preoblikoval način, kako podjetja uravnavajo hitrost in nianse v lokalizacijskih potekih dela.

Pogosta vprašanja

V1: Kaj je API Azure AI Translator?

API Azure AI Translator je javno dostopna končna točka v predogledu, predstavljena 4. septembra 2025, ki združuje nevronsko strojno prevajanje z generativnim prevajanjem na osnovi GPT-4o v eni storitvi.

V2: Kako je API Azure AI Translator cenovno oblikovan?

Zahteve za NMT se obračunavajo na znak izvornega besedila, medtem ko se zahteve za GPT‑4o obračunavajo na vhodne in izhodne tokene, v skladu s cenovnimi smernicami v Microsoftovem obvestilu.

V3: Ali lahko v istem klicu mešam prevode NMT in GPT-4o?

Da—en JSON niz lahko na primer cilja nemščino z NMT in španščino z GPT‑4o, kot je prikazano v Microsoftovem dvojezičnem vzorcu.

V4: Kakšne so trenutne omejitve storitve med predogledom?

Klici NMT dovoljujejo do 1.000 elementov niza po 50 kB vsak, medtem ko klici GPT‑4o dovoljujejo 50 elementov po 5 kB, kot je navedeno v tabeli omejitev storitve.

V5: Ali potrebujem Azure AI Foundry za uporabo generativnega prevajanja?

Da, za dostop do funkcij generativnega prevajanja je potrebno zagnati GPT‑4o ali GPT‑4o‑mini znotraj vira Azure AI Foundry.