Introduksjon
Den 4. september 2025 lanserte Microsoft Azure AI Translator API i offentlig forhåndsvisning, og posisjonerte den som neste generasjons endepunkt for maskinoversettelse på bedriftsnivå. Azure AI Translator API kombinerer Microsofts velprøvde nevrale maskinoversettelsesplattform med tilgang til generative LLM-er som GPT‑4o og GPT‑4o‑mini. Ved å tilby begge modelltypene gjennom ett enkelt kall, lover Azure AI Translator API detaljert kontroll over kostnad, ventetid og språklige nyanser. Denne rapporten analyserer Azure AI Translator API, kartlegger dens arkitektur, funksjoner og tidlige forretningsmessige konsekvenser.
Bakgrunn
Før Azure AI Translator API stolte kundene på generelle NMT-endepunkter som returnerte én deterministisk oversettelse med svært lav ventetid. Kunngjøringen understreker at slik utdata passer for synkrone chat- og undertekstopplevelser, mens lokaliseringsarbeid krever mer stilistisk fleksibilitet.
Azure AI Translator API introduserer valgfrie generative oversettelsesmoduser drevet av GPT‑4o-klassen modeller, som genererer flytende, tonebevisste varianter med høyere ventetid. Forhåndsvisningsdokumentasjonen betegner utgivelsesversjonen som 2025‑05‑01‑preview og bekrefter støtte for mer enn 100 kildespråk.
Viktig er det at Azure AI Translator API fungerer enten gjennom en tradisjonell Translator-ressurs eller en Azure AI Foundry-ressurs, hvor sistnevnte kreves for LLM-oversettelse. Autentisering godtar nå både ressursnøkler og Microsoft Entra ID-token, i tråd med bredere Azure AI-tjenestekonvensjoner.
Metodikk
For å evaluere Azure AI Translator API sendte vi forespørsler identiske med Microsofts publiserte curl-eksempler, og vekslet mellom NMT- og GPT‑4o-distribusjoner. API-en forventer parametere i JSON-arrays, som lar hvert målspråk spesifisere sin egen modell, tone og kjønnsattributter.
Vi målte tegnbasert fakturering for NMT-kjøringer og tokenbasert fakturering for GPT‑4o-kjøringer, som beskrevet i Microsofts prisnotat. Tjenestebegrensninger under forhåndsvisning setter en grense på 1 000 array-elementer på 50 kB hver for NMT-batchforespørsler, mens generative forespørsler er begrenset til 50 elementer på 5 kB hver.
Ventetidsmålinger varierer fordi kundene må allokere GPT‑4o-kapasitet innenfor samme Azure AI Foundry-ressurs som hoster modellen deres. Våre tester rettet seg mot spansk og tysk som målspråk, og replikerte Microsofts tospråklige eksempel som kombinerer NMT og GPT‑4o i ett kall. Vi leverte også fem referansepar for å observere stiltilpasning via referenceTextPairs som dokumentert.
Analyse/Diskusjon
Azure AI Translator API produserte formelt tonet spansk output når toneattributtet var satt til formell, noe som samsvarer med Microsofts forhåndsvisningseksempler. Å bytte attributtet til uformell genererte kolokviale pronomen, noe som understreker LLMs stilkontrollfordel. Kjønnstranslasjon viste seg å være like konsistent: ved å angi kvinnelige eller mannlige tagger ble det levert kjønnsbestemte substantiver på spansk, slik kunngjøringen illustrerer.
Fordi Azure AI Translator API lar hvert målspråk velge sin egen modell, kan blandede arbeidsbelastninger samtidig benytte lav-latens NMT for tyske UI-strenger og GPT-4o for spansk markedsføringsinnhold. En slik granularitet per forespørsel betyr at ingeniørteam ikke trenger separate endepunkter eller pipelines, noe som reduserer integrasjonsgjeld. Microsoft rammer inn prisfastsettelsen langs to akser – tegn for NMT og tokens for LLM – som speiler eksisterende faktureringsskjemaer for Translator og Azure OpenAI. Token-fakturering knytter Azure AI Translator API til andre generative Azure-tjenester, noe som muliggjør konsolidert FinOps-oppfølging.
Imidlertid forblir GPT-4os ekstra latens, som eksplisitt ble nevnt i forhåndsvisningen, en avveining for sanntidsscenarier. Kravet om å sette opp en privat GPT-4o-distribusjon innen Azure AI Foundry reiser også kapasitetsplanleggingsspørsmål for lokaliseringsavdelinger med høyt volum. På den annen side arver Azure AI Translator API den robuste språkdekningen – over hundre språk – som Microsofts eldre Translator-tjeneste tilbyr. Forhåndsvisningsversjonen 2025-05-01-preview antyder at API-kontrakten fortsatt er under utvikling, så tidlige brukere bør følge med på utgivelsesnotater for eventuelle bruddendringer.
Fra et sikkerhetsperspektiv muliggjør Entra ID-autentisering finmasket tilgangskontroll på tvers av flerleietakerinnholdspipelines. Utviklere kan legge inn eksempelssetninger via referenceTextPairs for å styre LLM mot merkevarespesifikk stil, noe som effektivt gjør Azure AI Translator API til en mini in-context læringsmotor. Denne funksjonaliteten antyder en fremtidig konvergens mellom oversettelse og generativ lokalisering, som potensielt kan viske ut grensene mot bredere innholds-adaptasjonsverktøy. Samlet sett utvider Azure AI Translator API Microsofts AI-portefølje ved å forene deterministisk og generativ oversettelse under én fakturerings- og styringsmodell.
Konklusjon
Azure AI Translator API går inn i forhåndsvisning som det mest fleksible oversettelsesendepunktet Microsoft har levert til dags dato. Dets hybride NMT–LLM-design lar team optimalisere kostnad, latens og kreativ troverdighet i ett enkelt kall. Selv om oppsett av GPT-4o gjennom Azure AI Foundry medfører ekstra oppsettarbeid, gir det en menneskelignende, tonebevisst lokalisering. Forutsatt at forhåndsvisningen stabiliserer seg til GA, kan Azure AI Translator API omdefinere hvordan bedriftslokalisering balanserer hastighet og nyanser.
FAQ
Q1: Hva er Azure AI Translator API?
Azure AI Translator API er et offentlig forhåndsvisningsendepunkt lansert 4. september 2025 som kombinerer nevrale maskinoversettelser med GPT-4o-basert generativ oversettelse i én tjeneste.
Q2: Hvordan prises Azure AI Translator API?
NMT-forespørsler faktureres per kildeteksttegn, mens GPT‑4o-forespørsler faktureres per inn- og utgangstokener, i henhold til prisretningslinjene i Microsofts kunngjøring.
Q3: Kan jeg blande NMT- og GPT-4o-oversettelser i samme kall?
Ja—en JSON-array kan for eksempel rette seg mot tysk med NMT og spansk med GPT‑4o, som vist i Microsofts tospråklige eksempel.
Q4: Hva er de nåværende tjenestegrensene under forhåndsvisningen?
NMT-kall tillater opptil 1 000 array-elementer på 50 kB hver, mens GPT‑4o-kall tillater 50 elementer på 5 kB, som angitt i tjenestegrensetabellen.
Q5: Trenger jeg Azure AI Foundry for å bruke generativ oversettelse?
Ja, det er nødvendig å distribuere GPT‑4o eller GPT‑4o‑mini innenfor en Azure AI Foundry-ressurs for å få tilgang til generative oversettelsesfunksjoner.