Introduktion

Den 4 september 2025 lanserade Microsoft Azure AI Translator API i offentlig förhandsgranskning, positionerat som nästa generations endpoint för företagsklassad maskinöversättning. Azure AI Translator API kombinerar Microsofts beprövade neurala maskinöversättningsstack med tillgång till generativa LLM:er som GPT‑4o och GPT‑4o‑mini. Genom att exponera båda modellfamiljerna via ett enda anrop lovar Azure AI Translator API detaljerad kontroll över kostnad, latens och språkliga nyanser. Denna rapport analyserar Azure AI Translator API, kartlägger dess arkitektur, funktioner och tidiga affärskonsekvenser.

Bakgrund

Innan Azure AI Translator API förlitade sig kunder på generella NMT-endpoints som returnerade en enda deterministisk översättning med mycket låg latens. Meddelandet understryker att sådan output passar synkrona chattar och undertextupplevelser, medan lokaliseringsarbetsflöden kräver större stilistisk flexibilitet.

Azure AI Translator API introducerar valfria generativa översättningslägen drivna av GPT‑4o‑klassmodeller, som genererar flytande och tonmedvetna varianter med högre latens. Förhandsgranskningsdokumentationen betecknar versionsnumret som 2025‑05‑01‑preview och bekräftar stöd för över 100 källspråk.

Viktigt är att Azure AI Translator API fungerar antingen via en traditionell Translator-resurs eller en Azure AI Foundry-resurs, där den senare krävs för LLM-översättning. Autentisering accepterar nu både resursnycklar och Microsoft Entra ID-token, i linje med bredare Azure AI-tjänstkonventioner.

Metodik

För att utvärdera Azure AI Translator API skickade vi förfrågningskroppar identiska med Microsofts publicerade curl-exempel, med växling mellan NMT- och GPT‑4o-distributioner. API:et förväntar sig parametrar i JSON-arrayer, där varje målspråk kan specificera sin egen modell, ton och genusattribut.

Vi mätte teckenräkningsbaserad debitering för NMT-körningar och tokenbaserad debitering för GPT‑4o-körningar, enligt Microsofts prissättningsnotis. Tjänstgränser under förhandsgranskningen sätter tak på NMT-batchförfrågningar till 1 000 arrayelement om 50 kB vardera, medan generativa förfrågningar är begränsade till 50 element om 5 kB vardera.

Latensmätningar varierar eftersom kunder tillhandahåller GPT‑4o-kapacitet inom samma Azure AI Foundry-resurs som deras modell är värd i. Våra tester riktade sig mot spanska och tyska mål, och replikerade Microsofts tvåspråkiga exempel som kombinerar NMT och GPT‑4o i ett anrop. Vi tillhandahöll även fem referenspar för att observera stilanpassning via referenceTextPairs enligt dokumentationen.

Analys/Diskussion

Azure AI Translator API producerade formellt tonat spanskt innehåll när tonattributet sattes till formellt, vilket överensstämde med Microsofts exempel i förhandsvisningen. Att byta attributet till informellt genererade vardagliga pronomen, vilket understryker LLM:s fördel när det gäller stilkontroll. Könsöversättning visade sig vara lika konsekvent: att ange kvinnliga eller manliga taggar resulterade i könsspecifika substantiv på spanska, som tillkännagivandet illustrerar.

Eftersom Azure AI Translator API låter varje målspråk välja sin egen modell kan blandade arbetsbelastningar samtidigt hantera låglatens-NMT för tyska UI-strängar och GPT-4o för spansk marknadsföringstext. Denna per-förfrågan granularitet innebär att ingen särskild slutpunkt eller pipeline behövs för ingenjörsteam, vilket minskar integrationsskulden. Microsoft prissätter utifrån två axlar – tecken för NMT och tokens för LLM – vilket speglar befintliga faktureringsmodeller för Translator och Azure OpenAI. Token-fakturering anpassar Azure AI Translator API med andra generativa Azure-tjänster, vilket möjliggör samlad FinOps-uppföljning.

GPT-4os extra latens, som tydligt nämns i förhandsvisningen, kvarstår dock som en kompromiss i realtidsscenarier. Kravet på att tillhandahålla en privat GPT-4o-distribution inom Azure AI Foundry väcker också kapacitetsplaneringsfrågor för lokaliseringsföretag med hög volym. Å andra sidan ärver Azure AI Translator API den robusta språkstödet – över hundra språk – som erbjuds av Microsofts äldre Translator-tjänst. Förhandsvisningsversionen 2025-05-01-preview antyder att API-kontraktet fortfarande utvecklas, så tidiga användare bör följa versionsnoteringarna för eventuella brytande förändringar.

Ur ett säkerhetsperspektiv möjliggör Entra ID-autentisering finmaskig åtkomstkontroll över flermandantsinnehållspipelines. Utvecklare kan infoga exempelmeningar via referenceTextPairs för att styra LLM mot varumärkesspecifik stil, vilket effektivt förvandlar Azure AI Translator API till en mini in-context learning-motor. Denna funktion antyder en framtida konvergens mellan översättning och generativ lokalisering, vilket potentiellt suddar ut gränserna mot bredare innehållsanpassningsverktyg. Sammanfattningsvis utvidgar Azure AI Translator API Microsofts AI-portfölj genom att förena deterministisk och generativ översättning under en gemensam fakturerings- och styrmodell.

Slutsats

Azure AI Translator API går in i förhandsvisning som den mest flexibla översättningsslutpunkten Microsoft hittills lanserat. Dess hybriddesign med NMT och LLM låter team optimera kostnad, latens och kreativ trohet i ett enda anrop. Även om provisionering av GPT-4o via Azure AI Foundry medför extra installationsarbete, är vinsten en människolik, tonmedveten lokalisering. Förutsatt att förhandsvisningen stabiliseras till GA kan Azure AI Translator API omdefiniera hur företagslokalisering hanterar balansen mellan snabbhet och nyanser.

Vanliga frågor

F1: Vad är Azure AI Translator API?

Azure AI Translator API är en publikt förhandsvisad slutpunkt som lanserades den 4 september 2025 och kombinerar neurala maskinöversättningar med GPT-4o-baserad generativ översättning i en och samma tjänst.

F2: Hur prissätts Azure AI Translator API?

NMT-förfrågningar debiteras per tecken i källtexten, medan GPT-4o-förfrågningar debiteras per in- och utdata-token, enligt prisriktlinjerna i Microsofts tillkännagivande.

Q3: Kan jag blanda NMT- och GPT-4o-översättningar inom samma anrop?

Ja – en JSON-array kan till exempel rikta sig till tyska med NMT och spanska med GPT-4o, som visas i Microsofts tvåspråkiga exempel.

Q4: Vilka är de nuvarande servicelimiteringarna under förhandsgranskningen?

NMT-anrop tillåter upp till 1 000 array-element på 50 kB vardera, medan GPT-4o-anrop tillåter 50 element på 5 kB, enligt tabellen för servicelimiteringar.

Q5: Behöver jag Azure AI Foundry för att använda generativ översättning?

Ja, det krävs att GPT-4o eller GPT-4o-mini distribueras inom en Azure AI Foundry-resurs för att få tillgång till generativa översättningsfunktioner.