Introducció

El 4 de setembre de 2025, Microsoft va presentar l'API Azure AI Translator en vista prèvia pública, posicionant-la com el punt d'accés de nova generació per a traducció automàtica d'empresa. L'API Azure AI Translator combina l'eficaç pila de traducció neuronal de Microsoft amb l'accés a LLM generatius com GPT‑4o i GPT‑4o‑mini. En exposar ambdues famílies de models darrere d'una única crida, l'API Azure AI Translator promet un control detallat sobre cost, latència i matisos lingüístics. Aquest informe analitza l'API Azure AI Translator, descrivint la seva arquitectura, conjunt de funcions i les primeres implicacions empresarials.

Context

Abans de l'API Azure AI Translator, els clients es basaven en punts d'accés NMT generals que retornaven una única traducció determinista amb latència molt baixa. L'anunci destaca que aquest tipus de sortida s'adapta a experiències de xat sincrònic i subtítols, mentre que els fluxos de treball de localització requereixen més flexibilitat estilística.

L'API Azure AI Translator introdueix modes opcionals de traducció generativa impulsats per models de classe GPT‑4o, que generen variants fluides i conscients del to amb una latència més alta. La documentació de la vista prèvia etiqueta la versió de llançament com a 2025‑05‑01‑preview i confirma que es donen suport a més de 100 idiomes d'origen.

De manera crucial, l'API Azure AI Translator opera a través d'un recurs Translator tradicional o un recurs Azure AI Foundry, essent aquest últim necessari per a la traducció amb LLM. L'autenticació accepta ara tant claus de recurs com tokens Microsoft Entra ID, alineant-se amb les convencions més àmplies dels serveis Azure AI.

Metodologia

Per avaluar l'API Azure AI Translator, vam enviar cossos de sol·licitud idèntics als exemples curl publicats per Microsoft, alternant entre desplegaments NMT i GPT‑4o. L'API espera paràmetres en matrius JSON, permetent que cada idioma de destinació especifiqui el seu propi model, to i atributs de gènere.

Vam mesurar la facturació per nombre de caràcters en execucions NMT i la facturació basada en tokens per a execucions GPT‑4o, tal com s'especifica en la nota de preus de Microsoft. Els límits del servei durant la vista prèvia limiten les sol·licituds per lots NMT a 1.000 elements en matriu de 50 kB cadascun, mentre que les sol·licituds generatives es limiten a 50 elements de 5 kB cadascun.

Els punts de referència de latència varien perquè els clients proveeixen capacitat GPT‑4o dins del mateix recurs Azure AI Foundry que allotja el seu model. Les nostres proves es van centrar en objectius en espanyol i alemany, replicant l'exemple bilingüe de Microsoft que combina NMT i GPT‑4o en una sola crida. També vam proporcionar cinc parells de referència per observar l'adaptació d'estil mitjançant referenceTextPairs, tal com es documenta.

Anàlisi/Discussió

L'API Azure AI Translator va generar una sortida en espanyol de to formal quan l'atribut de to es va configurar com a formal, coincidint amb els exemples de previsualització de Microsoft. Canviar l'atribut a informal va produir pronoms col·loquials, destacant l'avantatge de control d'estil del LLM. La traducció de gènere va resultar igualment consistent: proporcionar etiquetes femenines o masculines va donar lloc a noms específics de gènere en espanyol, tal com il·lustra l'anunci.

Com que l'API Azure AI Translator permet que cada idioma de destinació triï el seu propi model, càrregues de treball mixtes poden utilitzar simultàniament NMT de baixa latència per a cadenes d'interfície d'usuari en alemany i GPT‑4o per a còpia de màrqueting en espanyol. Aquesta granularitat per sol·licitud significa que els equips d'enginyeria no necessiten punts finals o canals separats, reduint el deute d'integració. Microsoft estructura la tarifació en dues dimensions—caràcters per NMT i tokens per LLM—reflectint els esquemes de facturació existents de Translator i Azure OpenAI. La facturació per tokens alinea l'API Azure AI Translator amb altres serveis generatius d'Azure, permetent un seguiment consolidat de FinOps.

Tanmateix, la latència addicional de GPT‑4o, destacada explícitament en la previsualització, continua sent un compromís en escenaris en temps real. El requisit de provisionar una implementació privada de GPT‑4o dins d'Azure AI Foundry també planteja qüestions de planificació de capacitat per a empreses de localització d'alt volum. En canvi, l'API Azure AI Translator hereta la cobertura lingüística robusta—més d'un centenar d'idiomes—oferta pel servei clàssic Translator de Microsoft. La versió de previsualització 2025‑05‑01‑preview suggereix que el contracte de l'API encara està en evolució, així que els primers usuaris haurien de seguir les notes de llançament per a canvis importants.

Des del punt de vista de la seguretat, l'autenticació Entra ID facilita un control d'accés molt detallat en canals de contingut multiinquilí. Els desenvolupadors poden inserir frases d'exemple mitjançant referenceTextPairs per induir el LLM cap a un estil específic de marca, convertint efectivament l'API Azure AI Translator en un petit motor d'aprenentatge en context. Aquesta capacitat apunta a una futura convergència entre la traducció i la localització generativa, que podria esborrar les línies amb eines més àmplies d'adaptació de contingut. En conjunt, l'API Azure AI Translator amplia el portafolis d'IA de Microsoft unificant la traducció determinista i generativa sota un mateix model de facturació i governança.

Conclusió

L'API Azure AI Translator entra en previsualització com el punt final de traducció més flexible que Microsoft ha llançat fins ara. El seu disseny híbrid NMT–LLM permet als equips optimitzar cost, latència i fidelitat creativa en una sola crida. Tot i que el provisionament de GPT‑4o a través d'Azure AI Foundry introdueix una càrrega addicional de configuració, el benefici és una localització amb to humà i conscient del to. Suposant que la previsualització es consolidi en GA, l'API Azure AI Translator podria redefinir com els fluxos de treball de localització empresarial equilibren velocitat i matisos.

Preguntes freqüents

P1: Què és l'API Azure AI Translator?

L'API Azure AI Translator és un punt final en previsualització pública llançat el 4 de setembre de 2025 que combina traducció automàtica neuronal amb traducció generativa basada en GPT‑4o en un sol servei.

P2: Com es fixa el preu de l'API Azure AI Translator?

Les sol·licituds NMT es facturen per caràcter del text d’origen, mentre que les sol·licituds GPT‑4o es facturen per token d’entrada i sortida, seguint les directrius de preus de l’anunci de Microsoft.

P3: Puc combinar traduccions NMT i GPT-4o dins la mateixa crida?

Sí: un únic array JSON pot dirigir-se, per exemple, a l’alemany amb NMT i al castellà amb GPT‑4o, tal com es mostra a l’exemple bilingüe de Microsoft.

P4: Quins són els límits actuals del servei durant la vista prèvia?

Les crides NMT permeten fins a 1.000 elements d’array de 50 kB cadascun, mentre que les crides GPT‑4o permeten 50 elements de 5 kB, segons la taula de límits del servei.

P5: Necessito Azure AI Foundry per utilitzar la traducció generativa?

Sí, cal desplegar GPT‑4o o GPT‑4o‑mini dins un recurs Azure AI Foundry per accedir a les funcionalitats de traducció generativa.