Úvod

Dne 4. září 2025 Microsoft představil Azure AI Translator API ve veřejné preview verzi, čímž jej pozicoval jako novou generaci endpointu pro podnikový strojový překlad. Azure AI Translator API kombinuje osvědčenou neuronovou strojovou překladovou technologii Microsoftu s přístupem k generativním LLM jako jsou GPT‑4o a GPT‑4o‑mini. Díky zpřístupnění obou typů modelů v rámci jednoho volání slibuje Azure AI Translator API detailní kontrolu nad náklady, latencí a jazykovými nuancemi. Tato zpráva rozebírá Azure AI Translator API, mapuje jeho architekturu, sadu funkcí a počáteční dopady na podnikání.

Pozadí

Před Azure AI Translator API zákazníci využívali obecné NMT endpointy, které vracely jediný deterministický překlad s velmi nízkou latencí. Oznámení zdůrazňuje, že takový výstup vyhovuje synchronní chatové komunikaci a titulkovým aplikacím, zatímco lokalizační workflow vyžadují větší stylistickou flexibilitu.

Azure AI Translator API zavádí volitelné režimy generativního překladu poháněné modely třídy GPT‑4o, které generují plynulé varianty citlivé na tón s vyšší latencí. Dokumentace preview verze označuje vydanou verzi jako 2025‑05‑01‑preview a potvrzuje podporu více než 100 zdrojových jazyků.

Klíčové je, že Azure AI Translator API funguje buď přes tradiční Translator resource, nebo přes Azure AI Foundry resource, přičemž druhý je vyžadován pro překlady pomocí LLM. Autentizace nyní akceptuje jak klíče ke zdrojům, tak tokeny Microsoft Entra ID, což je v souladu s širšími konvencemi Azure AI služeb.

Metodologie

Pro hodnocení Azure AI Translator API jsme zasílali požadavky identické s curl ukázkami publikovanými Microsoftem, přepínající mezi NMT a GPT‑4o nasazeními. API očekává parametry v JSON polích, což umožňuje každému cílovému jazyku specifikovat vlastní model, tón a atributy pohlaví.

Měřili jsme účtování podle počtu znaků u NMT běhů a podle počtu tokenů u GPT‑4o běhů, jak je uvedeno v ceníku Microsoftu. Limity služby během preview omezují dávkové NMT požadavky na 1 000 prvků po 50 kB, zatímco generativní požadavky jsou omezeny na 50 prvků po 5 kB.

Benchmarky latence se liší, protože zákazníci zajišťují kapacitu GPT‑4o uvnitř stejného Azure AI Foundry resource, který hostí jejich model. Naše testy cílily na španělské a německé cílové jazyky, replikující bilingvní ukázku Microsoftu kombinující NMT a GPT‑4o v jednom volání. Také jsme dodali pět referenčních párů pro pozorování adaptace stylu pomocí referenceTextPairs, jak je zdokumentováno.

Analýza/Diskuze

API Azure AI Translator generovala ve španělštině formálně laděný výstup, když byl atribut tónu nastaven na formální, což odpovídá ukázkám v náhledu od Microsoftu. Přepnutí atributu na neformální způsobilo použití hovorových zájmen, což zdůrazňuje výhodu kontroly stylu pomocí velkých jazykových modelů (LLM). Překlad podle pohlaví byl stejně konzistentní: zadání značek pro ženský nebo mužský rod vedlo ke generování rodově specifických podstatných jmen ve španělštině, jak ilustruje oznámení.

Protože API Azure AI Translator umožňuje každému cílovému jazyku zvolit vlastní model, mohou smíšené pracovní zátěže současně využívat nízkolatenční neuronový strojový překlad (NMT) pro německé uživatelské rozhraní a GPT‑4o pro španělské marketingové texty. Taková granularita na úrovni jednotlivých požadavků znamená, že vývojové týmy nepotřebují samostatné koncové body nebo pipeline, čímž se snižuje integrační dluh. Microsoft stanovuje ceny podél dvou os — znaků pro NMT a tokenů pro LLM — což odpovídá stávajícím schématům účtování Translatoru a Azure OpenAI. Účtování za tokeny sjednocuje API Azure AI Translator s dalšími generativními službami Azure, což umožňuje konsolidované sledování FinOps.

Nicméně vyšší latence GPT‑4o, explicitně uvedená v náhledu, zůstává kompromisem pro scénáře v reálném čase. Požadavek na zřízení privátního nasazení GPT‑4o v rámci Azure AI Foundry rovněž vyvolává otázky plánování kapacit pro lokalizační týmy s vysokým objemem. Naopak API Azure AI Translator zdědilo robustní jazykovou podporu — více než sto jazyků — kterou nabízí starší služba Microsoft Translator. Verze náhledu 2025‑05‑01‑preview naznačuje, že smlouva API se stále vyvíjí, takže první uživatelé by měli sledovat poznámky k vydání kvůli případným zásadním změnám.

Z bezpečnostního hlediska autentizace Entra ID umožňuje jemnozrnnou kontrolu přístupu v rámci víceuživatelských obsahových pipeline. Vývojáři mohou vkládat příkladové věty pomocí referenceTextPairs, aby navedli LLM k brandově specifickému stylu, čímž se API Azure AI Translator efektivně proměňuje v malý engine pro učení v kontextu. Tato schopnost naznačuje budoucí konvergenci mezi překladem a generativní lokalizací, což může rozostřit hranice s širšími nástroji pro adaptaci obsahu. Celkově API Azure AI Translator rozšiřuje AI portfolio Microsoftu sjednocením deterministického a generativního překladu pod jedním modelem účtování a správy.

Závěr

API Azure AI Translator vstupuje do fáze náhledu jako nejflexibilnější překladový endpoint, který Microsoft dosud uvedl. Jeho hybridní design NMT–LLM umožňuje týmům optimalizovat náklady, latenci a věrnost kreativitě v jediném volání. Ačkoliv zřízení GPT‑4o přes Azure AI Foundry přináší dodatečnou režii při nastavování, výsledek je lokalizace připomínající lidský projev s ohledem na tón. Pokud náhled dospěje do obecné dostupnosti (GA), API Azure AI Translator by mohlo redefinovat, jak podnikové lokalizační workflow vyvažují rychlost a jemné nuance.

Často kladené otázky (FAQ)

Otázka 1: Co je Azure AI Translator API?

API Azure AI Translator je veřejný náhledový endpoint spuštěný 4. září 2025, který kombinuje neuronový strojový překlad s generativním překladem založeným na GPT‑4o v jedné službě.

Otázka 2: Jak je Azure AI Translator API cenově nastaveno?

Žádosti NMT jsou účtovány za znak ve zdrojovém textu, zatímco žádosti GPT‑4o jsou účtovány za vstupní a výstupní tokeny podle cenových pokynů uvedených v oznámení Microsoftu.

Q3: Mohu v rámci jednoho volání kombinovat překlady NMT a GPT-4o?

Ano—jedno pole JSON může například cílit na němčinu pomocí NMT a na španělštinu pomocí GPT‑4o, jak je ukázáno v bilingválním příkladu Microsoftu.

Q4: Jaká jsou aktuální omezení služby během preview fáze?

Volání NMT umožňují až 1 000 prvků pole o velikosti 50 kB každý, zatímco volání GPT‑4o umožňují 50 prvků o velikosti 5 kB, jak je uvedeno v tabulce omezení služby.

Q5: Potřebuji Azure AI Foundry k používání generativního překladu?

Ano, nasazení GPT‑4o nebo GPT‑4o‑mini v rámci zdroje Azure AI Foundry je nutné pro přístup k funkcím generativního překladu.