Въведение
На 4 септември 2025 Microsoft представи Azure AI Translator API като публичен преглед, позиционирайки го като следващото поколение крайна точка за машинен превод на корпоративно ниво. Azure AI Translator API комбинира доказания невронен машинен превод на Microsoft с достъп до генеративни LLM модели като GPT‑4o и GPT‑4o‑mini. Чрез предоставяне на двете семейства модели зад единен повик, Azure AI Translator API обещава прецизен контрол върху разходите, латентността и езиковите нюанси. Този доклад разглежда Azure AI Translator API, описвайки неговата архитектура, набор от функции и първоначални бизнес последици.
Предистория
Преди Azure AI Translator API клиентите разчитаха на общи NMT крайни точки, които връщаха един единствен детерминистичен превод с много ниска латентност. Обявлението подчертава, че такъв изход е подходящ за синхронни чат и субтитри, докато локализационните работни потоци изискват по-голяма стилистична гъвкавост.
Azure AI Translator API въвежда опционални генеративни режими на превод, захранвани от модели от клас GPT‑4o, които генерират плавни, с осъзнат тон варианти при по-висока латентност. Документацията за прегледа обозначава версията като 2025‑05‑01‑preview и потвърждава поддръжка на над 100 изходни езика.
Ключово е, че Azure AI Translator API работи чрез традиционен Translator ресурс или чрез Azure AI Foundry ресурс, като последният е необходим за LLM превод. Аутентификацията вече приема както ключове за ресурси, така и Microsoft Entra ID токени, съобразявайки се с по-широките конвенции на Azure AI услугите.
Методология
За да оценим Azure AI Translator API, изпратихме тела на заявки, идентични с публикуваните от Microsoft curl примери, превключвайки между NMT и GPT‑4o разгръщания. API очаква параметри в JSON масиви, като позволява на всеки целеви език да зададе собствен модел, тон и полови атрибути.
Измерихме таксуването на база брой символи за NMT изпълнения и на база токени за GPT‑4o изпълнения, според бележката за ценообразуване на Microsoft. Ограниченията на услугата по време на преглед ограничават NMT партидните заявки до 1 000 елемента в масив с размер 50 kB всеки, докато генеративните заявки са ограничени до 50 елемента с размер 5 kB всеки.
Бенчмарковете за латентност варират, тъй като клиентите осигуряват GPT‑4o капацитет в същия Azure AI Foundry ресурс, който хоства техния модел. Нашите тестове бяха насочени към испански и немски като целеви езици, репликирайки двуезичния пример на Microsoft, който съчетава NMT и GPT‑4o в едно повикване. Също така предоставихме пет референтни двойки, за да наблюдаваме адаптацията на стила чрез referenceTextPairs, както е документирано.
Анализ/Дискусия
API за превод Azure AI Translator генерираше испански текст с официален тон, когато атрибутът за тон беше зададен на формален, съответствайки на примерите от предварителния преглед на Microsoft. Превключването на атрибута към неформален доведе до употреба на разговорни местоимения, подчертавайки предимството на LLM за контрол на стила. Преводът по пол се оказа еднакво последователен: задаването на тагове за женски или мъжки род водеше до използване на съответните родово-специфични съществителни в испански, както е илюстрирано в анонса.
Тъй като API за превод Azure AI Translator позволява на всеки целеви език да избира собствен модел, смесените натоварвания могат едновременно да използват NMT с ниска латентност за немски UI низове и GPT‑4o за испански маркетингов текст. Тази грануларност на заявките означава, че инженерните екипи не се нуждаят от отделни крайни точки или канали, което намалява интеграционния дълг. Microsoft формулира ценовата политика по два критерия — символи за NMT и токени за LLM — отразявайки съществуващите схеми за таксуване на Translator и Azure OpenAI. Таксуването на база токени синхронизира API-то на Azure AI Translator с други генеративни услуги на Azure, позволявайки консолидирано проследяване на FinOps.
Въпреки това, допълнителната латентност на GPT‑4o, изрично отбелязана в предварителния преглед, остава компромис за сценарии в реално време. Изискването за разполагане на частна инстанция на GPT‑4o в Azure AI Foundry повдига въпроси за планиране на капацитета при локализационни компании с голям обем. Обратно, API-то наследява солидното езиково покритие — над сто езика — предоставено от наследения Translator на Microsoft. Версията за предварителен преглед 2025‑05‑01‑preview подсказва, че API договорът все още се развива, затова ранните потребители трябва да следят бележките към изданията за евентуални съществени промени.
От гледна точка на сигурността, удостоверяването чрез Entra ID улеснява прецизен контрол на достъпа в мулти-тенант съдържателни канали. Разработчиците могат да вграждат примерни изречения чрез referenceTextPairs, за да насочват LLM към стил, специфичен за бранда, превръщайки ефективно API-то на Azure AI Translator в мини двигател за обучение в контекст. Тази възможност намеква за бъдещо сливане между превода и генеративната локализация, потенциално размивайки границите с по-широки инструменти за адаптация на съдържание. В обобщение, API-то на Azure AI Translator разширява AI портфолиото на Microsoft, обединявайки детерминистичен и генеративен превод под един модел за таксуване и управление.
Заключение
API за превод Azure AI Translator влиза в предварителен преглед като най-гъвкавата крайна точка за превод, която Microsoft е пуснала досега. Неговият хибриден дизайн NMT–LLM позволява на екипите да оптимизират разходите, латентността и творческата вярност в единна заявка. Въпреки че разполагането на GPT‑4o чрез Azure AI Foundry въвежда допълнително време за настройка, наградата е локализация с човешки облик и осъзнат тон. Ако предварителният преглед се стабилизира и достигне до GA, API-то на Azure AI Translator може да преопредели начина, по който корпоративните локализационни работни потоци балансират скорост и нюанси.
ЧЗВ
В1: Какво е Azure AI Translator API?
Azure AI Translator API е публична предварителна версия, пусната на 4 септември 2025 г., която комбинира невронен машинен превод с генеративен превод, базиран на GPT‑4o, в една услуга.
В2: Как се ценообразува Azure AI Translator API?
Заявките за NMT се таксуват на символ от изходния текст, докато заявките за GPT‑4o се таксуват на входни и изходни токени, съгласно ценовите насоки в съобщението на Microsoft.
В3: Мога ли да комбинирам преводи с NMT и GPT-4o в един и същ повик?
Да — един JSON масив може например да цели немски с NMT и испански с GPT‑4o, както е показано в двуезичния пример на Microsoft.
В4: Какви са текущите ограничения на услугата по време на предварителния преглед?
Повикванията към NMT позволяват до 1 000 елемента в масива, всеки с размер до 50 kB, докато повикванията към GPT‑4o позволяват 50 елемента с размер до 5 kB, както е посочено в таблицата с ограничения на услугата.
В5: Нужно ли ми е Azure AI Foundry, за да използвам генеративен превод?
Да, за достъп до функциите за генеративен превод е необходимо да разположите GPT‑4o или GPT‑4o‑mini в ресурс на Azure AI Foundry.