Введение
4 сентября 2025 года Microsoft представила Azure AI Translator API в публичном превью, позиционируя его как новое поколение корпоративного машинного перевода. Azure AI Translator API объединяет проверенный стек нейронного машинного перевода Microsoft с доступом к генеративным LLM, таким как GPT‑4o и GPT‑4o‑mini. Предоставляя обе семейства моделей через единый вызов, Azure AI Translator API обещает тонкий контроль над стоимостью, задержкой и языковыми нюансами. В этом отчёте подробно рассматривается архитектура, функционал и первые бизнес-выводы по Azure AI Translator API.
Предыстория
До появления Azure AI Translator API клиенты использовали общие NMT конечные точки, которые возвращали единственный детерминированный перевод с очень низкой задержкой. В анонсе подчёркивается, что такой результат подходит для синхронного чата и субтитров, тогда как процессы локализации требуют большей стилистической гибкости.
Azure AI Translator API вводит опциональные режимы генеративного перевода на базе моделей класса GPT‑4o, создавая плавные, учитывающие тон варианты с более высокой задержкой. Документация превью обозначает версию релиза как 2025‑05‑01‑preview и подтверждает поддержку более 100 исходных языков.
Ключевым моментом является то, что Azure AI Translator API работает либо через традиционный ресурс Translator, либо через ресурс Azure AI Foundry, причём для перевода с помощью LLM требуется именно последний. Аутентификация теперь поддерживает как ключи ресурсов, так и токены Microsoft Entra ID, что соответствует общим стандартам сервисов Azure AI.
Методология
Для оценки Azure AI Translator API мы отправляли тела запросов, идентичные опубликованным Microsoft curl-примерам, переключаясь между развертываниями NMT и GPT‑4o. API принимает параметры в виде JSON-массивов, позволяя каждому целевому языку задавать собственные атрибуты модели, тона и гендера.
Мы измеряли оплату по количеству символов для NMT и по токенам для GPT‑4o, согласно ценовой политике Microsoft. Ограничения сервиса в превью ограничивают пакетные NMT-запросы 1000 элементами массива по 50 кБ каждый, а генеративные — 50 элементами по 5 кБ каждый.
Показатели задержки варьируются, поскольку клиенты выделяют мощность GPT‑4o внутри того же ресурса Azure AI Foundry, где размещена их модель. Наши тесты были нацелены на испанский и немецкий языки, повторяя двуязычный пример Microsoft с комбинированием NMT и GPT‑4o в одном вызове. Также мы предоставили пять пар эталонных примеров для наблюдения адаптации стиля через referenceTextPairs, как описано в документации.
Анализ/Обсуждение
API переводчика Azure AI выдавала формальный испанский текст при установке атрибута тона в значение «формальный», что соответствовало примерам предварительного просмотра Microsoft. При переключении атрибута на «неформальный» генерировались разговорные местоимения, подчёркивая преимущество LLM в контроле стиля. Перевод по гендерному признаку оказался столь же последовательным: указание тегов «женский» или «мужской» приводило к использованию соответствующих гендерных существительных в испанском языке, как показано в анонсе.
Поскольку API переводчика Azure AI позволяет для каждого целевого языка выбирать собственную модель, смешанные рабочие нагрузки могут одновременно использовать NMT с низкой задержкой для немецких строк интерфейса и GPT‑4o для испанских маркетинговых текстов. Такая детализация на уровне каждого запроса означает, что инженерным командам не нужны отдельные конечные точки или конвейеры, что снижает интеграционные издержки. Microsoft формирует ценообразование по двум осям — символы для NMT и токены для LLM — что отражает существующие схемы биллинга Translator и Azure OpenAI. Оплата по токенам выравнивает API переводчика Azure AI с другими генеративными сервисами Azure, позволяя объединённо отслеживать финансовые операции.
Однако дополнительная задержка GPT‑4o, явно отмеченная в предварительном просмотре, остаётся компромиссом для сценариев реального времени. Требование развернуть приватное GPT‑4o внутри Azure AI Foundry также вызывает вопросы планирования ёмкости для крупных локализационных компаний. С другой стороны, API переводчика Azure AI наследует широкий охват языков — более сотни языков — предоставляемый устаревшим сервисом Translator от Microsoft. Версия предварительного просмотра 2025‑05‑01‑preview указывает на то, что контракт API всё ещё развивается, поэтому ранним пользователям следует внимательно следить за заметками к выпуску на предмет критичных изменений.
С точки зрения безопасности, аутентификация Entra ID обеспечивает тонкий контроль доступа в многоарендных конвейерах контента. Разработчики могут вставлять примерные предложения через referenceTextPairs, чтобы направлять LLM в сторону фирменного стиля, эффективно превращая API переводчика Azure AI в мини-движок обучения на контексте. Эта возможность намекает на будущее сближение перевода и генеративной локализации, что потенциально размывает границы с более широкими инструментами адаптации контента. В совокупности API переводчика Azure AI расширяет портфель ИИ Microsoft, объединяя детерминированный и генеративный перевод в рамках единой модели биллинга и управления.
Заключение
API переводчика Azure AI выходит в предварительный просмотр как самая гибкая конечная точка перевода, выпущенная Microsoft на сегодняшний день. Его гибридный дизайн NMT–LLM позволяет командам оптимизировать затраты, задержку и творческую точность в одном вызове. Хотя развертывание GPT‑4o через Azure AI Foundry требует дополнительных настроек, результатом становится человекоподобная локализация с учётом тона. При условии стабилизации предварительного просмотра и выхода в GA, API переводчика Azure AI может изменить подход к балансировке скорости и нюансов в корпоративных локализационных рабочих процессах.
Часто задаваемые вопросы
В1: Что такое API переводчика Azure AI?
API переводчика Azure AI — это конечная точка публичного предварительного просмотра, запущенная 4 сентября 2025 года, которая объединяет нейронный машинный перевод с генеративным переводом на базе GPT‑4o в одном сервисе.
В2: Как формируется цена на API переводчика Azure AI?
Запросы NMT тарифицируются за символ исходного текста, а запросы GPT‑4o — за входные и выходные токены, согласно ценовой политике, изложенной в объявлении Microsoft.
В3: Могу ли я использовать переводы NMT и GPT-4o в одном и том же вызове?
Да — один JSON-массив может, например, содержать немецкий язык с NMT и испанский с GPT‑4o, как показано в двуязычном примере Microsoft.
В4: Каковы текущие ограничения сервиса во время предварительного просмотра?
Вызовы NMT допускают до 1000 элементов массива по 50 КБ каждый, тогда как вызовы GPT‑4o допускают 50 элементов по 5 КБ, как указано в таблице ограничений сервиса.
В5: Нужно ли использовать Azure AI Foundry для работы с генеративным переводом?
Да, для доступа к функциям генеративного перевода необходимо развернуть GPT‑4o или GPT‑4o‑mini внутри ресурса Azure AI Foundry.