Вступ

4 вересня 2025 року Microsoft представила Azure AI Translator API у публічному прев’ю, позиціонуючи його як наступне покоління сервісу машинного перекладу корпоративного рівня. Azure AI Translator API поєднує перевірений стек нейронного машинного перекладу Microsoft з доступом до генеративних великих мовних моделей, таких як GPT‑4o та GPT‑4o‑mini. Завдяки тому, що обидві сімейства моделей доступні через єдиний виклик, Azure AI Translator API обіцяє точний контроль над вартістю, затримкою та лінгвістичними нюансами. У цьому звіті розглянуто архітектуру, набір функцій та ранні бізнес-наслідки Azure AI Translator API.

Передумови

До появи Azure AI Translator API клієнти користувалися загальними кінцевими точками нейронного машинного перекладу, які повертали один детермінований переклад з дуже низькою затримкою. Оголошення підкреслює, що такий результат підходить для синхронного чату та субтитрів, тоді як процеси локалізації вимагають більшої стилістичної гнучкості.

Azure AI Translator API вводить опціональні режими генеративного перекладу на базі моделей класу GPT‑4o, що створюють плавні, тонально адаптовані варіанти з більшою затримкою. Документація прев’ю позначає релізну версію як 2025‑05‑01‑preview і підтверджує підтримку понад 100 мов джерела.

Важливо, що Azure AI Translator API працює через традиційний ресурс Translator або ресурс Azure AI Foundry, причому для перекладу LLM потрібен саме Azure AI Foundry. Аутентифікація тепер підтримує як ключі ресурсів, так і токени Microsoft Entra ID, що узгоджується з ширшими конвенціями сервісів Azure AI.

Методологія

Для оцінки Azure AI Translator API ми відправляли запити, ідентичні опублікованим Microsoft прикладам curl, переключаючись між розгортаннями NMT та GPT‑4o. API очікує параметри у вигляді JSON-масивів, що дозволяє кожній цільовій мові задавати власні моделі, тон та гендерні атрибути.

Ми вимірювали облік за кількістю символів для запусків NMT та за токенами для запусків GPT‑4o, як зазначено у ціновій політиці Microsoft. Ліміти сервісу під час прев’ю обмежують пакетні запити NMT до 1000 елементів масиву по 50 КБ кожен, а генеративні запити — до 50 елементів по 5 КБ кожен.

Показники затримки варіюються, оскільки клієнти виділяють потужність GPT‑4o у межах того самого ресурсу Azure AI Foundry, де розміщена їхня модель. Наші тести були орієнтовані на іспанську та німецьку мови, повторюючи двомовний приклад Microsoft, що поєднує NMT та GPT‑4o в одному виклику. Ми також надали п’ять пар довідкових зразків, щоб спостерігати адаптацію стилю через параметр referenceTextPairs, як описано в документації.

Аналіз/Обговорення

API перекладача Azure AI Translator виробляв офіційно витриманий іспанський текст, коли атрибут тону був встановлений на формальний, що відповідало прикладам попереднього перегляду Microsoft. Перемикання атрибута на неформальний генерувало розмовні займенники, підкреслюючи перевагу контролю стилю LLM. Переклад за родом також був послідовним: надання тегів жіночого або чоловічого роду призводило до відповідних іменників іспанською, як ілюструє оголошення.

Оскільки API перекладача Azure AI Translator дозволяє кожній цільовій мові вибирати власну модель, змішані робочі навантаження можуть одночасно використовувати низьколатентний NMT для німецьких рядків інтерфейсу та GPT‑4o для іспанських маркетингових текстів. Така деталізація на рівні запиту означає, що інженерні команди не потребують окремих кінцевих точок або конвеєрів, що зменшує борг інтеграції. Microsoft формує ціноутворення за двома осями — символи для NMT та токени для LLM — відображаючи існуючі схеми білінгу Translator і Azure OpenAI. Оплата за токени узгоджує API перекладача Azure AI Translator з іншими генеративними сервісами Azure, дозволяючи консолідоване фінансове управління (FinOps).

Однак додаткова затримка GPT‑4o, явно зазначена в попередньому перегляді, залишається компромісом для сценаріїв у реальному часі. Вимога розгортання приватного GPT‑4o всередині Azure AI Foundry також ставить питання планування ємності для великих локалізаційних компаній. З іншого боку, API перекладача Azure AI Translator успадковує потужне покриття мов — понад сто мов — яке пропонує спадковий сервіс Translator від Microsoft. Версія попереднього перегляду 2025‑05‑01‑preview свідчить, що контракт API все ще розвивається, тому ранні користувачі повинні стежити за нотатками випуску щодо критичних змін.

З точки зору безпеки, автентифікація Entra ID забезпечує тонкий контроль доступу в багатокористувацьких конвеєрах контенту. Розробники можуть вбудовувати приклади речень через referenceTextPairs, щоб направити LLM до стилю, специфічного для бренду, ефективно перетворюючи API перекладача Azure AI Translator на міні-двигун навчання в контексті. Ця можливість натякає на майбутнє зближення перекладу та генеративної локалізації, потенційно розмиваючи межі з більш широкими інструментами адаптації контенту. У сукупності API перекладача Azure AI Translator розширює портфоліо штучного інтелекту Microsoft, об’єднуючи детермінований і генеративний переклад під єдиною моделлю білінгу та управління.

Висновок

API перекладача Azure AI Translator виходить у попередній перегляд як найгнучкіша кінцева точка перекладу, яку Microsoft випустила на сьогодні. Його гібридний дизайн NMT–LLM дозволяє командам оптимізувати вартість, затримку та креативну точність в одному виклику. Хоча розгортання GPT‑4o через Azure AI Foundry додає додаткових налаштувань, результатом є локалізація з людським виглядом і врахуванням тону. Якщо попередній перегляд стабілізується до загальнодоступної версії, API перекладача Azure AI Translator може переосмислити баланс швидкості та нюансів у корпоративних локалізаційних робочих процесах.

Поширені запитання

П1: Що таке Azure AI Translator API?

API перекладача Azure AI Translator — це кінцева точка публічного попереднього перегляду, запущена 4 вересня 2025 року, яка поєднує нейронний машинний переклад із генеративним перекладом на основі GPT‑4o в одному сервісі.

П2: Як формується ціна на Azure AI Translator API?

Запити NMT оплачуються за кількістю символів у вихідному тексті, тоді як запити GPT‑4o оплачуються за кількістю вхідних та вихідних токенів відповідно до цінової політики, описаної в анонсі Microsoft.

Питання 3: Чи можна поєднувати переклади NMT і GPT-4o в одному виклику?

Так — один JSON-масив може, наприклад, містити переклади німецькою за допомогою NMT та іспанською за допомогою GPT‑4o, як показано в двомовному прикладі Microsoft.

Питання 4: Які поточні обмеження сервісу під час прев’ю?

Виклики NMT допускають до 1 000 елементів масиву по 50 КБ кожен, тоді як виклики GPT‑4o — 50 елементів по 5 КБ, як зазначено в таблиці обмежень сервісу.

Питання 5: Чи потрібен Azure AI Foundry для використання генеративного перекладу?

Так, для доступу до функцій генеративного перекладу необхідно розгортати GPT‑4o або GPT‑4o‑mini у ресурсі Azure AI Foundry.