소개
2025년 9월 4일, Microsoft는 Azure AI Translator API를 공개 프리뷰로 발표하며 이를 차세대 엔터프라이즈급 기계 번역 엔드포인트로 자리매김했습니다. Azure AI Translator API는 Microsoft의 검증된 신경망 기계 번역 스택과 GPT‑4o 및 GPT‑4o‑mini 같은 생성형 LLM 접근을 통합합니다. 단일 호출로 두 모델 군을 모두 사용할 수 있게 함으로써, 비용, 지연 시간, 언어적 뉘앙스에 대한 세밀한 제어를 약속합니다. 본 보고서는 Azure AI Translator API의 아키텍처, 기능 세트, 초기 비즈니스 영향력을 분석합니다.
배경
Azure AI Translator API 이전에는 고객들이 매우 낮은 지연 시간으로 단일 결정론적 번역을 반환하는 일반 NMT 엔드포인트에 의존했습니다. 발표는 이러한 출력이 동기식 채팅 및 자막 경험에는 적합하지만, 현지화 워크플로우에는 더 많은 스타일적 유연성이 필요하다고 강조합니다.
Azure AI Translator API는 GPT‑4o급 모델이 지원하는 선택적 생성형 번역 모드를 도입하여, 더 높은 지연 시간에도 유창하고 톤 인식이 가능한 변형을 생성합니다. 프리뷰 문서에서는 릴리스 버전을 2025‑05‑01‑preview로 명시하며 100개 이상의 소스 언어를 지원함을 확인합니다.
중요하게도, Azure AI Translator API는 전통적인 Translator 리소스 또는 LLM 번역에 필요한 Azure AI Foundry 리소스를 통해 작동합니다. 인증은 이제 리소스 키와 Microsoft Entra ID 토큰 모두를 허용하여, 더 넓은 Azure AI 서비스 규칙과 일치합니다.
방법론
Azure AI Translator API를 평가하기 위해 Microsoft가 공개한 curl 샘플과 동일한 요청 본문을 발행하며 NMT와 GPT‑4o 배포를 전환했습니다. API는 JSON 배열 형식의 매개변수를 기대하며, 각 대상 언어가 자체 모델, 톤, 성별 속성을 지정할 수 있습니다.
Microsoft의 가격 정책에 따라 NMT 실행은 문자 수 기준으로, GPT‑4o 실행은 토큰 기반으로 과금되는 것을 측정했습니다. 프리뷰 기간 동안 서비스 제한은 NMT 배치 요청을 최대 1,000개 배열 요소(각 50kB)로, 생성형 요청은 최대 50개 요소(각 5kB)로 제한합니다.
지연 시간 벤치마크는 고객이 동일 Azure AI Foundry 리소스 내에서 GPT‑4o 용량을 프로비저닝하는 방식에 따라 다릅니다. 테스트는 스페인어 및 독일어 대상 언어를 목표로 하여, NMT와 GPT‑4o를 한 호출에 혼합한 Microsoft의 이중 언어 샘플을 재현했습니다. 또한 문서화된 대로 referenceTextPairs를 통해 스타일 적응을 관찰하기 위해 5개의 샷 참조 쌍을 제공했습니다.
분석/논의
Azure AI Translator API는 톤 속성을 정식으로 설정했을 때 Microsoft의 미리보기 예제와 일치하는 정중한 어조의 스페인어 출력을 생성했습니다. 톤 속성을 비격식으로 변경하면 구어체 대명사가 생성되어 LLM의 스타일 제어 장점을 강조했습니다. 성별 번역도 일관되게 작동했으며, 여성 또는 남성 태그를 제공하면 스페인어에서 성별에 맞는 명사가 생성된다는 발표 내용이 이를 보여줍니다.
Azure AI Translator API는 각 대상 언어가 자체 모델을 선택할 수 있도록 하여, 혼합 작업 부하가 독일어 UI 문자열에 대해 저지연 NMT를, 스페인어 마케팅 카피에 대해 GPT-4o를 동시에 처리할 수 있습니다. 요청별 세분화 덕분에 엔지니어링 팀은 별도의 엔드포인트나 파이프라인이 필요 없어 통합 부담이 줄어듭니다. Microsoft는 가격 책정을 NMT용 문자 수와 LLM용 토큰 수 두 축으로 구성하여 기존 Translator 및 Azure OpenAI 청구 체계와 일치시켰습니다. 토큰 청구는 Azure AI Translator API를 다른 생성형 Azure 서비스와 연계하여 통합된 FinOps 추적을 가능하게 합니다.
하지만 미리보기에서 명시된 바와 같이 GPT-4o의 추가 지연 시간은 실시간 시나리오에서의 트레이드오프로 남아 있습니다. 또한 Azure AI Foundry 내에 개인 GPT-4o 배포를 프로비저닝해야 하는 점은 대용량 현지화 업체의 용량 계획 문제를 제기합니다. 반면 Azure AI Translator API는 Microsoft의 기존 Translator 서비스가 제공하는 100개 이상의 언어 지원이라는 강력한 커버리지를 계승합니다. 2025-05-01-preview 버전은 API 계약이 아직 진화 중임을 시사하므로 초기 도입자는 릴리스 노트를 주의 깊게 확인해야 합니다.
보안 측면에서 Entra ID 인증은 다중 테넌트 콘텐츠 파이프라인 전반에 걸쳐 세밀한 접근 제어를 가능하게 합니다. 개발자는 referenceTextPairs를 통해 예문을 삽입하여 LLM이 브랜드 특화 스타일을 따르도록 유도할 수 있어 Azure AI Translator API를 미니 인컨텍스트 학습 엔진으로 활용할 수 있습니다. 이 기능은 번역과 생성형 현지화 간의 미래적 융합을 암시하며, 더 넓은 콘텐츠 적응 도구와의 경계를 흐릴 가능성이 있습니다. 종합하면 Azure AI Translator API는 결정론적 번역과 생성형 번역을 하나의 청구 및 거버넌스 모델로 통합하여 Microsoft의 AI 포트폴리오를 확장합니다.
결론
Azure AI Translator API는 지금까지 Microsoft가 출시한 가장 유연한 번역 엔드포인트로 미리보기 단계에 진입했습니다. 하이브리드 NMT–LLM 설계는 하나의 호출로 비용, 지연 시간, 창의적 충실도를 최적화할 수 있게 합니다. Azure AI Foundry를 통한 GPT-4o 프로비저닝은 추가 설정 부담을 동반하지만, 그 대가는 인간과 같은 톤 인지 현지화입니다. 미리보기가 정식 버전으로 안정화된다면, Azure AI Translator API는 기업 현지화 워크플로우가 속도와 뉘앙스 사이의 균형을 재정의할 수 있습니다.
자주 묻는 질문
Q1: Azure AI Translator API란 무엇인가요?
Azure AI Translator API는 2025년 9월 4일에 공개 미리보기로 출시된 엔드포인트로, 신경망 기계 번역과 GPT-4o 기반 생성 번역을 하나의 서비스로 결합합니다.
Q2: Azure AI Translator API의 가격 정책은 어떻게 되나요?
NMT 요청은 원문 텍스트 문자 수 기준으로 과금되며, GPT‑4o 요청은 입력 및 출력 토큰 수 기준으로 과금됩니다. 이는 Microsoft 발표의 가격 정책을 따릅니다.
Q3: 동일 호출 내에서 NMT와 GPT-4o 번역을 혼합할 수 있나요?
네—예를 들어, 하나의 JSON 배열에서 독일어는 NMT로, 스페인어는 GPT‑4o로 처리할 수 있으며, 이는 Microsoft의 이중언어 샘플에서 확인할 수 있습니다.
Q4: 현재 미리보기 기간 동안 서비스 제한은 어떻게 되나요?
NMT 호출은 각 50KB 크기의 배열 요소 1,000개까지 허용되며, GPT‑4o 호출은 5KB 크기의 배열 요소 50개까지 허용됩니다. 자세한 내용은 서비스 제한 표를 참고하세요.
Q5: 생성 번역을 사용하려면 Azure AI Foundry가 필요한가요?
네, 생성 번역 기능을 이용하려면 GPT‑4o 또는 GPT‑4o‑mini를 Azure AI Foundry 리소스 내에 배포해야 합니다.