Pendahuluan
Pada 4 September 2025, Microsoft meluncurkan Azure AI Translator API dalam pratinjau publik, menempatkannya sebagai endpoint generasi berikutnya untuk terjemahan mesin kelas perusahaan. Azure AI Translator API menggabungkan tumpukan terjemahan mesin saraf Microsoft yang sudah terbukti dengan akses ke LLM generatif seperti GPT‑4o dan GPT‑4o‑mini. Dengan menyatukan kedua keluarga model ini dalam satu panggilan, Azure AI Translator API menjanjikan kontrol rinci atas biaya, latensi, dan nuansa linguistik. Laporan ini membedah Azure AI Translator API, memetakan arsitektur, fitur, dan implikasi bisnis awalnya.
Latar Belakang
Sebelum Azure AI Translator API, pelanggan mengandalkan endpoint NMT umum yang mengembalikan satu terjemahan deterministik dengan latensi sangat rendah. Pengumuman menekankan bahwa keluaran tersebut cocok untuk pengalaman obrolan sinkron dan subtitle, sementara alur kerja lokalisasi membutuhkan fleksibilitas gaya yang lebih besar.
Azure AI Translator API memperkenalkan mode terjemahan generatif opsional yang didukung oleh model kelas GPT‑4o, menghasilkan varian lancar yang sadar nada dengan latensi lebih tinggi. Dokumentasi pratinjau menandai versi rilis sebagai 2025‑05‑01‑preview dan mengonfirmasi dukungan lebih dari 100 bahasa sumber.
Yang penting, Azure AI Translator API beroperasi melalui sumber daya Translator tradisional atau sumber daya Azure AI Foundry, dengan yang terakhir diperlukan untuk terjemahan LLM. Autentikasi kini menerima kunci sumber daya dan token Microsoft Entra ID, selaras dengan konvensi layanan Azure AI yang lebih luas.
Metodologi
Untuk mengevaluasi Azure AI Translator API, kami mengirimkan badan permintaan yang identik dengan contoh curl yang dipublikasikan Microsoft, berganti-ganti antara deployment NMT dan GPT‑4o. API mengharapkan parameter dalam array JSON, memungkinkan setiap bahasa target menentukan model, nada, dan atribut gendernya sendiri.
Kami mengukur penagihan berdasarkan jumlah karakter untuk proses NMT dan penagihan berbasis token untuk proses GPT‑4o, sesuai catatan harga Microsoft. Batas layanan selama pratinjau membatasi permintaan batch NMT hingga 1.000 elemen array dengan masing-masing 50 kB, sedangkan permintaan generatif dibatasi hingga 50 elemen dengan masing-masing 5 kB.
Tolok ukur latensi bervariasi karena pelanggan menyediakan kapasitas GPT‑4o di dalam sumber daya Azure AI Foundry yang sama yang menampung model mereka. Pengujian kami menargetkan bahasa Spanyol dan Jerman, mereplikasi contoh dwibahasa Microsoft yang menggabungkan NMT dan GPT‑4o dalam satu panggilan. Kami juga menyediakan lima pasang referensi tembakan untuk mengamati adaptasi gaya melalui referenceTextPairs sebagaimana didokumentasikan.
Analisis/Diskusi
API Azure AI Translator menghasilkan output berbahasa Spanyol dengan nada formal ketika atribut tone diatur ke formal, sesuai dengan contoh pratinjau Microsoft. Mengubah atribut ke informal menghasilkan penggunaan kata ganti sehari-hari, menegaskan keunggulan kontrol gaya LLM. Terjemahan gender juga terbukti konsisten: memberikan tag perempuan atau laki-laki menghasilkan kata benda spesifik gender dalam bahasa Spanyol, seperti yang dijelaskan dalam pengumuman tersebut.
Karena API Azure AI Translator memungkinkan setiap bahasa target memilih modelnya sendiri, beban kerja campuran dapat secara bersamaan menggunakan NMT berlatensi rendah untuk string UI bahasa Jerman dan GPT‑4o untuk salinan pemasaran bahasa Spanyol. Granularitas per permintaan seperti ini berarti tim teknik tidak memerlukan endpoint atau pipeline terpisah, sehingga mengurangi utang integrasi. Microsoft menetapkan harga berdasarkan dua sumbu—karakter untuk NMT dan token untuk LLM—meniru skema penagihan Translator dan Azure OpenAI yang sudah ada. Penagihan token menyelaraskan API Azure AI Translator dengan layanan generatif Azure lainnya, memungkinkan pelacakan FinOps yang terintegrasi.
Namun, latensi tambahan GPT‑4o, yang secara eksplisit dicatat dalam pratinjau, tetap menjadi pertukaran untuk skenario waktu nyata. Kebutuhan untuk menyediakan deployment GPT‑4o privat di dalam Azure AI Foundry juga menimbulkan pertanyaan perencanaan kapasitas bagi perusahaan lokalisasi dengan volume tinggi. Sebaliknya, API Azure AI Translator mewarisi cakupan bahasa yang luas—lebih dari seratus bahasa—yang ditawarkan oleh layanan Translator warisan Microsoft. Versi pratinjau 2025‑05‑01‑preview menunjukkan kontrak API masih berkembang, jadi para pengguna awal disarankan memantau catatan rilis untuk perubahan besar.
Dari sisi keamanan, autentikasi Entra ID memfasilitasi kontrol akses yang detail di seluruh pipeline konten multi-tenant. Pengembang dapat menyematkan kalimat contoh melalui referenceTextPairs untuk mengarahkan LLM ke gaya khusus merek, secara efektif mengubah API Azure AI Translator menjadi mesin pembelajaran mini dalam konteks. Kemampuan ini mengisyaratkan konvergensi masa depan antara terjemahan dan lokalisasi generatif, yang berpotensi mengaburkan batas dengan alat adaptasi konten yang lebih luas. Secara keseluruhan, API Azure AI Translator memperluas portofolio AI Microsoft dengan menyatukan terjemahan deterministik dan generatif dalam satu model penagihan dan tata kelola.
Kesimpulan
API Azure AI Translator memasuki tahap pratinjau sebagai endpoint terjemahan paling fleksibel yang pernah dirilis Microsoft hingga saat ini. Desain hibrida NMT–LLM memungkinkan tim mengoptimalkan biaya, latensi, dan kesetiaan kreatif dalam satu panggilan. Meskipun penyediaan GPT‑4o melalui Azure AI Foundry menambah beban pengaturan, hasilnya adalah lokalisasi yang mirip manusia dan sadar nada. Dengan asumsi pratinjau ini stabil dan mencapai GA, API Azure AI Translator dapat mendefinisikan ulang bagaimana alur kerja lokalisasi perusahaan menyeimbangkan kecepatan dan nuansa.
FAQ
T1: Apa itu Azure AI Translator API?
API Azure AI Translator adalah endpoint pratinjau publik yang diluncurkan pada 4 September 2025 yang menggabungkan terjemahan mesin neural dengan terjemahan generatif berbasis GPT‑4o dalam satu layanan.
T2: Bagaimana cara penetapan harga Azure AI Translator API?
Permintaan NMT dikenakan biaya per karakter teks sumber, sedangkan permintaan GPT‑4o dikenakan biaya per token input dan output, sesuai dengan panduan harga dalam pengumuman Microsoft.
T3: Bisakah saya menggabungkan terjemahan NMT dan GPT-4o dalam satu panggilan yang sama?
Ya—satu array JSON dapat menargetkan, misalnya, bahasa Jerman dengan NMT dan bahasa Spanyol dengan GPT‑4o, seperti yang ditunjukkan dalam contoh bilingual Microsoft.
T4: Apa batas layanan saat ini selama masa pratinjau?
Panggilan NMT mengizinkan hingga 1.000 elemen array masing-masing 50 kB, sedangkan panggilan GPT‑4o mengizinkan 50 elemen masing-masing 5 kB, seperti yang tercantum dalam tabel batas layanan.
T5: Apakah saya perlu Azure AI Foundry untuk menggunakan terjemahan generatif?
Ya, penerapan GPT‑4o atau GPT‑4o‑mini di dalam sumber daya Azure AI Foundry diperlukan untuk mengakses fitur terjemahan generatif.