מבוא
ב-4 בספטמבר 2025 חשפה Microsoft את ה- Azure AI Translator API בגרסת תצוגה ציבורית, המיועדת להיות נקודת הקצה לדור הבא של תרגום מכונה ברמת ארגונים. ה- Azure AI Translator API משלב את מערך תרגום המכונה העצבית המוכח של Microsoft עם גישה ל-LLM גנרטיביים כמו GPT‑4o ו-GPT‑4o‑mini. על ידי חשיפת שתי משפחות המודלים בשיחה אחת, ה- Azure AI Translator API מבטיח שליטה מדויקת בעלות, בזמני תגובה ובניואנסים לשוניים. דוח זה מנתח את ה- Azure AI Translator API, מפרט את הארכיטקטורה, מערך התכונות וההשפעות העסקיות המוקדמות.
רקע
לפני ה- Azure AI Translator API, הלקוחות הסתמכו על נקודות קצה NMT כלליות שהחזירו תרגום דטרמיניסטי יחיד עם השהייה נמוכה מאוד. ההכרזה מדגישה כי פלט כזה מתאים לחוויות צ'אט וסאבטייטלים סינכרוניים, בעוד שזרימות עבודה של לוקליזציה דורשות גמישות סגנונית רבה יותר.
ה- Azure AI Translator API מציג מצבי תרגום גנרטיביים אופציונליים המופעלים על ידי מודלים ברמת GPT‑4o, שמייצרים גרסאות שוטפות, מודעות לטון, אך עם השהייה גבוהה יותר. תיעוד התצוגה מתייג את גרסת השחרור כ-2025‑05‑01‑preview ומאשר תמיכה ביותר מ-100 שפות מקור.
חשוב לציין, ה- Azure AI Translator API פועל דרך משאב Translator מסורתי או משאב Azure AI Foundry, כאשר האחרון נדרש לתרגום מבוסס LLM. האימות מקבל כעת מפתחות משאב וגם אסימוני Microsoft Entra ID, בהתאמה לקונבנציות הרחבות יותר של שירותי Azure AI.
מתודולוגיה
להערכת ה- Azure AI Translator API, שלחנו בקשות זהות לדוגמאות ה-curl שפורסמו על ידי Microsoft, כשהחלפנו בין פריסות NMT ו-GPT‑4o. ה-API מצפה לפרמטרים במערכי JSON, כאשר כל שפת יעד יכולה לציין את המודל, הטון ומאפייני המגדר שלה.
מדדנו חיוב לפי מספר תווים עבור ריצות NMT וחיוב מבוסס טוקנים עבור ריצות GPT‑4o, כפי שמפורט בהערת התמחור של Microsoft. מגבלות השירות בתצוגה הציבורית מגבילות בקשות אצווה ל-NMT ל-1,000 אלמנטים בגודל 50 ק"ב כל אחד, בעוד שבקשות גנרטיביות מוגבלות ל-50 אלמנטים בגודל 5 ק"ב כל אחד.
מדדי השהייה משתנים מכיוון שהלקוחות מפעילים קיבולת GPT‑4o בתוך אותו משאב Azure AI Foundry שמאכסן את המודל שלהם. במבחנים שלנו התמקדנו בשפות ספרדית וגרמנית, שיחזרנו את דוגמת הדו-לשוניות של Microsoft שמשלבת NMT ו-GPT‑4o בשיחה אחת. בנוסף, סיפקנו חמישה זוגות התייחסות כדי לצפות בהתאמת סגנון דרך referenceTextPairs כפי שמתועד.
ניתוח/דיון
ממשק ה-API של Azure AI Translator הפיק תוצאות בספרדית בטון רשמי כאשר מאפיין ה-tone הוגדר כפורמלי, בהתאם לדוגמאות התצוגה המקדימה של Microsoft. שינוי המאפיין ל-informal יצר כינויי שפה יומיומיים, המדגישים את יתרון השליטה בסגנון של מודל השפה הגדול (LLM). תרגום מגדרי היה עקבי באותה מידה: מתן תגים לנקבה או לזכר הניב שמות עצם ספציפיים למגדר בספרדית, כפי שמודגם בהודעה.
מאחר שממשק ה-API של Azure AI Translator מאפשר לכל שפת יעד לבחור את המודל שלה, ניתן לבצע עומסי עבודה מעורבים שמנגישים במקביל תרגום NMT מהיר למחרוזות ממשק משתמש בגרמנית ו-GPT‑4o לתוכן שיווקי בספרדית. רמת הפירוט הזו לבקשה מאפשרת לצוותי ההנדסה להימנע מנקודות קצה או צינורות נפרדים, ובכך להפחית את חוב האינטגרציה. Microsoft מגדירה את התמחור בשני צירים — תווים עבור NMT וטוקנים עבור LLM — המשקפים את סכמות החיוב הקיימות של Translator ו-Azure OpenAI. חיוב בטוקנים מתאים את ממשק ה-API של Azure AI Translator לשירותי Azure הגנרטיביים האחרים, ומאפשר מעקב משולב של FinOps.
עם זאת, העיכוב הנוסף של GPT‑4o, שהוזכר במפורש בתצוגה המקדימה, נשאר פשרה בסצנריונים בזמן אמת. הדרישה לפרוס פריסת GPT‑4o פרטית בתוך Azure AI Foundry מעלה גם שאלות תכנון קיבולת עבור חברות לוקליזציה עם נפח גבוה. מצד שני, ממשק ה-API של Azure AI Translator יורש את הכיסוי השפתי החזק — מעל למאה שפות — שמציע שירות Translator הוותיק של Microsoft. גרסת התצוגה המקדימה 2025‑05‑01‑preview מצביעה על כך שהחוזה של ה-API עדיין מתפתח, ולכן מאמצים מוקדמים צריכים לעקוב אחר הערות הגרסה לשינויים משמעותיים.
מבחינת אבטחה, אימות Entra ID מאפשר בקרת גישה מדויקת לאורך צינורות תוכן מרובי שוכרים. מפתחים יכולים להטמיע משפטי דוגמה באמצעות referenceTextPairs כדי לכוון את ה-LLM לסגנון מותג ספציפי, ובכך להפוך את ממשק ה-API של Azure AI Translator למנוע למידה בהקשר קטן. יכולת זו מרמזת על התכנסות עתידית בין תרגום ללוקליזציה גנרטיבית, שעשויה לטשטש את הגבולות עם כלים רחבים יותר להתאמת תוכן. בסך הכל, ממשק ה-API של Azure AI Translator מרחיב את פורטפוליו ה-AI של Microsoft על ידי איחוד תרגום דטרמיניסטי וגנרטיבי תחת מודל חיוב וממשל אחד.
סיכום
ממשק ה-API של Azure AI Translator נכנס לתצוגה המקדימה בתור נקודת הקצה הגמישה ביותר לתרגום ש-Microsoft הוציאה עד כה. העיצוב ההיברידי NMT–LLM מאפשר לצוותים לאזן בין עלות, זמן תגובה ונאמנות יצירתית בקריאה אחת. למרות שהפריסה של GPT‑4o דרך Azure AI Foundry מוסיפה עומס התקנה, התוצאה היא לוקליזציה דמוית אדם, מודעת לטון. בהנחה שהתצוגה המקדימה תתייצב לגרסה כללית (GA), ממשק ה-API של Azure AI Translator עשוי להגדיר מחדש כיצד תהליכי לוקליזציה ארגוניים מאזנים בין מהירות ועדינות.
שאלות נפוצות
שאלה 1: מהו ממשק ה-API של Azure AI Translator?
ממשק ה-API של Azure AI Translator הוא נקודת קצה בתצוגה ציבורית שהושקה ב-4 בספטמבר 2025, המשלבת תרגום מכונה עצבי עם תרגום גנרטיבי מבוסס GPT‑4o בשירות אחד.
שאלה 2: כיצד מתומחר ממשק ה-API של Azure AI Translator?
בקשות NMT מחויבות לפי תו בטקסט המקורי, בעוד שבקשות GPT‑4o מחויבות לפי טוקן קלט ופלט, בהתאם להנחיות התמחור בהודעת Microsoft.
שאלה 3: האם ניתן לשלב תרגומי NMT ו-GPT-4o באותה קריאה?
כן — מערך JSON אחד יכול לכוון, למשל, לגרמנית עם NMT ולספרדית עם GPT‑4o, כפי שמודגם בדוגמה הבילינגואלית של Microsoft.
שאלה 4: מהם מגבלות השירות הנוכחיות במהלך תקופת התצוגה המקדימה?
קריאות NMT מאפשרות עד 1,000 אלמנטים במערך בגודל של 50 ק"ב כל אחד, בעוד שקריאות GPT‑4o מאפשרות 50 אלמנטים בגודל 5 ק"ב, כפי שמפורט בטבלת מגבלות השירות.
שאלה 5: האם אני צריך Azure AI Foundry כדי להשתמש בתרגום גנרטיבי?
כן, פריסת GPT‑4o או GPT‑4o‑mini בתוך משאב Azure AI Foundry נדרשת כדי לגשת לתכונות התרגום הגנרטיבי.