تعارف: ترجمہ ایک ورک فلو کا مسئلہ ہے، نہ کہ لغت کا مسئلہ
AI میں ہر تبدیلی ایک جیسی غلطی کو دعوت دیتی ہے: ہم ماڈل پر توجہ مرکوز کرتے ہیں اور ورک فلو سے محروم ہو جاتے ہیں۔ ترجمہ ایک بہترین مثال ہے۔ 2024 میں مشکل مسئلہ الفاظ کو ایک زبان سے دوسری زبان میں تبدیل کرنا نہیں ہے—جدید ترین ماڈل صارفین کی سطح پر اس میں کافی اچھے ہیں۔ مشکل مسئلہ ساخت اور فارمیٹنگ کو برقرار رکھتے ہوئے ترجمہ کرنا ہے: ہیڈنگز، بلٹس، ٹیبلز، کوڈ بلاکس، ڈیزائن ٹوکنز، اور برانڈ وائس۔ دوسرے لفظوں میں، مشکل حصہ اصل دستاویز کی سالمیت کو برقرار رکھنا ہے۔
یہ ایک تکنیکی سوال کے ساتھ ساتھ ایک کاروباری سوال بھی ہے۔ ادارے ترجمے نہیں خریدتے؛ وہ تھرو پٹ اور فिडیلٹی خریدتے ہیں—مواد کتنی تیزی سے زبانوں میں لے آؤٹس، اسٹائل گائیڈز، یا جائزہ سائیکلز کو توڑے بغیر منتقل ہوتا ہے۔ اس مضمون کا تھیسس سیدھا سادا ہے: AI کے ساتھ ترجمہ کیسے کریں اور اپنی اصل فارمیٹنگ کو کیسے برقرار رکھیں اس کا انحصار ماڈل اور دستاویز کے درمیان انٹرفیس کو کنٹرول کرنے پر ہے۔ جیتنے والے نظام فارمیٹنگ کو ڈیٹا کے طور پر لیتے ہیں، نہ کہ سجاوٹ کے طور پر۔
یہ مضمون پریکٹیشنرز کے لیے ایک عملی رہنما ہے، لیکن گہرا تناظر اسٹریٹجک ہے۔ میں ایک عملی ورک فلو، اس کے پیچھے اصولوں، اور اس کی وضاحت کروں گا کہ AI ترجمے میں جیتنے والے فارمیٹنگ کے تحفظ کو پہلے درجے کی صلاحیت کے طور پر مربوط کریں گے، نہ کہ پوسٹ پروسیسنگ مرحلے کے طور پر۔
پس منظر: اسٹرنگ ٹرانسلیشن سے اسٹرکچرڈ ٹرانسلیشن تک
روایتی ترجمے کا اسٹیک لکیری تھا: متن نکالیں، لسانیات دانوں یا انجنوں کو بھیجیں، متن کو دوبارہ داخل کریں، فارمیٹنگ کو ٹھیک کریں، دہرائیں۔ رکاوٹیں معیار اور قیمت تھیں۔ نیورل مشین ٹرانسلیشن (NMT) نے معیار کو بہتر بنایا؛ کلاؤڈ ڈیلیوری نے قیمت کو بہتر بنایا۔ لیکن دونوں نے انسانی زبان اور دستاویز کی ساخت کے درمیان ساختی عدم مطابقت کو حل نہیں کیا۔ ایک پیراگراف کا مطلب ہوتا ہے، لیکن اسی طرح ایک بلیٹ درجہ بندی، ایک ٹیبل اسکیما، یا {{FirstName}} جیسے ٹوکنز والا ایک ٹیمپلیٹ بھی معنی رکھتا ہے۔
AI LLMs نے دو مواقع متعارف کرائے:
- ٹوکن آگاہی: اگر رکاوٹیں واضح ہوں تو ماڈلز کو مارک اپ کا احترام کرنے کی ہدایت کی جا سکتی ہے۔
- سیاق و سباق کی ونڈوز: ماڈلز ساختی اشارے—ہیڈنگز، فہرستیں، HTML ٹیگز—پڑھ سکتے ہیں اور مناسب طریقے سے ہدایت دیے جانے پر پیٹرن کی نقل کر سکتے ہیں۔
خطرہ بھی اتنا ہی واضح ہے: غیر محدود ماڈلز ڈیزائن کے لحاظ سے تخلیقی ہوتے ہیں۔ تخلیقی صلاحیت فارمیٹنگ کو توڑ دیتی ہے۔ لہذا کلیدی سوال صرف یہ نہیں ہے کہ "AI کے ساتھ ترجمہ کیسے کریں" بلکہ "AI کے ساتھ ترجمہ کیسے کریں اور اپنی اصل فارمیٹنگ کو برقرار کیسے رکھیں۔" جواب یہ ہے کہ ساخت کو واضح کریں، ٹیمپلیٹس کے ساتھ آؤٹ پٹ کو محدود کریں، اور فارمیٹنگ آرٹیکٹس کو ماڈل کی آزادی کی ڈگریوں سے باہر رکھیں۔
طریقہ کار: ایک عملی، دہرانے کے قابل ورک فلو
یہ فارمیٹ کے تحفظ کے ساتھ AI ترجمے کے لیے سب سے آسان دفاعی ورک فلو ہے۔ یہ دستاویزات (Word, Google Docs, PDFs)، ویب صفحات (HTML/Markdown)، اور اسٹرکچرڈ مواد (Notion, wikis, knowledge bases) کے لیے کام کرتا ہے۔
مرحلہ 1: مواد-ساخت کا نقشہ نکالیں
- مقصد: اصل لے آؤٹ کو تباہ کیے بغیر مواد کو ساخت سے الگ کریں۔
- طریقہ: دستاویز کو مواد کے بلاکس کے ایک سیٹ کے طور پر پیش کریں، ہر ایک ID اور ساخت کے ڈسکرپٹر کے ساتھ (مثال کے طور پر، H1, H2, p, li, table-cell[r,c], code-block, alt-text, caption)۔
- ٹولز: HTML/Markdown کے لیے، DOM/AST استعمال کریں؛ DOCX کے لیے، OOXML استعمال کریں؛ PDFs کے لیے، لے آؤٹ سے آگاہ پارسر استعمال کریں جو کوآرڈینیٹس کے ساتھ پڑھنے کے آرڈر کو دوبارہ تعمیر کرے؛ CMS مواد کے لیے، مواد کی اقسام کے ساتھ JSON حاصل کریں۔
- آؤٹ پٹ: ایک JSON اریے جیسے کہ:
- {id: "b1", type: "h1", content: "AI کے ساتھ ترجمہ کیسے کریں اور اپنی اصل فارمیٹنگ کو برقرار رکھیں"}
- {id: "b2", type: "p", content: "یہ گائیڈ وضاحت کرتی ہے…"}
- {id: "t1:r2c3", type: "table-cell", schema: "pricing-table", content: "$29"}
اہم بات یہ ہے کہ اصل فارمیٹنگ (قسم، اسکیما، آرڈر) کو میٹا ڈیٹا کے طور پر محفوظ کیا گیا ہے۔ ہم ماڈل سے صرف مواد کے فیلڈز کا ترجمہ کرنے کو کہیں گے۔
مرحلہ 2: آؤٹ پٹ کی رکاوٹیں اور ٹیمپلیٹس کی وضاحت کریں
- مقصد: ماڈل کو ایسے تراجم واپس کرنے تک محدود کریں جو بالکل ساخت کے نقشے میں فٹ ہوں۔
- طریقہ: ایک سخت اسکیما فراہم کریں اور ماڈل سے صرف ترجمے کے فیلڈز کو آؤٹ پٹ کرنے کا تقاضا کریں، خود ساخت کو نہیں۔ ٹوکنز اور متغیرات ({{name}}, %d, HTML entities) کو ایک محفوظ شکل میں شامل کریں۔
- مثال کے طور پر سسٹم/فوری رکاوٹیں:
- “آپ ترجمہ کر رہے ہیں۔ تمام مارک اپ، ٹوکنز، پلیس ہولڈرز، اور کیپٹلائزیشن کو بالکل برقرار رکھیں۔ ٹیگز یا ٹوکنز کو شامل یا حذف نہ کریں۔ صرف ٹیگز کے درمیان متن کا ترجمہ کریں۔ نمبرز، کوڈ، یا ڈیزائن ٹوکنز کو تبدیل نہ کریں۔ ان پٹ IDs سے ملنے والا JSON واپس کریں۔”
یہ سافٹ ویئر میں ٹائپڈ انٹرفیس کے فعال مساوی ہے: اگر ماڈل ساخت کو تبدیل کرنے کی کوشش کرتا ہے تو یہ زور سے ناکام ہو جائے گا۔
مرحلہ 3: ساخت کو توڑے بغیر سیاق و سباق کے لیے سیگمنٹ
- مقصد: ترجمے میں ہم آہنگی (محاورات، ضمیر) کو برقرار رکھیں جبکہ سیاق و سباق کی ونڈو کے اوور فلو سے بچیں۔
- طریقہ: منطقی حصوں کے لحاظ سے مواد کے بلاکس کو بیچ کریں (H2 + اس کے پیراگراف اور فہرستیں)۔ اگر وہ ہیڈرز کا اشتراک کرتے ہیں تو ٹیبلز کو ایک ساتھ رکھیں۔ طویل دستاویزات کے لیے، ماڈل کے ذریعے حصوں کو اوور لیپنگ سیاق و سباق کے ساتھ سٹریم کریں (حوالہ اشارے کے طور پر پہلے/اگلے ہیڈنگز)۔ یہ سیاق و سباق کو وشوسنییتا کے ساتھ متوازن کرتا ہے۔
مرحلہ 4: پہلے اور بعد میں پروسیسنگ کے قواعد
- برانڈڈ اصطلاحات کو محفوظ کریں: ایک لغت فراہم کریں (ترجمہ نہ کریں اور ترجیحی تراجم) اور غیر ترجمہ کے قابل اسپین کے ساتھ اصطلاحات کو نشان زد کرنے کے لیے ایک پری پاس چلائیں۔
- کوڈ اور ان لائن فارمولوں کی حفاظت کریں: کوڈ اسپینز اور ریاضی کو ٹیگز سے گھیریں جن میں ماڈل کو ترمیم نہیں کرنی چاہیے۔
- وائٹ اسپیس اور رموز اوقاف کو معمول پر لائیں: ترجمے کے بعد لوکیل کے لیے مخصوص ٹائپوگرافی کے اصولوں کو نافذ کریں (مثال کے طور پر، «:» سے پہلے فرانسیسی غیر بریکنگ اسپیس؛ جہاں متعلقہ ہو وہاں جاپانی مکمل چوڑائی والے رموز اوقاف)۔
- لنکس اور اینکرز کی توثیق کریں: اس بات کو یقینی بنائیں کہ IDs اور hrefs ماڈل کے ذریعے تبدیل نہیں کیے گئے ہیں۔
مرحلہ 5: خودکار QA: اسکیما، ڈِف، اور لے آؤٹ چیکس
- اسکیما کی توثیق: تصدیق کریں کہ تمام IDs ملتے ہیں، کوئی فیلڈ غائب نہیں ہے، اور کوئی اضافی فیلڈ ظاہر نہیں ہوتا ہے۔
- سٹرنگ ڈِف: ان تبدیلیوں کو نمایاں کریں جہاں غیر ترجمہ کے قابل ٹوکنز منتقل ہوئے یا تبدیل ہوئے۔
- لے آؤٹ رینڈر: تراجم داخل کرنے کے ساتھ دستاویز کو دوبارہ تعمیر کریں اور ہیورسٹکس چلائیں (مثال کے طور پر، لائنیں اوور فلو ہوتی ہیں، ٹیبل سیلز کلپ ہوتے ہیں، بلیٹ نیسٹنگ محفوظ ہوتی ہے)۔ ویب مواد کے لیے، ایک ہیڈ لیس براؤزر سنیپ شاٹ اوور فلو اور RTL/LTR مسائل کو نشان زد کر سکتا ہے۔
مرحلہ 6: جہاں اہمیت ہو وہاں ہیومن-ان-دی-لوپ ایڈیٹنگ
- اعلیٰ اثر والے حصے (ہیڈ لائنز، CTAs، قانونی) انسانی جائزے کے مستحق ہیں۔ طویل دم والے مواد کو گارڈ ریلز پاس ہونے کے بعد مشین سے ہی بھیجا جا سکتا ہے۔
- ایڈیٹرز کو بلاک لیول سیاق و سباق اور پیش نظارہ فراہم کریں۔ ایڈٹس کو سسٹم کی سالمیت کو برقرار رکھنے کے لیے براہ راست رینڈرڈ آؤٹ پٹ میں نہیں، بلکہ JSON ساخت میں واپس جانا چاہیے۔
مرحلہ 7: ترجمے کی یادداشت کو شائع اور کیش کریں
- سیاق و سباق (قسم، پیرنٹ ہیڈنگ) کے ساتھ ماخذ بلاک → ترجمہ شدہ بلاک کے جوڑوں کو ترجمے کی یادداشت کے طور پر اسٹور کریں۔ مستقبل کی اپ ڈیٹس صرف تبدیل شدہ بلاکس کا دوبارہ ترجمہ کرتی ہیں۔
- یہ لاگت کو کم کرتا ہے اور وقت کے ساتھ ساتھ لہجے کو مستحکم کرتا ہے۔
فریم ورکس: یہ کیوں کام کرتا ہے
تین لینسز نقطہ نظر کی وضاحت کرتے ہیں۔
- مقدمہ: LLMs احتمالی ہیں۔ فارمیٹنگ کو برقرار رکھنے کا واحد مضبوط طریقہ ماڈل کی آزادی کو صرف ایک کام تک محدود کرنا ہے جو اہمیت رکھتا ہے: متن کا ترجمہ کرنا۔
- میکانزم: سخت اسکیما، محفوظ ٹوکنز، اور بلاک IDs زبان اور لے آؤٹ کے درمیان ایک انٹرفیس نافذ کرتے ہیں۔ یہ سافٹ ویئر انجینئرنگ کی عکاسی کرتا ہے: ٹائپڈ انٹرفیس ڈاؤن اسٹریم ایررز کو روکتے ہیں۔
- ورک فلوز پر لاگو ایگریگیشن تھیوری
- مقدمہ: وہ ادارہ جو ورک فلو کے لیے صارف انٹرفیس کو کنٹرول کرتا ہے—صارفین دستاویزات کو کیسے لوڈ کرتے ہیں، تراجم کا جائزہ لیتے ہیں، اور شائع کرتے ہیں—طلب کو حاصل کرتا ہے۔ انجن قابل تبادلہ ہیں؛ ورک فلوز نہیں۔
- نتیجہ: "AI کے ساتھ ترجمہ کیسے کریں اور اپنی اصل فارمیٹنگ کو کیسے برقرار رکھیں" کامل ماڈل کا انتخاب کرنے سے کم اور پوائنٹ آف یوز انٹرفیس کی ملکیت کے بارے میں زیادہ ہے، جہاں فارمیٹنگ کا تحفظ ایک بلٹ ان صلاحیت ہے۔
- سسٹمک کوالٹی > پوائنٹ کوالٹی
- مقدمہ: انفرادی جملے کا معیار نظام کے تھرو پٹ کے معیار سے کم اہمیت رکھتا ہے جب قدر کی اکائی ایک مکمل، فارمیٹڈ اثاثہ ہو۔
- نتیجہ: ساخت، توثیق، اور یادداشت کے ارد گرد آٹومیشن ماڈلز کو تبدیل کرنے سے حاصل ہونے والے معمولی فوائد سے زیادہ کاروباری قدر پیدا کرتا ہے۔
صحیح ماڈل کا انتخاب—اور یہ کیوں ثانوی ہے
ماڈلز کے درمیان معنی خیز اختلافات ہیں (ہیلوسینیشن ریٹ، ہدایات پر عمل کرنا، طویل سیاق و سباق)۔ لیکن فارمیٹنگ کا مسئلہ صرف ماڈل اپ گریڈ سے حل نہیں ہوگا۔ ترجیح دیں:
- ہدایات پر عمل درآمد: کیا ماڈل "ٹیگز/ٹوکنز کو مت چھوئیں" کی رکاوٹوں کا احترام کرتا ہے؟
- طویل سیاق و سباق کی فڈیلیٹی: کیا یہ ملٹی سیکشن دستاویزات میں مستقل مزاجی برقرار رکھ سکتا ہے؟
- لیٹنسی/لاگت: کیا آپ ٹرناراؤنڈ SLAs کو پورا کرنے کے لیے کافی متوازی کالز چلا سکتے ہیں؟
عملی طور پر، روٹنگ پرت کے ساتھ ایک ملٹی ماڈل نقطہ نظر عملی ہے: اسٹرکچرڈ مواد کے لیے ہدایت پر عمل کرنے والے ماڈلز، مارکیٹنگ کاپی کے لیے بڑے ماڈلز جو نزاکت کا تقاضا کرتے ہیں، اور قانونی یا طبی مواد کے لیے ڈومین سے منسلک ماڈلز استعمال کریں۔ انٹرفیس اور توثیق پرتیں ایک جیسی رہتی ہیں، جو کہ نکتہ ہے: ورک فلو کو ماڈل چرن سے الگ کریں۔
ایج کیسز اور ان سے کیسے نمٹا جائے
- ضم شدہ سیلز کے ساتھ ٹیبلز: میٹا ڈیٹا میں ضم کو پیش کریں اور ترجمے کے بعد سیل کی گنتی کی توثیق کریں۔ اگر ہدف کی زبان متن کو بڑھاتی ہے، تو اسٹائل لغت سے متحرک کالم کی چوڑائیوں یا مخففات پر غور کریں۔
- RTL زبانیں: بلاک لیول پر سمت کو واضح طور پر نشان زد کریں اور براؤزر میں رینڈرنگ کی جانچ کریں۔ یقینی بنائیں کہ رموز اوقاف کو عکس بندی کے قوانین پر پوسٹ پروسیس میں لاگو کیا گیا ہے۔
- ہائیفنیشن اور لائن بریکس: آؤٹ پٹ میں صوابدیدی ہائیفنیشن کو غیر فعال کریں۔ CSS یا ورڈ پروسیسر کو بریکس کو ہینڈل کرنے دیں۔
- کوڈ بلاکس اور YAML/JSON سنیپٹس: انہیں منجمد کریں۔ اگر تبصروں کو ترجمے کی ضرورت ہے، تو انہیں کوڈ نحو سے الگ کریں۔
- Alt ٹیکسٹ اور قابل رسائی: سیاق و سباق کے ساتھ alt ٹیکسٹ کا ترجمہ کریں، لیکن ARIA صفات اور رولز کو محفوظ کریں۔
- عدد اور اکائیاں: لوکیل کے معیارات (اعشاریہ جداکار، ہزار جداکار، پیمائش کی اکائیاں) کے مطابق بنائیں، لیکن "سخت" اقدار (IDs, SKUs, کرنسی کوڈز) کو پن کریں۔
کاروباری کیس: رفتار، فڈیلیٹی، اور کنٹرول
اصل فارمیٹنگ کو محفوظ رکھنا اتنا اہم کیوں ہے؟ کیونکہ فارمیٹنگ لاگت ہے۔ ہر ٹوٹا ہوا لے آؤٹ دستی مرمت کو متحرک کرتا ہے: ٹیکسٹ باکسز کا سائز تبدیل کرنا، بلیٹ لیولز کو ٹھیک کرنا، ٹیبلز کو دوبارہ بہانا، یا بٹنوں میں فٹ ہونے کے لیے CTAs کو دوبارہ لکھنا۔ AI-صرف ترجمہ جو ساخت کو نظر انداز کرتا ہے وہ لاگت کو محض نیچے کی طرف منتقل کرتا ہے۔
تین میٹرکس ROI کو حاصل کرتے ہیں:
- پہلے پاس کی اشاعت کی شرح: ترجمہ شدہ اثاثوں کا فیصد جن کو دستی لے آؤٹ ایڈٹس کی ضرورت نہیں ہے۔
- اشاعت کا وقت: ماخذ ڈرافٹ سے لوکلائزڈ ریلیز تک اینڈ ٹو اینڈ لیٹنسی۔
- مسلسل مزاجی ڈیلٹا: اسٹائل گائیڈ کے مقابلے میں زبانوں میں اصطلاحات میں فرق۔
ان میٹرکس کے لیے اصلاح کے لیے انٹرفیس پرت پر عمل درآمد کی ضرورت ہے۔ صحیح نظام "AI کے ساتھ ترجمہ کیسے کریں اور اپنی اصل فارمیٹنگ کو کیسے برقرار رکھیں" کو ایک بہادر کوشش نہیں بلکہ ڈیفالٹ نتیجہ بناتا ہے۔
ایک ٹھوس، دوبارہ قابل استعمال پرامپٹ پیٹرن
ذیل میں فارمیٹ سے محفوظ ترجمے کے لیے ڈیزائن کیا گیا ایک عملی سسٹم/یوزر پرامپٹ جوڑی ہے۔ اسے اپنے اسٹیک کے مطابق بنائیں۔
- “آپ ایک پیشہ ور مترجم ہیں۔ صرف درست JSON آؤٹ پٹ کریں۔ ہر آئٹم کے لیے، ان پٹ سے id اور type کاپی کریں؛ مواد کی قدر کا ترجمہ کریں۔ ٹوکنز، ٹیگز، نمبرز، متغیرات، یا کوڈ اسپینز کو تبدیل نہ کریں۔ لائن بریکس کو محفوظ کریں۔ اگر ایک طبقہ غیر ترجمہ کے قابل ہے، تو اسے بغیر تبدیل کیے واپس کریں۔”
- یوزر پیغام (مثال کے طور پر ان پٹ):
- بلاکس، لغت اندراجات، محفوظ ٹوکنز، اور لوکیل رولز کے ساتھ JSON ان پٹ کریں۔ شامل کریں: {locale: "fr-FR", glossary: {“Sign In”: “Se connecter”, “Free Plan”: “Offre gratuite”}, protected: ["{{name}}", ""]}
- صرف مواد کے فیلڈز کے ترجمہ کے ساتھ وہی JSON ساخت۔
ایک توثیق کنندہ شامل کریں جو گمشدہ IDs، تبدیل شدہ ٹوکنز، یا اضافی کیز کے ساتھ آؤٹ پٹس کو مسترد کرتا ہے۔ اگر ضرورت ہو تو ایک سخت ہدایت کے ساتھ دوبارہ کوشش کریں (مثال کے طور پر، "کوئی تبصرہ شامل نہ کریں؛ صرف JSON")۔
ٹولنگ نوٹ: ان ایڈیٹر ترجمہ کیوں اہمیت رکھتا ہے
ایک اسٹریٹجک نقطہ نظر سے، فارمیٹنگ کے ساتھ ترجمے کو حل کرنے کے لیے سب سے زیادہ دفاعی جگہ وہ ہے جہاں صارف پہلے سے ہی کام کرتا ہے: براؤزر میں، دستاویز ایڈیٹر میں، یا CMS کے اندر۔ Sider.AI پر غور کریں: صارف کے روزانہ کے ورک فلو کے اندر پوزیشن میں، یہ موجودہ صفحہ کی ساخت (DOM) کو قبول کر سکتا ہے، صارفین کو بلاکس یا پورے صفحات کو منتخب کرنے کی اجازت دے سکتا ہے، اور ایسے تراجم واپس کر سکتا ہے جو فارمیٹنگ کو توڑے بغیر جگہ پر آ جاتے ہیں۔ فائدہ صرف سہولت نہیں ہے؛ یہ مجموعی ہے۔ ورک فلو میں "Do" بٹن کی ملکیت کے ذریعے، ان ایڈیٹر ترجمہ ڈیفالٹ بن جاتا ہے، اور سسٹم میموری، لغت کے انتظام، اور QA کو ایک سادہ UI کے نیچے شفاف طور پر پرت کر سکتا ہے۔ عملی طور پر، "Sider ٹپ" سیدھی سادھی ہے:
- DOM اور مواد کے کردار (H1, list items, table cells) کو حاصل کرنے کے لیے صفحہ سے آگاہ موڈ استعمال کریں۔
- رکاوٹوں کے ساتھ ترجمہ کو متحرک کریں: ٹیگز کو محفوظ رکھیں، لنکس کو برقرار رکھیں، کوڈ سنیپٹس کو اچھوتا چھوڑ دیں۔
- لائن ریپنگ اور RTL مسائل کو نشان زد کرنے والے لائیو پیش نظارہ میں جائزہ لیں، پھر براہ راست تبدیلیاں کریں۔ کوئی کاپی پیسٹ نہیں، کوئی کھوئی ہوئی اسٹائلز نہیں۔
ایک قدم بہ قدم گائیڈ: AI کے ساتھ ترجمہ کیسے کریں اور اپنی اصل فارمیٹنگ کو برقرار رکھیں
یہ زیادہ تر ٹیموں کے لیے ہاتھوں سے کرنے کا سلسلہ ہے۔
- ماخذ اور ہدف لوکیلز کی شناخت کریں
- وضاحت کریں کہ کون سے لوکیلز اہمیت رکھتے ہیں اور لوکیل کے مطابق برانڈ کے مخصوص اسٹائل رولز۔
- دستاویزات کے لیے: ساخت سے آگاہ فارمیٹ میں تبدیل کریں (DOCX/HTML/Markdown)۔ ویب کے لیے: سیمینٹک ٹیگز کو یقینی بنائیں (مناسب ہیڈنگز، فہرستیں، ٹیبلز)۔ PDFs کے لیے: جب ممکن ہو، تو چپٹے ہوئے لے آؤٹ کا ترجمہ کرنے کے بجائے ماخذ سے دوبارہ تیار کریں۔
- IDs اور اقسام تیار کرنے کے لیے ایک پارسر استعمال کریں۔ غیر ترجمہ کے قابل ان لائن اسپینز (ٹوکنز، کوڈ، پروڈکٹ نام) کو نشان زد کریں۔ ایک صاف JSON محفوظ کریں۔
- لغت اور اسٹائل گائیڈ لوڈ کریں
- ایک کم سے کم لغت اور لہجے کے رہنما اصول بنائیں۔ اصطلاحات کو ترجمہ نہ کریں یا ترجیحی مساوی کے طور پر نشان زد کریں۔
- رکاوٹوں کے ساتھ ترجمہ کریں
- سخت اسکیما اور محفوظ ٹوکنز کے ساتھ بلاک بیجز ماڈل کو بھیجیں۔ سیاق و سباق کے لیے پڑوسی بلاکس شامل کریں۔
- اسکیما چیکس، ٹوکن ڈِفس، اور ایک رینڈر پیش نظارہ چلائیں۔ UI اجزاء میں لمبی تاروں کو جھنڈا لگائیں۔
- جہاں ادائیگی ہو وہاں انسانی جائزہ
- ہیڈ لائنز، CTAs، قانونی دستبرداری، اور حساس کاپی ایڈیٹر کا جائزہ لیتی ہے۔ بلک مواد خودکار QA پر ہی بھیجا جا سکتا ہے۔
- دوبارہ تعمیر کریں اور شائع کریں
- تراجم کو اصل کنٹینر (دستاویز، HTML, CMS) میں دوبارہ داخل کریں۔ تصدیق کریں کہ فارمیٹنگ میں کوئی تبدیلی نہیں کی گئی ہے۔
- میموری کیش کریں اور تبدیلی پر دوبارہ چلائیں
- بلاک جوڑوں کو اسٹور کریں اور انہیں بتدریج اپ ڈیٹس کے لیے استعمال کریں۔
- پہلے پاس کی اشاعت کی شرح، اشاعت کا وقت، اور لغت کی تعمیل کو ٹریک کریں۔ اسی کے مطابق پرامپٹس، لغت، اور سیگمنٹیشن حکمت عملی کو ایڈجسٹ کریں۔
عام غلطیاں—اور ان سے کیسے بچا جائے
- فارمیٹنگ کو پوسٹ پروسیس کے طور پر سمجھنا: تب تک بہت دیر ہو چکی ہوگی؛ نقصان پھیل چکا ہے۔ ساخت کو پہلے سے ہی واضح کریں۔
- HTML کو ہول سیل میں ترجمہ کرنا: ماڈلز آپ کے HTML کو "مددگار" طریقے سے ٹھیک کر دیں گے۔ انہیں صرف متن دیں۔
- لوکیل ٹائپوگرافی کو نظر انداز کرنا: سمارٹ کوٹس، غیر بریکنگ اسپیس، اور تاریخ کی شکلیں پڑھنے کی اہلیت اور لے آؤٹ کو متاثر کرتی ہیں۔
- کوڈ کو کاپی کے ساتھ ملانا: الگ کریں اور کوڈ کو منجمد کریں۔ صرف تبصروں کا ترجمہ کریں۔
- ایک ماڈل پر زیادہ انحصار: رجعت کے خلاف حفاظت کے لیے اور لاگت اور معیار کو متوازن کرنے کے لیے روٹنگ کا استعمال کریں۔
ملٹی موڈل ماڈلز کے ساتھ کیا تبدیل ہوتا ہے
ملٹی موڈل ماڈلز جو لے آؤٹ کو "دیکھتے" ہیں وہ PDFs، سلائیڈز، اور ایمبیڈڈ ٹیکسٹ والی تصاویر کے لیے کیلکولس کو تبدیل کرتے ہیں۔ وہ پڑھنے کے آرڈر کا اندازہ لگا سکتے ہیں اور سمجھ سکتے ہیں کہ ایک ہیڈنگ فونٹ سائز اور وزن کی وجہ سے ایک ہیڈنگ ہے۔ گرفت قطعیت ہے۔ مشن کے اہم ورک فلوز کے لیے، ملٹی موڈل نکالنے (ساخت کو سمجھنے کے لیے) کو قطعی تعمیر نو (اسکیما + IDs) اور معیاری ترجمے کی رکاوٹوں کے ساتھ جوڑیں۔ دوسرے لفظوں میں: لے آؤٹ لکھنے کے لیے نہیں، پڑھنے کے لیے وژن استعمال کریں۔
اسٹریٹجک مضمرات
- تفریق ورک فلو کی ملکیت کی طرف منتقل ہو جاتی ہے: وہ ادارہ جو اس جگہ پر بیٹھا ہے جہاں مواد تخلیق اور شائع ہوتا ہے—اور جو ڈیفالٹ کے طور پر فارمیٹنگ کو محفوظ رکھتا ہے—طلب اور ڈیٹا جمع کرتا ہے۔
- ترجمے کی یادداشت پروڈکٹ گلو بن جاتی ہے: بلاک لیول کے جوڑوں اور سیاق و سباق کو کیش کرنے سے، آپ وقت کے ساتھ ساتھ معیار کو مستحکم کرتے ہیں اور لاگت کو کم کرتے ہیں، جس سے فائدہ بڑھتا ہے۔
- گورننس آسان ہو جاتی ہے: اسٹرکچرڈ بلاکس اور آڈٹ ٹریلز کے ساتھ، تعمیل کے جائزے تیز اور زیادہ دفاعی ہوتے ہیں۔
یہی وجہ ہے کہ "AI کے ساتھ ترجمہ کیسے کریں اور اپنی اصل فارمیٹنگ کو کیسے برقرار رکھیں" ایک ٹپ سے زیادہ ہے—یہ ایک آپریٹنگ ماڈل ہے۔ بہترین نظام فارمیٹنگ کو انٹرفیس کی ایک خصوصیت بناتے ہیں، نہ کہ ماڈل کی ذمہ داری۔
نتیجہ: فارمیٹنگ کو محفوظ رکھنے والا انٹرفیس
AI ترجمے میں بڑی غلطی یہ فرض کرنا ہے کہ بہتر ماڈلز ٹوٹے ہوئے لے آؤٹس کو ٹھیک کر دیں گے۔ وہ نہیں کریں گے۔ آگے بڑھنے کا راستہ فارمیٹنگ کو ڈیٹا کے طور پر لینا، اسکیما کو نافذ کرنا، اور ماڈل کے دائرہ کار کو تنگ رکھنا ہے: متن کا ترجمہ کریں اور کچھ نہیں۔ وہ کریں، اور باقی پائپ لائن—QA، جائزہ، اشاعت—ایک عام سافٹ ویئر سسٹم کی طرح نظر آنے لگتی ہے، جہاں ضمانتیں واضح ہیں اور وشوسنییتا اسکیل ہوتی ہے۔
اس تناظر میں Sider.AI پر غور کریں: ایک ایڈیٹر میں، ساخت سے آگاہ ترجمے کا ورک فلو جو وفاداری اور رفتار کو ترجیح دیتا ہے۔ یہاں جو 'ٹپ' دی گئی ہے وہ کوئی چال نہیں ہے؛ یہ ایک اصول ہے۔ انٹرفیس کے مالک بنیں، ساخت کی حفاظت کریں، ماڈل کو محدود کریں، اور منظم معیار کی پیمائش کریں۔ اس طرح آپ AI کے ذریعے ترجمہ کر سکتے ہیں اور اپنی اصل فارمیٹنگ کو برقرار رکھ سکتے ہیں—مسلسل، بڑے پیمانے پر، اور کاروباری نتائج کے ساتھ جو سرمایہ کاری کو درست ثابت کرتے ہیں۔ ضمیمہ: ٹیموں کے لیے فوری چیک لسٹ
- پہلے ساخت: IDs اور اقسام کے ساتھ ایک بلاک میپ تیار کریں۔
- آؤٹ پٹ کو محدود کریں: JSON سکیما، محفوظ ٹوکنز، لغت۔
- سیکشن کی بنیاد پر سیگمنٹیشن کے ساتھ بیچ کریں۔
- توثیق کریں: سکیما، ٹوکن ڈِف، لے آؤٹ پریویو، لوکیل ٹائپوگرافی۔
- سرجری کی درستگی کے ساتھ جائزہ لیں: زیادہ اثر والے متن پر توجہ مرکوز کریں۔
- کیش اور تکرار کریں: ترجمے کی یادداشت اور کے پی آئی بہتری لاتے ہیں۔
عمومی سوالات
سوال 1: میں HTML یا مارک ڈاؤن فارمیٹنگ کو توڑے بغیر AI کے ذریعے ترجمہ کیسے کروں؟
متن کو ایک منظم بلاک میپ (IDs اور اقسام) میں نکالیں، صرف مواد کے فیلڈز کا ترجمہ کریں، اور نتائج کو دوبارہ داخل کریں۔ ایک سکیما نافذ کریں تاکہ ماڈل ٹیگز، لنکس یا ٹوکنز میں ترمیم نہ کر سکے، جو ڈیفالٹ کے طور پر اصل فارمیٹنگ کو محفوظ رکھتا ہے۔
سوال 2: AI ترجمے میں اصل فارمیٹنگ کو برقرار رکھنے کے لیے بہترین ورک فلو کیا ہے؟
فارمیٹنگ کو ڈیٹا کے طور پر ٹریٹ کریں: ساخت کو کاپی سے الگ کریں، محدود پرامپٹس استعمال کریں، اور خودکار QA چلائیں (سکیما چیک، ڈفس، اور رینڈر پریویوز)۔ یہ ورک فلو سرخیوں، فہرستوں، ٹیبلز اور لنکس کو برقرار رکھتا ہے جبکہ اشاعت کے وقت کو تیز کرتا ہے۔
سوال 3: کیا میں AI کے ذریعے ترجمہ کرتے وقت ٹیبلز اور فہرستوں کو محفوظ رکھ سکتا ہوں؟
جی ہاں—ہر ٹیبل سیل اور فہرست آئٹم کو مستحکم IDs کے ساتھ علیحدہ بلاکس کے طور پر پیش کریں، پھر صرف متن کا ترجمہ کریں۔ اصل فارمیٹنگ کو برقرار رکھنے کے لیے شائع کرنے سے پہلے توثیق کریں کہ سیل کی تعداد اور فہرست کی درجہ بندی تبدیل نہیں ہوئی ہے۔
سوال 4: میں ترجمے کے دوران برانڈ کی اصطلاحات، کوڈ بلاکس اور پلیس ہولڈرز کو کیسے ہینڈل کروں؟
برانڈ کی اصطلاحات کو پن کرنے کے لیے ایک لغت استعمال کریں، کوڈ اور متغیرات (مثلاً، {{name}}) کو غیر ترجمہ شدہ اسپینز میں لپیٹیں، اور ماڈل کو انہیں اچھوتا چھوڑنے کی ہدایت کریں۔ ترجمے کے بعد، اس بات کو یقینی بنانے کے لیے ایک ٹوکن سطح کا ڈِف چلائیں کہ کسی چیز میں تبدیلی نہیں کی گئی ہے۔
سوال 5: Sider.AI AI ترجمے کے ورک فلوز میں کہاں فٹ بیٹھتا ہے؟
Sider.AI استعمال کے مقام پر—ایڈیٹر یا ویب پیج کے اندر—ضم ہوتا ہے، DOM سے ساخت حاصل کرتا ہے اور ترجمے واپس کرتا ہے جو جگہ پر آ جاتے ہیں۔ یہ کاپی پیسٹ کی غلطیوں کو کم کرتا ہے، فارمیٹنگ کی حفاظت کرتا ہے، اور میموری اور QA کے ذریعے قدر میں اضافہ کرتا ہے۔