لیبل اسٹوڈیو کو کیسے استعمال کریں: 2025 کے لیے ایک مکمل، بے فضول گائیڈ
اگر آپ کمپیوٹر ویژن، این ایل پی، یا ملٹی موڈل اے آئی بنا رہے ہیں، تو آپ کو ممکنہ طور پر ایک ہی رکاوٹ کا سامنا کرنا پڑے گا: اعلیٰ معیار کا لیبل لگا ہوا ڈیٹا۔ لیبل اسٹوڈیو، ایک اوپن سورس ڈیٹا لیبلنگ پلیٹ فارم، آپ کو کسی ایک ایم ایل اسٹیک میں لاک کیے بغیر تصویر، ٹیکسٹ، آڈیو، ٹائم سیریز، اور ویڈیو اینوٹیشنز پر لچکدار کنٹرول فراہم کرتا ہے۔ اس عملی، مرحلہ وار ٹیوٹوریل میں، ہم آپ کو دکھائیں گے کہ لیبل اسٹوڈیو کو کیسے استعمال کیا جائے — انسٹالیشن سے لے کر ایکسپورٹ تک — تاکہ آپ اعتماد کے ساتھ "خالی پروجیکٹ" سے "پروڈکشن کے لیے تیار لیبلز" تک جا سکیں۔
ہم ایک عملی اور حل پر مبنی انداز پر عمل کریں گے: مختصر مراحل، واضح فیصلے، اور عام غلطیوں سے بچنے کے لیے مددگار تجاویز۔
آپ کیا سیکھیں گے
- لیبل اسٹوڈیو کو انسٹال اور لانچ کرنے کا طریقہ
- اپنا پہلا پروجیکٹ کیسے بنائیں اور لیبلنگ ٹیمپلیٹ کا انتخاب کیسے کریں
- ڈیٹا (مقامی فائلیں، کلاؤڈ بکیٹس، یو آر ایل) کیسے درآمد کریں
- تصاویر، متن، آڈیو یا ویڈیو کے لیے لیبلنگ انٹرفیس کیسے ترتیب دیں
- لیبلرز، ریویوز اور کوالٹی اشورینس کا انتظام کیسے کریں
- اپنی ٹریننگ پائپ لائنوں کے ساتھ مطابقت رکھنے والے فارمیٹس میں اینوٹیشنز کیسے ایکسپورٹ کریں
قابل ذکر: اگر آپ ملٹی ماڈل ریسرچ کو ترتیب دے رہے ہیں یا ڈیٹا سیٹ کی دستاویزات کا مسودہ تیار کر رہے ہیں، تو Sider.AI جیسا کہ ایک AI کو پائلٹ، ٹاسک گائیڈلائنز تیار کرنے یا ٹیموں کو ہم آہنگ رکھنے کے لیے تشریح کی پالیسیوں کے خودکار خلاصے تیار کرنے میں مدد کر سکتا ہے۔ آپ اسے Sider.ai پر دیکھ سکتے ہیں۔ لیبل اسٹوڈیو کیوں؟
- لچکدار اسکیما: باؤنڈنگ باکسز، پولی گونز، کی پوائنٹس، ٹیکسٹ اسپینز، تعلقات، آڈیو ریجنز وغیرہ کے لیے کسٹم لیبلنگ کنفیگ کی وضاحت کریں۔
- براڈ ڈیٹا اقسام: تصاویر، متن، آڈیو، HTML، ٹائم سیریز، اور ویڈیو۔
- ٹیم ورک فلوز: ٹاسک تفویض کریں، اتفاق رائے کو فعال کریں، تشریحات کا جائزہ لیں، اور معیار کا انتظام کریں۔
- قابل توسیع: اسٹوریج بیک اینڈز، ویب ہکس، اور ماڈل کی مدد سے لیبلنگ کے ساتھ انٹیگریٹ کریں۔
سرکاری جائزہ اور ڈاؤن لوڈ کے لیے، لیبل اسٹوڈیو ہوم پیج دیکھیں۔
مرحلہ 1: لیبل اسٹوڈیو انسٹال کریں
آپ Python یا Docker کے ساتھ لیبل اسٹوڈیو کو مقامی طور پر چلا سکتے ہیں۔ ایک طریقہ منتخب کریں:
آپشن A: Python (pip)
# ایک ورچوئل ماحول بنائیں (تجویز کردہ)
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
# لیبل اسٹوڈیو انسٹال کریں
pip install label-studio
# لانچ کریں
label-studio start
پھر پرنٹ شدہ مقامی URL (اکثر `) پر جائیں۔
آپشن B: Docker
docker run -it -p 8080:8080 heartexlabs/label-studio:latest
اگر آپ لیبل اسٹوڈیو میں نئے ہیں، تو آفیشل "شروع کرنے" گائیڈ جامع اور باقاعدگی سے اپ ڈیٹ کی جاتی ہے، اور کوئیک اسٹارٹ ایک نمونہ ڈیٹا سیٹ کو لیبل کرنے کے لیے کم سے کم اقدامات پر توجہ مرکوز کرتا ہے۔
پرو ٹپ: ٹیموں کے لیے، لچک کے لیے منظم ڈیٹا بیس (PostgreSQL) اور ماونٹڈ اسٹوریج پر غور کریں۔
مرحلہ 2: ایک پروجیکٹ بنائیں
- UI میں لاگ ان کریں اور "Create Project" پر کلک کریں۔
- اسے ایک واضح نام دیں (مثال کے طور پر، "Retail Shelf Detection v1") اور تفصیل (ڈیٹا سیٹ ورژن اور مقصد شامل کریں)۔
- "Labeling Setup" کا انتخاب کریں۔ آپ کر سکتے ہیں:
- ٹیمپلیٹ سے شروع کریں (مثال کے طور پر، آبجیکٹ کا پتہ لگانا، NER، جذبات، آڈیو ریجنز)
- یا ٹولز اور کلاسوں کو تیار کرنے کے لیے ایک کسٹم XML کنفیگ لکھیں
کوئیک اسٹارٹ وزرڈ آپ کو ٹیمپلیٹ منتخب کرنے، کلاسوں کا نام تبدیل کرنے اور کنفیگ کو محفوظ کرنے میں مدد کرتا ہے۔
مرحلہ 3: اپنا ڈیٹا درآمد کریں
آپ UI یا API کے ذریعے ڈیٹا درآمد کر سکتے ہیں۔ عام راستے:
- مقامی فائلیں اپ لوڈ کریں (ڈریگ اینڈ ڈراپ)
- ریموٹ فائلوں کے URLs فراہم کریں
- ترتیبات کے ذریعے کلاؤڈ اسٹوریج (S3, GCS, Azure Blob) کو جوڑیں
- پروگرامیٹک انجیکشن کے لیے REST API استعمال کریں
ڈیٹا ریکارڈز میں عام طور پر ایک data پے لوڈ شامل ہوتا ہے جو آپ کے اثاثے کی طرف اشارہ کرتا ہے (مثال کے طور پر، "image": " یا "text": "یہ ایک جملہ ہے۔"`)۔ برآمد کے دوران میپنگ کو آسان بنانے کے لیے فائل کے ناموں کو مستحکم رکھیں۔
کوالٹی ٹپ: اپنے ڈیٹا سیٹ کا ورژن بنائیں اور سورس → اینوٹیشن ایکسپورٹ کا ایک مینی فیسٹ رکھیں تاکہ آپ ٹریننگ رنز کو دوبارہ تیار کر سکیں۔
مرحلہ 4: لیبلنگ انٹرفیس کو کنفیگر کریں
لیبلنگ انٹرفیس ٹولز اور کلاسوں کی وضاحت کرتا ہے۔ آپ کو XML کی طرح کنفیگ نظر آئے گا جہاں آپ اجزاء منتخب کرتے ہیں جیسے RectangleLabels, PolygonLabels, KeyPointLabels, TextArea, Choices, Audio, TimeSeries, وغیرہ۔
مثالیں:
تصویر آبجیکٹ کا پتہ لگانا
<View>
<Image name="img" value="$image"/>
<RectangleLabels name="label" toName="img">
<Label value="Product" background="#34D399"/>
<Label value="PriceTag" background="#60A5FA"/>
</RectangleLabels>
</View>
ٹیکسٹ نامزد اینٹیٹی کی شناخت (NER)
<View>
<Text name="txt" value="$text"/>
<Labels name="label" toName="txt">
<Label value="ORG"/>
<Label value="PERSON"/>
<Label value="LOC"/>
</Labels>
</View>
آڈیو ریجن لیبلنگ
<View>
<Audio name="audio" value="$audio"/>
<Labels name="label" toName="audio">
<Label value="Speech"/>
<Label value="Noise"/>
<Label value="Music"/>
</Labels>
</View>
اپنے ٹاسک کے قریب ترین ٹیمپلیٹ سے شروعات کریں اور دہرائیں۔ ڈیٹا سیٹ کے انضمام کو آسان بنانے کے لیے کلاس کے ناموں کو مختلف ورژن میں مستحکم رکھیں۔
مرحلہ 5: لیبلنگ کے بہترین طریقے
- واضح گائیڈلائنز کی وضاحت کریں: درست بمقابلہ غلط اینوٹیشنز اور ایج کیسز کی مثالیں شامل کریں۔
- ہاٹکیز استعمال کریں: اپنے ٹولز کے لیے کی بورڈ شارٹ کٹس سیکھ کر رفتار اور مستقل مزاجی کو تربیت دیں۔
- ابتدائی طور پر کیلیبریٹ کریں: 2–3 لیبلرز سے ایک ہی 50–100 آئٹمز پر اینوٹیٹ کروائیں، نتائج کا موازنہ کریں اور گائیڈ کو بہتر بنائیں۔
- پری اینوٹیشنز شامل کریں: اگر آپ کے پاس بیس لائن ماڈل ہے، تو درستگی کو تیز کرنے کے لیے پیشین گوئیاں درآمد کریں۔
- تھرو پٹ اور معیار کو متوازن کریں: جب خطرات زیادہ ہوں تو اتفاق رائے یا جائزہ قطاریں استعمال کریں۔
ویسے، کرسپ، مستقل تشریحی گائیڈلائنز لکھنے یا ڈومین کے علم کو لیبلر کے لیے دوستانہ چیک لسٹ میں تبدیل کرنے کے لیے، Sider.AI تیزی سے ہدایات کا مسودہ تیار اور بہتر بنا سکتا ہے جبکہ ایک چینج لاگ بھی رکھتا ہے جس پر ٹیمیں عمل کر سکتی ہیں۔ مرحلہ 6: لیبلرز، ریویوز اور QA کا انتظام کریں
لیبل اسٹوڈیو ٹیموں کو سپورٹ کرتا ہے:
- مخصوص اینوٹیٹرز کو ٹاسک تفویض کریں
- جائزہ/منظوری ورک فلوز کو فعال کریں
- پیش رفت اور لیبلر کی کارکردگی کو ٹریک کریں
- اتفاق رائے (فی ٹاسک ایک سے زیادہ اینوٹیشنز) استعمال کریں تاکہ معاہدے کی پیمائش کی جا سکے
واضح قبولیت کے معیار طے کریں (مثال کے طور پر، بکس کے لیے IoU تھریشولڈ، اسپین باؤنڈری رولز، کم سے کم آڈیو ریجن دورانیہ) اور جائزہ کے دوران ان پر عمل کریں۔
عام QA چیک:
- باؤنڈنگ باکس کی مستقل مزاجی
- NER میں اوورلیپنگ اینٹیٹیز
- وقت کے ساتھ ساتھ تعاریف میں تبدیلی (گائیڈ کو اپ ڈیٹ کریں!)
مرحلہ 7: اینوٹیشنز ایکسپورٹ کریں
جب آپ کا بیچ تیار ہو جائے تو ٹریننگ کے لیے اینوٹیشنز ایکسپورٹ کریں۔ لیبل اسٹوڈیو اندرونی طور پر JSON میں اینوٹیشنز اسٹور کرتا ہے اور آپ کو متعدد فارمیٹس میں ایکسپورٹ کرنے دیتا ہے۔ موجودہ فہرست اور مراحل کے لیے آفیشل ایکسپورٹ دستاویزات دیکھیں۔
عام فارمیٹس میں شامل ہیں:
- را لیبل اسٹوڈیو JSON (سب سے مکمل اور بے ضرر)
- COCO (پتہ لگانے/سیگمنٹیشن کے لیے)
- YOLO (آبجیکٹ کا پتہ لگانے کے لیے)
- آسان ٹاسکس کے لیے CSV/TSV
اہم نوٹس:
- کچھ ٹولز (مثال کے طور پر، برش/سیگمنٹیشنز) بعض فارمیٹس کے ساتھ صاف طور پر نقشہ نہیں بناتے ہیں—COCO اور YOLO براہ راست فری فارم برشز کو سپورٹ نہیں کر سکتے ہیں۔ سیگمنٹیشن ایکسپورٹ انتباہات پر کمیونٹی کی رہنمائی دیکھیں۔
- لیبل اسٹوڈیو JSON کو YOLO میں تبدیل کرنے کے لیے کنورٹرز موجود ہیں، لیکن استعمال کیے گئے لیبلنگ ٹول اور آپ کے پاس موجود میٹا ڈیٹا کے لحاظ سے خلاء پیدا ہو سکتے ہیں۔
عملی ایکسپورٹ فلو:
- شروع میں ایک چھوٹا ٹیسٹ ایکسپورٹ چلائیں؛ تصدیق کریں کہ آپ کا ٹریننگ اسکرپٹ اسے پارس کرتا ہے۔
- اپنے ایکسپورٹ پری سیٹ کو لاک کریں (کلاس آرڈر، ریزولوشن مفروضے وغیرہ)۔
- تولید کے لیے کسی بھی تبدیلی کے اقدامات (اسکرپٹس، ورژن ہیشز) کو دستاویز کریں۔
مرحلہ 8: اپنی ایم ایل پائپ لائن کے ساتھ انٹیگریٹ کریں
- اپنی ٹریننگ جابز میں مکمل اینوٹیشنز کھینچنے کے لیے API استعمال کریں۔
- اسپلٹس کو طے شدہ رکھیں: ٹاسکس میں
split: train/val/test جیسا میٹا ڈیٹا منسلک کریں۔
- ہر چیز کا ورژن بنائیں: ڈیٹا سیٹ مینی فیسٹس، اینوٹیشن ایکسپورٹس، ماڈل کنفیگز۔
- لوپ بند کریں: غلطی کا تجزیہ چلائیں، ناکامی کے کلسٹرز کی شناخت کریں، اور دوبارہ لیبلنگ راؤنڈز کا شیڈول بنائیں۔
ورک فلو پیٹرن:
- ایک بیس لائن ماڈل کو ٹرین کریں
- ماڈل کی غلطیوں سے سخت مثالیں نکالیں
- نشانہ بنائے گئے سلائسز کو دوبارہ لیبل کریں
یہ فعال لرننگ لوپ زبردستی لیبلنگ کے مقابلے میں معیار کو تیزی سے بڑھاتا ہے۔
عام مسائل کو حل کرنا
- "میرا ایکسپورٹ YOLO/COCO میں لوڈ نہیں ہوگا۔"
- ٹول کی مطابقت کی جانچ کریں (مثال کے طور پر، برشز بمقابلہ پولی گونز)۔ جب ممکن ہو تو مطابقت پذیر اشکال میں تبدیل کریں اور ایکسپورٹ دستاویزات اور کمیونٹی نوٹس سے مشورہ کریں۔
- "لیبلز میرے ٹریننگ کلاس آرڈر سے میل نہیں کھاتے ہیں۔"
- شروع میں آرڈرنگ ٹھیک کریں۔ لیبل کے ناموں کو معیاری بنائیں اور اپنی پائپ لائن میں میپنگ کو محفوظ کریں۔
- "اینوٹیٹرز بہت زیادہ متفق نہیں ہیں۔"
- کیلیبریشن راؤنڈز شامل کریں، قواعد کو واضح کریں، اور اتفاق رائے یا ثالثی کے اقدامات پر غور کریں۔
- پری اینوٹیشنز، ہاٹکیز اور ٹول سے متعلقہ اسپیڈ اپس استعمال کریں (مثال کے طور پر، آٹو سیگمنٹ، سنیپنگ)۔ کم ویلیو والے ٹاسکس کو ختم کریں۔
30 منٹ کی کوئیک اسٹارٹ چیک لسٹ
- لیبل اسٹوڈیو انسٹال کریں (pip یا Docker)
- سب سے زیادہ متعلقہ ٹیمپلیٹ کے ساتھ ایک پروجیکٹ بنائیں
- 50–100 نمونہ آئٹمز درآمد کریں
- ایج کیسز اور مثالوں کے ساتھ گائیڈلائنز کا مسودہ تیار کریں
- کیلیبریشن بیچ کے لیے دو لیبلرز تفویض کریں
- اختلافات کا جائزہ لیں اور قواعد کو اپ ڈیٹ کریں
- اپنے ٹریننگ کوڈ میں ایکسپورٹ کی جانچ کریں
ایک آفیشل، جامع واک تھرو کے لیے، "شروع کرنے" اور "کوئیک اسٹارٹ" گائیڈ پر دوبارہ جائیں۔
پاور صارفین کے لیے ایڈوانسڈ ٹپس
- کسٹم ویجٹس: ڈومین کے مخصوص ٹولز کے لیے انٹرفیس کو وسعت دیں۔
- ویب ہکس: ٹاسکس مکمل ہونے پر جابز کو ٹرگر کریں (مثال کے طور پر، تبادلوں یا ماڈل ٹریننگ شروع کریں)۔
- ماڈل کی مدد سے لیبلنگ: دستی کام کو کم کرنے کے لیے اپنے اندرون خانہ یا کلاؤڈ ماڈلز سے پری لیبلز استعمال کریں۔
- ڈیٹا کی رازداری: آن پریم پر چلائیں، ایکسپورٹس کو محدود کریں، اور ریگولیٹڈ ڈیٹا سیٹس کے لیے رسائی کو لاگ کریں۔
- تجزیات: جھکاؤ کو دیکھنے کے لیے فی کلاس ڈسٹری بیوشن اور فی لیبلر میٹرکس کو ٹریک کریں۔
نتیجہ: پروٹوٹائپ سے لے کر پروڈکشن کے لیے تیار ڈیٹا سیٹس تک
لیبل اسٹوڈیو آپ کو تیزی سے تصور سے مستقل ٹریننگ ڈیٹا تک جانے میں مدد کرتا ہے: ایک ٹیمپلیٹ منتخب کریں، اپنا اسکیما متعین کریں، اپنی ٹیم کو کیلیبریٹ کریں، اور ان فارمیٹس میں ایکسپورٹ کریں جن کی آپ کے ماڈلز کو ضرورت ہے۔ اپنی گائیڈلائنز کو زندہ رکھیں، ایکسپورٹس کو شروع میں ہی تصدیق کریں، اور فعال لرننگ کے ساتھ لوپ کو بند کریں۔ ان عادات کے ساتھ، آپ فارمیٹس کے ساتھ کم وقت گزاریں گے اور زیادہ وقت کام کرنے والے ماڈلز کو بھیجنے میں صرف کریں گے۔
گہری ڈائیوز اور ٹیمپلیٹس کے لیے، دیکھیں:
- ایکسپورٹ فارمیٹس اور انتباہات
عمومی سوالات
Q1: لیبل اسٹوڈیو کس لیے استعمال ہوتا ہے؟
لیبل اسٹوڈیو تصاویر، متن، آڈیو، ٹائم سیریز اور ویڈیو کو اینوٹیٹ کرنے کے لیے ایک اوپن سورس پلیٹ فارم ہے۔ یہ آپ کو کسٹم لیبلنگ انٹرفیس ڈیزائن کرنے اور اینوٹیشنز کو ان فارمیٹس میں ایکسپورٹ کرنے دیتا ہے جنہیں آپ کی ایم ایل ٹریننگ پائپ لائنیں استعمال کر سکتی ہیں۔
Q2: میں لیبل اسٹوڈیو میں ایک نیا پروجیکٹ کیسے شروع کروں؟
UI سے ایک پروجیکٹ بنائیں، ایک ٹیمپلیٹ منتخب کریں جو آپ کے ٹاسک سے مماثل ہو، اور لیبلنگ کنفیگ کو کسٹمائز کریں۔ پھر ڈیٹا (مقامی فائلیں، URLs، یا کلاؤڈ اسٹوریج) درآمد کریں اور اینوٹیٹرز کو ٹاسک تفویض کریں۔
Q3: لیبل اسٹوڈیو کون سے ایکسپورٹ فارمیٹس کو سپورٹ کرتا ہے؟
آپ را JSON کے ساتھ ساتھ COCO, YOLO, Pascal VOC, اور CSV/TSV جیسے فارمیٹس ایکسپورٹ کر سکتے ہیں۔ کچھ ٹولز (جیسے برش ماسک) تمام فارمیٹس میں نقشہ نہیں بنا سکتے ہیں۔ تفصیلات کے لیے ایکسپورٹ دستاویزات چیک کریں۔
Q4: میں لیبل اسٹوڈیو میں لیبلنگ کو کیسے تیز کر سکتا ہوں؟
بیس لائن ماڈل سے پری اینوٹیشنز استعمال کریں، ہاٹکیز سیکھیں، اور اپنے لیبل اسکیما کو آسان بنائیں۔ دوبارہ کام کو کم کرنے کے لیے کیلیبریشن راؤنڈز چلائیں اور غلطیوں کو جلد پکڑنے کے لیے جائزہ کے معیار طے کریں۔
Q5: کیا میں لیبل اسٹوڈیو کو ایک ٹیم کے ساتھ چلا سکتا ہوں؟
جی ہاں۔ اینوٹیٹرز کو ٹاسک تفویض کریں، جائزوں کو فعال کریں، اور معاہدے کی پیمائش کے لیے اتفاق رائے استعمال کریں۔ ڈیٹا اور اینوٹیشنز کو قابل اعتماد بیک اینڈز میں اسٹور کریں اور ویب ہکس یا API کے ساتھ ایکسپورٹس کو خودکار بنائیں۔