কীভাবে Label Studio ব্যবহার করবেন: ২০২৫ সালের জন্য একটি সম্পূর্ণ, সরল গাইড
আপনি যদি কম্পিউটার ভিশন, NLP, অথবা মাল্টিমোডাল AI তৈরি করেন, তাহলে সম্ভবত একই সমস্যাতে পড়বেন: উচ্চ-মানের লেবেলযুক্ত ডেটা। Label Studio, একটি ওপেন-সোর্স ডেটা লেবেলিং প্ল্যাটফর্ম, যা আপনাকে কোনো একটি নির্দিষ্ট ML স্ট্যাকের মধ্যে সীমাবদ্ধ না রেখে ছবি, টেক্সট, অডিও, টাইম সিরিজ এবং ভিডিও অ্যানোটেশনের উপর নমনীয় নিয়ন্ত্রণ দেয়। এই বাস্তব, ধাপে ধাপে টিউটোরিয়ালে, আমরা আপনাকে দেখাবো কীভাবে Label Studio ব্যবহার করতে হয়—ইনস্টলেশন থেকে শুরু করে এক্সপোর্ট পর্যন্ত—যাতে আপনি আত্মবিশ্বাসের সাথে “ফাঁকা প্রোজেক্ট” থেকে “উৎপাদন-উপযোগী লেবেল”-এ যেতে পারেন।
আমরা একটি বাস্তব এবং সমাধান-ভিত্তিক শৈলী অনুসরণ করব: ছোট পদক্ষেপ, স্পষ্ট সিদ্ধান্ত এবং সাধারণ ভুলগুলো এড়ানোর জন্য সহায়ক টিপস।
আপনি যা শিখবেন
- কীভাবে Label Studio ইনস্টল এবং চালু করতে হয়
- কীভাবে আপনার প্রথম প্রোজেক্ট তৈরি করতে হয় এবং একটি লেবেলিং টেমপ্লেট নির্বাচন করতে হয়
- কীভাবে ডেটা ইম্পোর্ট করতে হয় (লোকাল ফাইল, ক্লাউড বাকেট, URL)
- কীভাবে ছবি, টেক্সট, অডিও অথবা ভিডিওর জন্য লেবেলিং ইন্টারফেস সেট আপ করতে হয়
- কীভাবে লেবেলার, রিভিউ এবং কোয়ালিটি নিশ্চিতকরণ পরিচালনা করতে হয়
- কীভাবে আপনার ট্রেনিং পাইপলাইনের সাথে সামঞ্জস্যপূর্ণ ফরম্যাটে অ্যানোটেশন এক্সপোর্ট করতে হয়
বিশেষ দ্রষ্টব্য: আপনি যদি মাল্টি-মডেল গবেষণা পরিচালনা করেন অথবা ডেটাসেট ডকুমেন্টেশন তৈরি করেন, তাহলে Sider.AI-এর মতো একটি AI কপilot টাস্কের গাইডলাইন তৈরি করতে বা দলগুলোকে একত্রিত রাখতে অ্যানোটেশন পলিসিগুলোর অটো-সামারি তৈরি করতে সাহায্য করতে পারে। আপনি এটি Sider.ai-এ দেখতে পারেন। কেন Label Studio?
- নমনীয় স্কিমা: বাউন্ডিং বক্স, পলিগন, কিপয়েন্ট, টেক্সট স্প্যান, রিলেশন, অডিও রিজিওন এবং আরও অনেক কিছুর জন্য কাস্টম লেবেলিং কনফিগারেশন তৈরি করুন।
- বিস্তৃত ডেটা টাইপ: ছবি, টেক্সট, অডিও, HTML, টাইম সিরিজ এবং ভিডিও।
- টিম ওয়ার্কফ্লো: টাস্ক নির্ধারণ করুন, ঐকমত্য সক্ষম করুন, অ্যানোটেশন রিভিউ করুন এবং কোয়ালিটি পরিচালনা করুন।
- সম্প্রসারণযোগ্য: স্টোরেজ ব্যাকেন্ড, ওয়েব হুক এবং মডেল-সহায়ক লেবেলিংয়ের সাথে ইন্টিগ্রেট করুন।
অফিসিয়াল ওভারভিউ এবং ডাউনলোডের জন্য, Label Studio-এর হোমপেজ দেখুন।
ধাপ ১: Label Studio ইনস্টল করুন
আপনি পাইথন অথবা ডকারের মাধ্যমে লোকালি Label Studio চালাতে পারেন। যেকোনো একটি পদ্ধতি বেছে নিন:
অপশন A: পাইথন (pip)
# একটি ভার্চুয়াল এনভায়রনমেন্ট তৈরি করুন (সুপারিশ করা হচ্ছে)
python -m venv .venv
source .venv/bin/activate # উইন্ডোজ: .venv\Scripts\activate
# Label Studio ইনস্টল করুন
pip install label-studio
# চালু করুন
label-studio start
তারপর প্রিন্ট করা লোকাল URL-এ যান (প্রায়শই `)।
অপশন B: ডকার
docker run -it -p 8080:8080 heartexlabs/label-studio:latest
আপনি যদি Label Studio-তে নতুন হন, তাহলে অফিসিয়াল “Getting Started” গাইডটি সংক্ষিপ্ত এবং নিয়মিত আপডেট করা হয়, এবং কুইক স্টার্ট একটি স্যাম্পল ডেটাসেট লেবেল করার জন্য সংক্ষিপ্ত পদক্ষেপগুলোর উপর দৃষ্টি নিবদ্ধ করে।
পরামর্শ: টিমের জন্য, স্থিতিশীলতার জন্য একটি ম্যানেজড ডেটাবেস (PostgreSQL) এবং মাউন্ট করা স্টোরেজ বিবেচনা করুন।
ধাপ ২: একটি প্রোজেক্ট তৈরি করুন
- UI-তে লগ ইন করুন এবং “Create Project”-এ ক্লিক করুন।
- একটি স্পষ্ট নাম দিন (যেমন, “Retail Shelf Detection v1”) এবং বর্ণনা দিন (ডেটাসেট সংস্করণ এবং উদ্দেশ্য অন্তর্ভুক্ত করুন)।
- “Labeling Setup” নির্বাচন করুন। আপনি যা করতে পারেন:
- একটি টেমপ্লেট থেকে শুরু করুন (যেমন, অবজেক্ট ডিটেকশন, NER, সেন্টিমেন্ট, অডিও রিজিওন)
- অথবা টুল এবং ক্লাস তৈরি করার জন্য একটি কাস্টম XML কনফিগ লিখুন
কুইক স্টার্ট উইজার্ড আপনাকে একটি টেমপ্লেট বাছাই করতে, ক্লাসের নাম পরিবর্তন করতে এবং কনফিগ সেভ করতে সাহায্য করে।
ধাপ ৩: আপনার ডেটা ইম্পোর্ট করুন
আপনি UI অথবা API-এর মাধ্যমে ডেটা ইম্পোর্ট করতে পারেন। সাধারণ উপায়:
- লোকাল ফাইল আপলোড করুন (ড্র্যাগ-এন্ড-ড্রপ)
- সেটিংসের মাধ্যমে ক্লাউড স্টোরেজ (S3, GCS, Azure Blob) কানেক্ট করুন
- প্রোগ্রামগতভাবে গ্রহণের জন্য REST API ব্যবহার করুন
ডেটা রেকর্ডে সাধারণত একটি data পেলোড অন্তর্ভুক্ত থাকে যা আপনার অ্যাসেটের দিকে নির্দেশ করে (যেমন, "image": " অথবা "text": "এটি একটি বাক্য।"`)। এক্সপোর্টের সময় ম্যাপিং সহজ করার জন্য ফাইলের নাম স্থিতিশীল রাখুন।
গুণগত মানের টিপ: আপনার ডেটাসেটের সংস্করণ তৈরি করুন এবং সোর্স → অ্যানোটেশন এক্সপোর্টের একটি তালিকা রাখুন যাতে আপনি ট্রেনিং রান পুনরুৎপাদন করতে পারেন।
ধাপ ৪: লেবেলিং ইন্টারফেস কনফিগার করুন
লেবেলিং ইন্টারফেস টুল এবং ক্লাস নির্ধারণ করে। আপনি XML-এর মতো কনফিগ দেখতে পাবেন যেখানে আপনি RectangleLabels, PolygonLabels, KeyPointLabels, TextArea, Choices, Audio, TimeSeries ইত্যাদি কম্পোনেন্ট নির্বাচন করেন।
উদাহরণ:
ইমেজ অবজেক্ট ডিটেকশন
<View>
<Image name="img" value="$image"/>
<RectangleLabels name="label" toName="img">
<Label value="Product" background="#34D399"/>
<Label value="PriceTag" background="#60A5FA"/>
</RectangleLabels>
</View>
টেক্সট নেইমড এন্টিটি রিকগনিশন (NER)
<View>
<Text name="txt" value="$text"/>
<Labels name="label" toName="txt">
<Label value="ORG"/>
<Label value="PERSON"/>
<Label value="LOC"/>
</Labels>
</View>
অডিও রিজিওন লেবেলিং
<View>
<Audio name="audio" value="$audio"/>
<Labels name="label" toName="audio">
<Label value="Speech"/>
<Label value="Noise"/>
<Label value="Music"/>
</Labels>
</View>
আপনার টাস্কের সবচেয়ে কাছের টেমপ্লেট দিয়ে শুরু করুন এবং পুনরাবৃত্তি করুন। ডেটাসেট মার্জ সহজ করার জন্য বিভিন্ন সংস্করণে ক্লাসের নাম স্থিতিশীল রাখুন।
ধাপ ৫: লেবেলিংয়ের সেরা উপায়
- স্পষ্ট গাইডলাইন নির্ধারণ করুন: সঠিক বনাম ভুল অ্যানোটেশন এবং প্রান্তিক কেসগুলোর উদাহরণ অন্তর্ভুক্ত করুন।
- হটkeys ব্যবহার করুন: আপনার টুলের জন্য কীবোর্ড শর্টকাট শিখে গতি এবং ধারাবাহিকতা বাড়ান।
- তাড়াতাড়ি ক্যালিব্রেট করুন: ২-৩ জন লেবেলারকে একই ৫০-১০০টি আইটেম অ্যানোটেট করতে দিন, ফলাফল তুলনা করুন এবং গাইড পরিমার্জন করুন।
- প্রি-অ্যানোটেশন যোগ করুন: যদি আপনার একটি বেসলাইন মডেল থাকে, তাহলে সংশোধন দ্রুত করার জন্য ভবিষ্যদ্বাণী ইম্পোর্ট করুন।
- থ্রুপুট এবং কোয়ালিটির মধ্যে ভারসাম্য বজায় রাখুন: যখন ঝুঁকির পরিমাণ বেশি থাকে তখন ঐকমত্য বা রিভিউ সারি ব্যবহার করুন।
প্রসঙ্গত, স্পষ্ট, সামঞ্জস্যপূর্ণ অ্যানোটেশন গাইডলাইন লেখার জন্য অথবা ডোমেইন জ্ঞানকে লেবেলার-বান্ধব চেকলিস্টে রূপান্তর করার জন্য, Sider.AI দ্রুত নির্দেশাবলী তৈরি এবং পরিমার্জন করতে পারে এবং একটি পরিবর্তন লগ রাখতে পারে যা টিম অনুসরণ করতে পারে। ধাপ ৬: লেবেলার, রিভিউ এবং QA পরিচালনা করুন
Label Studio টিমকে সমর্থন করে:
- নির্দিষ্ট অ্যানোটেটরদের টাস্ক নির্ধারণ করুন
- রিভিউ/অনুমোদন ওয়ার্কফ্লো সক্ষম করুন
- অগ্রগতি এবং লেবেলারের কর্মক্ষমতা ট্র্যাক করুন
- চুক্তি পরিমাপ করার জন্য ঐকমত্য ব্যবহার করুন (প্রতি টাস্কে একাধিক অ্যানোটেশন)
স্পষ্ট গ্রহণযোগ্যতার মানদণ্ড নির্ধারণ করুন (যেমন, বক্সের জন্য IoU থ্রেশহোল্ড, স্প্যান সীমানা নিয়ম, সর্বনিম্ন অডিও অঞ্চলের সময়কাল) এবং পর্যালোচনার সময় সেগুলি প্রয়োগ করুন।
সাধারণ QA চেক:
- লেবেল অনুপস্থিত বা ভুল ক্লাস
- অসামঞ্জস্যপূর্ণ বাউন্ডিং বক্স টাইটনেস
- সময়ের সাথে সাথে সংজ্ঞা পরিবর্তন (গাইড আপডেট করুন!)
ধাপ ৭: অ্যানোটেশন এক্সপোর্ট করুন
যখন আপনার ব্যাচ প্রস্তুত, তখন ট্রেনিংয়ের জন্য অ্যানোটেশন এক্সপোর্ট করুন। Label Studio অভ্যন্তরীণভাবে JSON-এ অ্যানোটেশন সংরক্ষণ করে এবং আপনাকে একাধিক ফরম্যাটে এক্সপোর্ট করতে দেয়। বর্তমান তালিকা এবং ধাপের জন্য অফিসিয়াল এক্সপোর্ট ডক্স দেখুন।
সাধারণ ফরম্যাটগুলো হলো:
- Raw Label Studio JSON (সবচেয়ে সম্পূর্ণ এবং লসলেস)
- COCO (ডিটেকশন/সেগমেন্টেশনের জন্য)
- YOLO (অবজেক্ট ডিটেকশনের জন্য)
গুরুত্বপূর্ণ নোট:
- কিছু টুল (যেমন, ব্রাশ/সেগমেন্টেশন) কিছু ফরম্যাটে পরিষ্কারভাবে ম্যাপ করে না—COCO এবং YOLO সরাসরি ফ্রি-ফর্ম ব্রাশ সমর্থন নাও করতে পারে। সেগমেন্টেশন এক্সপোর্ট বিষয়ক কমিউনিটি গাইডেন্স দেখুন।
- Label Studio JSON কে YOLO-তে রূপান্তরিত করার জন্য কনভার্টার বিদ্যমান, কিন্তু ব্যবহৃত লেবেলিং টুলের উপর নির্ভর করে এবং আপনার ধরে রাখা মেটাডেটার উপর নির্ভর করে ফাঁক ঘটতে পারে।
বাস্তবসম্মত এক্সপোর্ট ফ্লো:
- তাড়াতাড়ি একটি ছোট টেস্ট এক্সপোর্ট চালান; যাচাই করুন যে আপনার ট্রেনিং স্ক্রিপ্ট এটি পার্স করে।
- আপনার এক্সপোর্ট প্রিসেট লক করুন (ক্লাস অর্ডার, রেজোলিউশন অনুমান, ইত্যাদি)।
- পুনরুৎপাদনের জন্য যেকোনো রূপান্তর পদক্ষেপ (স্ক্রিপ্ট, সংস্করণ হ্যাশ) ডকুমেন্ট করুন।
ধাপ ৮: আপনার ML পাইপলাইনের সাথে ইন্টিগ্রেট করুন
- আপনার ট্রেনিং জবে সম্পন্ন অ্যানোটেশন টানতে API ব্যবহার করুন।
- স্প্লিট ডিটারমিনিস্টিক রাখুন: টাস্কের সাথে
split: train/val/test এর মতো মেটাডেটা সংযুক্ত করুন।
- সবকিছুর সংস্করণ তৈরি করুন: ডেটাসেট ম্যানিফেস্ট, অ্যানোটেশন এক্সপোর্ট, মডেল কনফিগ।
- লুপ বন্ধ করুন: ত্রুটি বিশ্লেষণ চালান, ব্যর্থতার ক্লাস্টার চিহ্নিত করুন এবং পুনরায় লেবেলিং রাউন্ডের সময়সূচী করুন।
ওয়ার্কফ্লো প্যাটার্ন:
- একটি বেসলাইন মডেল প্রশিক্ষণ দিন
- মডেল ত্রুটি থেকে কঠিন উদাহরণ সংগ্রহ করুন
- টার্গেটেড স্লাইস পুনরায় লেবেল করুন
এই সক্রিয়-লার্নিং লুপটি ব্রুট-ফোর্স লেবেলিংয়ের চেয়ে দ্রুত গুণমান বাড়ায়।
সাধারণ সমস্যাগুলোর সমাধান
- “আমার এক্সপোর্ট YOLO/COCO-তে লোড হবে না।”
- টুল সামঞ্জস্যতা পরীক্ষা করুন (যেমন, ব্রাশ বনাম পলিগন)। যখন সম্ভব সামঞ্জস্যপূর্ণ আকারে রূপান্তর করুন এবং এক্সপোর্ট ডক্স এবং কমিউনিটি নোট দেখুন।
- “লেবেলগুলো আমার ট্রেনিং ক্লাসের অর্ডারের সাথে মেলে না।”
- তাড়াতাড়ি অর্ডারিং ঠিক করুন। লেবেলের নাম স্ট্যান্ডার্ডাইজ করুন এবং আপনার পাইপলাইনে ম্যাপিং সংরক্ষণ করুন।
- “অ্যানোটেটররা অনেক ভিন্নমত পোষণ করেন।”
- ক্যালিব্রেশন রাউন্ড যোগ করুন, নিয়ম স্পষ্ট করুন এবং ঐকমত্য বা আরবিট্রেশন পদক্ষেপ বিবেচনা করুন।
- প্রি-অ্যানোটেশন, হটkeys এবং টুল-নির্দিষ্ট স্পীডআপ ব্যবহার করুন (যেমন, অটো-সেগমেন্ট, স্ন্যাপিং)। কম-মূল্যের টাস্ক ছেঁটে ফেলুন।
একটি ৩০ মিনিটের কুইক স্টার্ট চেকলিস্ট
- Label Studio ইনস্টল করুন (pip অথবা Docker)
- সবচেয়ে প্রাসঙ্গিক টেমপ্লেট সহ একটি প্রোজেক্ট তৈরি করুন
- ৫০-১০০টি স্যাম্পল আইটেম ইম্পোর্ট করুন
- প্রান্তিক কেস এবং উদাহরণসহ গাইডলাইন তৈরি করুন
- ক্যালিব্রেশন ব্যাচের জন্য দুইজন লেবেলার নির্ধারণ করুন
- ভিন্নমতগুলো পর্যালোচনা করুন এবং নিয়ম আপডেট করুন
- আপনার ট্রেনিং কোডে এক্সপোর্ট পরীক্ষা করুন
একটি অফিসিয়াল, সংক্ষিপ্ত ওয়াকথ্রু জন্য, “Getting Started” এবং “Quick Start” গাইডটি পুনরায় দেখুন।
পাওয়ার ব্যবহারকারীদের জন্য উন্নত টিপস
- কাস্টম উইজেট: ডোমেইন-নির্দিষ্ট সরঞ্জামগুলোর জন্য ইন্টারফেস প্রসারিত করুন।
- ওয়েবহুক: টাস্ক সম্পন্ন হলে জব ট্রিগার করুন (যেমন, রূপান্তর বা মডেল ট্রেনিং শুরু করুন)।
- মডেল-সহায়ক লেবেলিং: ম্যানুয়াল কাজ কমাতে আপনার ইন-হাউস বা ক্লাউড মডেল থেকে প্রি-লেবেল ব্যবহার করুন।
- ডেটা গোপনীয়তা: অন-প্রিমিসে চালান, এক্সপোর্ট সীমাবদ্ধ করুন এবং নিয়ন্ত্রিত ডেটাসেটের জন্য অ্যাক্সেস লগ করুন।
- অ্যানালিটিক্স: স্কিউ চিহ্নিত করতে প্রতি-ক্লাস ডিস্ট্রিবিউশন এবং প্রতি-লেবেলার মেট্রিক ট্র্যাক করুন।
উপসংহার: প্রোটোটাইপ থেকে প্রোডাকশন-রেডি ডেটাসেট
Label Studio আপনাকে দ্রুত ধারণা থেকে সামঞ্জস্যপূর্ণ ট্রেনিং ডেটাতে যেতে সাহায্য করে: একটি টেমপ্লেট বাছাই করুন, আপনার স্কিমা নির্ধারণ করুন, আপনার টিমকে ক্যালিব্রেট করুন এবং আপনার মডেলের প্রয়োজনীয় ফরম্যাটে এক্সপোর্ট করুন। আপনার গাইডলাইন জীবন্ত রাখুন, তাড়াতাড়ি এক্সপোর্ট যাচাই করুন এবং সক্রিয় লার্নিংয়ের সাথে লুপ বন্ধ করুন। এই অভ্যাসগুলোর সাথে, আপনি ফরম্যাটের সাথে কম সময় ব্যয় করবেন এবং কার্যকরী মডেল শিপিংয়ে বেশি সময় দেবেন।
আরও গভীরে জানতে এবং টেমপ্লেটের জন্য দেখুন:
- Getting Started টিউটোরিয়াল
- এক্সপোর্ট ফরম্যাট এবং সতর্কতা
FAQ
Q1:Label Studio কীসের জন্য ব্যবহৃত হয়?
Label Studio হল ছবি, টেক্সট, অডিও, টাইম সিরিজ এবং ভিডিও অ্যানোটেট করার জন্য একটি ওপেন-সোর্স প্ল্যাটফর্ম। এটি আপনাকে কাস্টম লেবেলিং ইন্টারফেস ডিজাইন করতে এবং আপনার ML ট্রেনিং পাইপলাইন ব্যবহার করতে পারে এমন ফরম্যাটে অ্যানোটেশন এক্সপোর্ট করতে দেয়।
Q2:আমি কীভাবে Label Studio-তে একটি নতুন প্রোজেক্ট শুরু করব?
UI থেকে একটি প্রোজেক্ট তৈরি করুন, আপনার কাজের সাথে মেলে এমন একটি টেমপ্লেট নির্বাচন করুন এবং লেবেলিং কনফিগ কাস্টমাইজ করুন। তারপর ডেটা ইম্পোর্ট করুন (লোকাল ফাইল, URL, বা ক্লাউড স্টোরেজ) এবং অ্যানোটেটরদের টাস্ক নির্ধারণ করুন।
Q3:Label Studio কোন এক্সপোর্ট ফরম্যাট সমর্থন করে?
আপনি raw JSON এর পাশাপাশি COCO, YOLO, Pascal VOC, এবং CSV/TSV এর মতো ফরম্যাট এক্সপোর্ট করতে পারেন। কিছু টুল (যেমন ব্রাশ মাস্ক) সব ফরম্যাটে ম্যাপ নাও হতে পারে; বিস্তারিত জানার জন্য এক্সপোর্ট ডক্স দেখুন।
Q4:আমি কীভাবে Label Studio-তে লেবেলিং দ্রুত করতে পারি?
একটি বেসলাইন মডেল থেকে প্রি-অ্যানোটেশন ব্যবহার করুন, হটkeys শিখুন এবং আপনার লেবেল স্কিমা সহজ করুন। রিওয়ার্ক কমাতে ক্যালিব্রেশন রাউন্ড চালান এবং তাড়াতাড়ি ত্রুটি ধরতে রিভিউয়ের মানদণ্ড সেট করুন।
Q5:আমি কি একটি টিমের সাথে Label Studio চালাতে পারি?
হ্যাঁ। অ্যানোটেটরদের টাস্ক নির্ধারণ করুন, রিভিউ সক্ষম করুন এবং চুক্তি পরিমাপ করতে ঐকমত্য ব্যবহার করুন। নির্ভরযোগ্য ব্যাকেন্ডে ডেটা এবং অ্যানোটেশন সংরক্ষণ করুন এবং ওয়েবহুক বা API এর মাধ্যমে এক্সপোর্ট স্বয়ংক্রিয় করুন।