Hướng dẫn sử dụng Label Studio: Hướng dẫn đầy đủ, không rườm rà cho năm 2025
Nếu bạn đang xây dựng thị giác máy tính, NLP hoặc AI đa phương thức, bạn có thể sẽ gặp phải một nút thắt cổ chai: dữ liệu được gắn nhãn chất lượng cao. Label Studio, một nền tảng gắn nhãn dữ liệu mã nguồn mở, cung cấp cho bạn khả năng kiểm soát linh hoạt các chú thích hình ảnh, văn bản, âm thanh, chuỗi thời gian và video mà không bị khóa vào một ngăn xếp ML duy nhất. Trong hướng dẫn từng bước thực tế này, chúng tôi sẽ chỉ cho bạn cách sử dụng Label Studio — từ cài đặt đến xuất — để bạn có thể tự tin chuyển từ “dự án trống” sang “nhãn sẵn sàng cho sản xuất”.
Chúng ta sẽ tuân theo một phong cách thực tế & hướng đến giải pháp: các bước ngắn gọn, quyết định rõ ràng và các mẹo hữu ích để tránh những sai lầm thường gặp.
Bạn sẽ học được gì
- Cách cài đặt và khởi chạy Label Studio
- Cách tạo dự án đầu tiên và chọn mẫu gắn nhãn
- Cách nhập dữ liệu (tệp cục bộ, vùng chứa đám mây, URL)
- Cách thiết lập giao diện gắn nhãn cho hình ảnh, văn bản, âm thanh hoặc video
- Cách quản lý người gắn nhãn, đánh giá và đảm bảo chất lượng
- Cách xuất chú thích sang các định dạng tương thích với quy trình huấn luyện của bạn
Điều đáng chú ý: Nếu bạn đang điều phối nghiên cứu đa mô hình hoặc soạn thảo tài liệu tập dữ liệu, một trợ lý AI như Sider.AI có thể giúp tạo hướng dẫn nhiệm vụ hoặc tóm tắt tự động các chính sách chú thích để giúp các nhóm luôn phối hợp. Bạn có thể xem tại Sider.ai. Tại sao nên chọn Label Studio?
- Lược đồ linh hoạt: Xác định cấu hình gắn nhãn tùy chỉnh cho hộp giới hạn, đa giác, điểm chính, khoảng văn bản, quan hệ, vùng âm thanh, v.v.
- Nhiều loại dữ liệu: Hình ảnh, văn bản, âm thanh, HTML, chuỗi thời gian và video.
- Quy trình làm việc nhóm: Chỉ định nhiệm vụ, cho phép sự đồng thuận, xem xét chú thích và quản lý chất lượng.
- Có thể mở rộng: Tích hợp với các phần phụ trợ lưu trữ, webhook và gắn nhãn có hỗ trợ mô hình.
Để có tổng quan chính thức và tải xuống, hãy xem trang chủ Label Studio.
Bước 1: Cài đặt Label Studio
Bạn có thể chạy Label Studio cục bộ bằng Python hoặc Docker. Chọn một phương pháp:
Tùy chọn A: Python (pip)
# Tạo môi trường ảo (nên dùng)
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
# Cài đặt Label Studio
pip install label-studio
# Khởi chạy
label-studio start
Sau đó, hãy truy cập URL cục bộ đã in (thường là `).
Tùy chọn B: Docker
docker run -it -p 8080:8080 heartexlabs/label-studio:latest
Nếu bạn mới làm quen với Label Studio, hướng dẫn “Bắt đầu” chính thức rất ngắn gọn và được cập nhật thường xuyên, đồng thời phần khởi động nhanh tập trung vào các bước tối thiểu để gắn nhãn cho một tập dữ liệu mẫu.
Mẹo chuyên nghiệp: Đối với các nhóm, hãy cân nhắc cơ sở dữ liệu được quản lý (PostgreSQL) và bộ nhớ được gắn để có khả năng phục hồi.
Bước 2: Tạo một Dự án
- Đăng nhập vào giao diện người dùng và nhấp vào “Tạo Dự án”.
- Đặt cho nó một cái tên rõ ràng (ví dụ: “Phát hiện Kệ Bán lẻ v1”) và mô tả (bao gồm phiên bản và mục đích của tập dữ liệu).
- Chọn “Thiết lập Gắn nhãn”. Bạn có thể:
- Bắt đầu từ một mẫu (ví dụ: phát hiện đối tượng, NER, tình cảm, vùng âm thanh)
- Hoặc viết cấu hình XML tùy chỉnh để điều chỉnh các công cụ và lớp
Trình hướng dẫn khởi động nhanh giúp bạn chọn một mẫu, đổi tên các lớp và lưu cấu hình.
Bước 3: Nhập Dữ liệu của bạn
Bạn có thể nhập dữ liệu qua giao diện người dùng hoặc API. Các đường dẫn phổ biến:
- Tải lên các tệp cục bộ (kéo và thả)
- Cung cấp URL đến các tệp từ xa
- Kết nối bộ nhớ đám mây (S3, GCS, Azure Blob) thông qua cài đặt
- Sử dụng REST API để nhập dữ liệu theo chương trình
Các bản ghi dữ liệu thường bao gồm một trọng tải data trỏ đến tài sản của bạn (ví dụ: "image": " hoặc "text": "Đây là một câu."`). Giữ cho tên tệp ổn định để đơn giản hóa việc ánh xạ trong quá trình xuất.
Mẹo về chất lượng: Phiên bản hóa tập dữ liệu của bạn và giữ một bản kê khai nguồn → xuất chú thích để bạn có thể tái tạo các lần chạy huấn luyện.
Bước 4: Định cấu hình Giao diện Gắn nhãn
Giao diện gắn nhãn xác định các công cụ và lớp. Bạn sẽ thấy cấu hình giống XML, nơi bạn chọn các thành phần như RectangleLabels, PolygonLabels, KeyPointLabels, TextArea, Choices, Audio, TimeSeries, v.v.
Ví dụ:
Phát hiện Đối tượng Hình ảnh
<View>
<Image name="img" value="$image"/>
<RectangleLabels name="label" toName="img">
<Label value="Product" background="#34D399"/>
<Label value="PriceTag" background="#60A5FA"/>
</RectangleLabels>
</View>
Nhận dạng Thực thể Có tên Văn bản (NER)
<View>
<Text name="txt" value="$text"/>
<Labels name="label" toName="txt">
<Label value="ORG"/>
<Label value="PERSON"/>
<Label value="LOC"/>
</Labels>
</View>
Gắn nhãn Vùng Âm thanh
<View>
<Audio name="audio" value="$audio"/>
<Labels name="label" toName="audio">
<Label value="Speech"/>
<Label value="Noise"/>
<Label value="Music"/>
</Labels>
</View>
Bắt đầu với mẫu gần nhất với tác vụ của bạn và lặp lại. Giữ cho tên lớp ổn định giữa các phiên bản để dễ dàng hợp nhất tập dữ liệu.
Bước 5: Các phương pháp hay nhất khi Gắn nhãn
- Xác định các hướng dẫn rõ ràng: Bao gồm các ví dụ về chú thích đúng so với chú thích không chính xác và các trường hợp đặc biệt.
- Sử dụng phím nóng: Tăng tốc độ và tính nhất quán bằng cách học các phím tắt cho các công cụ của bạn.
- Hiệu chỉnh sớm: Yêu cầu 2–3 người gắn nhãn chú thích cùng một 50–100 mục, so sánh kết quả và tinh chỉnh hướng dẫn.
- Thêm chú thích trước: Nếu bạn có một mô hình cơ sở, hãy nhập các dự đoán để tăng tốc độ sửa lỗi.
- Cân bằng thông lượng và chất lượng: Sử dụng hàng đợi đồng thuận hoặc xem xét khi cổ phần cao.
Nhân tiện, để viết hướng dẫn chú thích rõ ràng, nhất quán hoặc chuyển đổi kiến thức miền thành danh sách kiểm tra thân thiện với người gắn nhãn, Sider.AI có thể soạn thảo và tinh chỉnh hướng dẫn nhanh chóng đồng thời giữ một nhật ký thay đổi mà các nhóm có thể theo dõi. Bước 6: Quản lý Người gắn nhãn, Đánh giá và QA
Label Studio hỗ trợ các nhóm:
- Chỉ định nhiệm vụ cho những người chú thích cụ thể
- Bật quy trình xem xét/phê duyệt
- Theo dõi tiến độ và hiệu suất của người gắn nhãn
- Sử dụng sự đồng thuận (nhiều chú thích cho mỗi nhiệm vụ) để đo lường sự đồng ý
Đặt tiêu chí chấp nhận rõ ràng (ví dụ: ngưỡng IoU cho các hộp, quy tắc ranh giới khoảng, thời lượng vùng âm thanh tối thiểu) và thực thi chúng trong quá trình xem xét.
Kiểm tra QA phổ biến:
- Độ chặt của hộp giới hạn không nhất quán
- Các thực thể chồng chéo trong NER
- Các định nghĩa trôi dạt theo thời gian (cập nhật hướng dẫn!)
Bước 7: Xuất Chú thích
Khi lô của bạn đã sẵn sàng, hãy xuất chú thích để huấn luyện. Label Studio lưu trữ chú thích ở định dạng JSON nội bộ và cho phép bạn xuất sang nhiều định dạng. Xem tài liệu xuất chính thức để biết danh sách và các bước hiện tại.
Các định dạng điển hình bao gồm:
- JSON Label Studio thô (hoàn chỉnh và không mất dữ liệu nhất)
- COCO (để phát hiện/phân đoạn)
- YOLO (để phát hiện đối tượng)
- CSV/TSV cho các tác vụ đơn giản hơn
Lưu ý quan trọng:
- Một số công cụ (ví dụ: cọ vẽ/phân đoạn) không ánh xạ rõ ràng đến một số định dạng nhất định — COCO và YOLO có thể không hỗ trợ trực tiếp cọ vẽ tự do. Xem hướng dẫn của cộng đồng về những hạn chế khi xuất phân đoạn.
- Bộ chuyển đổi tồn tại để chuyển đổi JSON Label Studio sang YOLO, nhưng có thể xảy ra các khoảng trống tùy thuộc vào công cụ gắn nhãn được sử dụng và siêu dữ liệu bạn giữ lại.
Quy trình xuất thực tế:
- Chạy xuất thử nghiệm nhỏ sớm; xác thực rằng tập lệnh huấn luyện của bạn phân tích cú pháp nó.
- Khóa cài đặt trước khi xuất của bạn (thứ tự lớp, giả định về độ phân giải, v.v.).
- Ghi lại bất kỳ bước chuyển đổi nào (tập lệnh, hàm băm phiên bản) để có thể tái tạo.
Bước 8: Tích hợp Với Quy trình ML của bạn
- Sử dụng API để kéo các chú thích đã hoàn thành vào các công việc huấn luyện của bạn.
- Giữ cho các phân tách được xác định: đính kèm siêu dữ liệu như
split: train/val/test vào các tác vụ.
- Phiên bản hóa mọi thứ: bản kê khai tập dữ liệu, xuất chú thích, cấu hình mô hình.
- Đóng vòng lặp: chạy phân tích lỗi, xác định các cụm lỗi và lên lịch các vòng gắn nhãn lại.
Mẫu quy trình làm việc:
- Gắn nhãn một bộ hạt giống
- Huấn luyện một mô hình cơ sở
- Khai thác các ví dụ khó từ các lỗi mô hình
- Gắn nhãn lại các lát được nhắm mục tiêu
Vòng lặp học tập chủ động này giúp tăng chất lượng nhanh hơn so với gắn nhãn vũ lực.
Khắc phục sự cố các sự cố thường gặp
- “Xuất của tôi sẽ không tải vào YOLO/COCO.”
- Kiểm tra khả năng tương thích của công cụ (ví dụ: cọ vẽ so với đa giác). Chuyển đổi thành các hình dạng tương thích khi có thể và tham khảo tài liệu xuất và ghi chú của cộng đồng.
- “Nhãn không khớp với thứ tự lớp huấn luyện của tôi.”
- Sửa thứ tự sớm. Chuẩn hóa tên nhãn và giữ lại ánh xạ trong quy trình của bạn.
- “Người chú thích không đồng ý nhiều.”
- Thêm các vòng hiệu chỉnh, làm rõ các quy tắc và xem xét các bước đồng thuận hoặc phân xử.
- Sử dụng chú thích trước, phím nóng và tăng tốc cụ thể cho công cụ (ví dụ: tự động phân đoạn, chụp nhanh). Cắt tỉa các tác vụ có giá trị thấp.
Danh sách kiểm tra khởi động nhanh trong 30 phút
- Cài đặt Label Studio (pip hoặc Docker)
- Tạo một dự án với mẫu phù hợp nhất
- Soạn thảo hướng dẫn với các trường hợp đặc biệt và ví dụ
- Chỉ định hai người gắn nhãn cho một lô hiệu chỉnh
- Xem xét sự không đồng ý và cập nhật các quy tắc
- Kiểm tra xuất vào mã huấn luyện của bạn
Để có một hướng dẫn chính thức, ngắn gọn, hãy xem lại “Bắt đầu” và hướng dẫn “Khởi động nhanh”.
Mẹo nâng cao cho người dùng thành thạo
- Tiện ích tùy chỉnh: Mở rộng giao diện cho các công cụ dành riêng cho miền.
- Webhook: Kích hoạt các công việc (ví dụ: bắt đầu chuyển đổi hoặc huấn luyện mô hình) khi các tác vụ hoàn thành.
- Gắn nhãn có hỗ trợ mô hình: Sử dụng nhãn trước từ các mô hình nội bộ hoặc đám mây của bạn để giảm công việc thủ công.
- Quyền riêng tư dữ liệu: Chạy tại chỗ, hạn chế xuất và ghi nhật ký truy cập cho các tập dữ liệu được quản lý.
- Phân tích: Theo dõi phân phối trên mỗi lớp và số liệu trên mỗi người gắn nhãn để phát hiện độ lệch.
Kết luận: Từ Nguyên mẫu đến Tập dữ liệu Sẵn sàng Sản xuất
Label Studio giúp bạn di chuyển nhanh chóng từ ý tưởng đến dữ liệu huấn luyện nhất quán: chọn một mẫu, xác định lược đồ của bạn, hiệu chỉnh nhóm của bạn và xuất ở các định dạng mà mô hình của bạn cần. Giữ cho hướng dẫn của bạn luôn sống động, xác thực xuất sớm và đóng vòng lặp bằng cách học tập chủ động. Với những thói quen đó, bạn sẽ tốn ít thời gian hơn cho việc vật lộn với các định dạng và có nhiều thời gian hơn để vận chuyển các mô hình hoạt động.
Để tìm hiểu sâu hơn và xem các mẫu, hãy xem:
- Hướng dẫn khởi động nhanh
- Định dạng xuất và những hạn chế
Câu hỏi thường gặp
Q1:Label Studio được sử dụng để làm gì?
Label Studio là một nền tảng mã nguồn mở để chú thích hình ảnh, văn bản, âm thanh, chuỗi thời gian và video. Nó cho phép bạn thiết kế các giao diện gắn nhãn tùy chỉnh và xuất các chú thích sang các định dạng mà quy trình huấn luyện ML của bạn có thể sử dụng.
Q2:Làm cách nào để bắt đầu một dự án mới trong Label Studio?
Tạo một dự án từ giao diện người dùng, chọn một mẫu phù hợp với tác vụ của bạn và tùy chỉnh cấu hình gắn nhãn. Sau đó, nhập dữ liệu (tệp cục bộ, URL hoặc bộ nhớ đám mây) và chỉ định tác vụ cho người chú thích.
Q3:Label Studio hỗ trợ những định dạng xuất nào?
Bạn có thể xuất JSON thô cũng như các định dạng như COCO, YOLO, Pascal VOC và CSV/TSV. Một số công cụ (như mặt nạ cọ vẽ) có thể không ánh xạ đến tất cả các định dạng; hãy kiểm tra tài liệu xuất để biết chi tiết.
Q4:Làm cách nào để tăng tốc độ gắn nhãn trong Label Studio?
Sử dụng chú thích trước từ mô hình cơ sở, học phím nóng và đơn giản hóa lược đồ nhãn của bạn. Chạy các vòng hiệu chỉnh để giảm bớt việc làm lại và đặt tiêu chí xem xét để phát hiện lỗi sớm.
Q5:Tôi có thể chạy Label Studio với một nhóm không?
Vâng. Chỉ định tác vụ cho người chú thích, bật đánh giá và sử dụng sự đồng thuận để đo lường sự đồng ý. Lưu trữ dữ liệu và chú thích trong các phần phụ trợ đáng tin cậy và tự động hóa việc xuất bằng webhook hoặc API.