What is CVAT and how do I use it for image annotation?

CVAT is a browser-based labeling platform for images and videos. Create a project, define labels, upload data as a task, annotate with boxes or polygons, and export in formats like COCO or YOLO.

How do I install CVAT quickly?

The easiest path is using Docker. Follow the official installation steps to start the server locally, then access the web UI in your browser for setup and user creation.

Can CVAT auto-annotate or help with tracking in videos?

Yes, CVAT supports interpolation and tracking to propagate annotations across frames, and can integrate model-assisted labeling to pre-label objects and speed up review.

Which export formats does CVAT support?

Common exports include COCO, YOLO, and Pascal VOC. Choose the format that matches your training framework’s expected schema and class index mapping.

How do I manage teams and quality control in CVAT?

Create projects with shared labels, split tasks into jobs, assign roles (annotators, reviewers), and use reviews, comments, gold tasks, and overlap checks to ensure consistent quality.

כיצד להשתמש ב-CVAT: מדריך ידידותי, שלב אחר שלב, להערות מהירות ומדויקות

אם אי פעם ניסיתם לאמן מודל ראייה ממוחשבת, כנראה שנתקלתם באותה בעיה שכולם נתקלים בה: הנתונים צריכים תוויות מצוינות. CVAT (Computer Vision Annotation Tool) היא אחת הפלטפורמות הפופולריות ביותר ליצירת הערות תמונה ווידאו באיכות גבוהה - פתוחה, עוצמתית ובנויה להתרחב מפרויקטים צדדיים ועד לפס ייצור. מדריך זה ילווה אתכם בתהליך ההתקנה, ההגדרה, זרימות העבודה של התיוג, כלי העזר לאוטומציה, בקרת האיכות והייצוא - כך שתוכלו לעבור מאפס למערכי נתונים נקיים ללא כאוס.

אנחנו נשמור על גישה מעשית וישירה, עם דוגמאות, קיצורי דרך ומכשולים שיש להימנע מהם.

מה זה CVAT ומדוע להשתמש בו?

CVAT הוא כלי מבוסס אינטרנט להערת תמונות וסרטונים. הוא תומך בזיהוי אובייקטים, פילוח, סיווג ומעקב. אתם יכולים להריץ אותו באופן מקומי או על שרת, להזמין חברי צוות, לנהל פרויקטים/משימות ולייצא תוויות לפורמטים נפוצים (כגון COCO, YOLO, VOC). אם אתם צריכים תיוג חוזר, שיתופי ומדויק - CVAT מספקת את זה.

מבוסס דפדפן, עובד על פני צוותים

מטפל בתמונות ובסרטונים ארוכים עם אינטרפולציה/מעקב

סכמת תיוג ותכונות גמישות

פורמטי ייצוא מרובים עבור מסגרות אימון פופולריות

להכוונה רשמית, ה"תחלת העבודה" של צוות CVAT היא פריימר מועיל.

התקנה מהירה: הדרך המהירה ביותר להריץ את CVAT

נתיב ההתקנה הטיפוסי של CVAT משתמש ב-Docker. הוא מאגד את השרת, מסד הנתונים והתלויות כך שתוכלו להתחיל תוך דקות.

התקנת דרישות מוקדמות

Docker ו-Docker Compose (או Docker Desktop)

מומלץ: מעבד מודרני, מספיק RAM (8-16GB+ למשימות עתירות וידאו)

משיכת והפעלת CVAT

שכפלו את מאגר CVAT והריצו את סקריפט ה-compose, או השתמשו ישירות בתמונות קונטיינר. התיעוד הרשמי מספק פקודות מדויקות ומשתני סביבה. יש גם תמונת שרת שפורסמה ב-Docker Hub.

גישה לממשק המשתמש

לאחר שהקונטיינרים פועלים, פתחו את הדפדפן שלכם (בדרך כלל ), צרו מנהל מערכת/משתמש והיכנסו.

טיפ: אחסון נתונים על אמצעי אחסון מותקנים מבטיח שהמשימות, הפרויקטים וההערות שלכם יישארו גם לאחר עדכונים.

מבט חטוף על זרימת העבודה של CVAT

חישבו בשלוש שכבות: פרויקט ← משימה ← עבודה.

פרויקט: אוסף של משימות קשורות (לדוגמה, "זיהוי מדפים קמעונאיים 2025"). מגדיר תוויות גלובליות.

משימה: יחידת תיוג בודדת (לדוגמה, אצווה אחת של 1,000 תמונות או סרטון בן שעתיים).

עבודה: פיצול של משימה (לדוגמה, פרוסות של סרטון ארוך) המוקצה למבצעי הערות.

מבנה זה מאפשר לכם לנהל מערכי נתונים גדולים, להקצות עבודה לחברי צוות ולשמור על עקביות בהגדרות התוויות.

שלב 1: צרו פרויקט ותוויות (תכנון סכמה)

לפני העלאת נתונים, הגדירו את האונטולוגיה שלכם - מה אתם מתייגים וכיצד.

מחלקות: לדוגמה, אדם, מכונית, קסדה, סדק.

תכונות: לדוגמה, מוסתר: כן/לא, מזג אוויר: שמשי/גשום, חומרת נזק: 1–5.

קידוד צבע: משפר את הבהירות החזותית.

שיטות עבודה מומלצות:

שמרו על שמות מחלקות קצרים, עקביים ותיאוריים.

השתמשו בתכונות עבור מטא נתונים שאינם דורשים ציור (לדוגמה, "is_crowd").

הימנעו ממחלקות חופפות אלא אם כן הן היררכיות בכוונה (לדוגמה, רכב > מכונית/אוטובוס/משאית).

אתם יכולים להגדיר תוויות ברמת הפרויקט כך שכל המשימות הקשורות יירשו אותן.

שלב 2: צרו משימה והעלו נתונים

מלוח המחוונים:

חדש ← משימה ← תנו שם למשימה שלכם.

בחרו פרויקט (אופציונלי אך מומלץ).

העלו נתונים: גררו ושחררו תמונות, הצביעו על ספרייה או ספקו קישורי אחסון בענן (לדוגמה, S3, Azure Blob) בהתאם להגדרה שלכם.

אשרו שהתוויות נכונות (בירושה או ספציפיות למשימה) ולחצו על צור.

עבור סרטונים ארוכים, שקלו לחלק או לאפשר פיצול עבודה אוטומטי כדי לשמור על כל עבודה ניתנת לניהול ומגיבה עבור מבצעי ההערות.

שלב 3: בחרו את מצב ההערה הנכון

CVAT תומך במספר כלי הערה:

תיבות תוחמות: הכי מהיר לזיהוי אובייקטים.

מצולעים/קווי שבירה: עבור פילוח מקרים/סמנטי, נתיבי כביש, סדקים.

תיבות תלת מימדיות: עבור תיבות פרספקטיבה תלת מימדיות בתמונות דו מימדיות.

נקודות: נקודות מפתח או ציוני דרך (תנוחות, ציוני דרך בפנים).

תגיות: תוויות ברמת התמונה (לדוגמה, "שעות היום").

קיצורי מקשים מזרזים את העניינים באופן דרמטי:

N: צור צורה הבאה

Z: זום

V: החלף כלים

Ctrl/Cmd + S: שמור

החזיקו Shift/Alt עבור צורות מוגבלות (תלוי בכלי) והצמדה.

טיפ: שמרו על רשימת התוויות קטנה וממוקדת. יותר מדי מחלקות מאטות את מבצעי ההערות ומגדילות את שיעורי השגיאות.

שלב 4: הערת וידאו - בצעו אינטרפולציה ומעקב

עבור סרטונים, אל תבצעו הערות לכל פריים בודד. במקום זאת:

צרו תיבה או מצולע על פריים מפתח.

אפשרו אינטרפולציה/מעקב: CVAT יכול להפיץ צורות קדימה, ואז אתם מתקנים לפי הצורך בפריים מפתח חדש.

פצלו או מזגו מסלולים כאשר אובייקטים מסתירים או מופיעים מחדש.

סמנו מצבים כמו "בחוץ" או "מוסתר" כדי לשמור על רצפים נקיים.

זה מצמצם באופן דרסטי את הזמן תוך שמירה על עקביות זמנית. מחקר ושיטות עבודה מומלצות בקהילה ממליצים גם על סיוע אינטראקטיבי/עצמי בהערות כדי להאיץ את תיוג הווידאו.

שלב 5: השתמשו בכלי הערות אוטומטיות וכלי עזר

CVAT תומך בתיוג בסיוע כדי להאיץ את העבודה. בהתאם לפריסה שלכם, אתם יכולים:

השתמשו בתכונות בסיוע מודל מובנות כדי להציע תיבות/מסכות.

הריצו מודלים בצד השרת כדי לתייג מראש פריימים, ואז תקנו.

החילו אינטרפולציה כדי למלא פערים.

התחילו עם קבוצת זרעים קטנה ואיכותית, אמנו מודל מהיר והשתמשו בו כדי לתייג מראש את הנתונים הנותרים. תקנו ושנו מחדש באופן איטרטיבי.

הערה: הפרטים הספציפיים תלויים באילו מודלים אתם מאפשרים בסביבה שלכם. התיעוד הרשמי ומדריכי הקהילה מראים כיצד לחבר מודלים ל-CVAT ולאפשר הערות אוטומטיות בממשק המשתמש.

שלב 6: שתפו פעולה עם תפקידים וביקורות

CVAT היא רב-משתמשית. תפקידים טיפוסיים כוללים:

מנהל מערכת: מנהל את השרת והמשתמשים

מנהל פרויקט: מגדיר תוויות, יוצר משימות/עבודות, מקצה מבצעי הערות

מבצע הערות: יוצר ועורך תוויות

בודק/QA: בודק עבודה, מבקש תיקונים

הגדירו הנחיות ברורות: דוגמאות להערות נכונות/לא נכונות, הגדרות תכונות ומקרי קצה (לדוגמה, "לתייג השתקפויות?"). השתמשו בכלי הביקורת - הערות, סימני בעיה ושינויי סטטוס - כדי להדק את האיכות.

שלב 7: בקרת איכות שתוכלו לסמוך עליה

מספר אסטרטגיות QC מעשיות:

משימות זהב: הכניסו כמה תמונות עם תוויות מומחים כדי להשוות ביצועים של מבצעי ההערות.

חפיפה: הקצו את אותה עבודה לשני מבצעי הערות; השוו IoU והסכמה.

בדיקות פתע: בודקים מבקרים אחוז מכל עבודה.

מדדים: עקבו אחר דפוסי בלבול לפי מחלקה במהלך אימון מודל כדי לחדד את ההנחיות.

עקביות לאורך זמן חשובה יותר מתוויות מושלמות חד פעמיות. תעדו החלטות ועדכנו את מדריך התוויות כשאתם מגלים מקרי קצה.

שלב 8: שמרו, גרסו וייצאו

שמרו לעתים קרובות (CVAT גם שומר אוטומטית). כשאתם מוכנים:

פורמטי ייצוא: COCO, YOLO, Pascal VOC ועוד. בחרו את הפורמט שקוד האימון שלכם מצפה לו.

טווח פריימים: ייצאו פלחים ספציפיים או את כל המשימה.

מסננים: ייצאו רק תוויות או תכונות מסוימות במידת הצורך.

עיינו בתיעוד הרשמי לקבלת אפשרויות ופרמטרים ייצוא עדכניים. לפרטי התקנה ותמונת שרת, הדפים של התיעוד ו-Docker Hub הם מקורות מוסמכים.

תרחישים וטיפים מעשיים

תרחיש 1: זיהוי אובייקטים על מדפים קמעונאיים

תוויות: מוצר, תג מחיר, שלט קידום מכירות.

השתמשו בתיבות למהירות; הוסיפו תכונות כמו מבצע=כן/לא.

ייצאו ל-YOLO עבור פס ייצור אימון קל משקל.

תרחיש 2: פילוח נתיבי כביש

השתמשו בקווי שבירה או מצולעים.

בצעו אינטרפולציה על פני פריימים; תקנו בפניות.

ייצאו ל-COCO panoptic/segmentation בהתאם למסגרת העבודה שלכם.

תרחיש 3: עמידה בציוד בטיחות

עקבו אחר אדם, קסדה, אפודה על פני וידאו.

השתמשו במעקב + תכונות (קסדה=נוכחת/נעדרת).

בדקו היטב הסתרות בנקודות כניסה/יציאה.

טיפים מקצועיים:

שמרו על משימות מתחת לכמה אלפי תמונות או פצלו סרטונים ארוכים כדי לשמור על ממשק המשתמש מגיב.

נרמלו את גדלי התמונות או דחסו סרטונים כדי לאזן בין ביצועים לבהירות.

גרסו מערכי נתונים - ייצאו עם תג ברור (לדוגמה, v1.2.0) ונעלו משימות לאחר סיום.

פתרון בעיות נפוצות

ממשק משתמש איטי בסרטונים גדולים: פצלו לעבודות קצרות יותר; צמצמו את רזולוציית התצוגה המקדימה ואת גודל האחזור המקדים.

סחיפת הערות במעקב: הוסיפו פריימים מרכזיים בתדירות גבוהה יותר, במיוחד במהלך תנועה מהירה או הסתרות.

תוויות מבלבלות: שנו את מבנה האונטולוגיה; העבירו פרטים ספציפיים לתכונות; ספקו דוגמאות חזותיות.

חוסר התאמה בייצוא: בדקו שוב את השדות הצפויים של ספריית האימון שלכם (לדוגמה, מיפוי אינדקס מחלקת YOLO, מזהי קטגוריות COCO).

שילוב בצינור ה-ML שלכם

עיבוד מקדים: שנו את הגודל/נרמלו תמונות לפני העלאתן כדי להאיץ את ההערה.

אוטומציה: תייגו מראש עם מודל מהיר, תקנו ב-CVAT, ואז בצעו איטרציה.

CI לנתונים: התייחסו לתוויות כמו קוד - ייצוא מגורס, סכומי ביקורת ויומני שינויים.

אחסון: השתמשו בדלי ענן ומדיניות מחזור חיים עבור מערכי נתונים גדולים של וידאו.

ראוי לציין: אם אתם משתמשים בעוזרי AI כדי לתעד הנחיות, ליצור טקסונומיות של תוויות או לסכם משוב של בודקים, כלי כמו Sider.AI יכול לעזור לכם ליצור הוראות ברורות ורשימות ביקורת עקביות. אתם יכולים לתפוס החלטות, ליצור דוגמאות ולהפוך אותן לספרי הפעלה הניתנים לשיתוף עבור הצוות שלכם. ראו Sider.AI למידע נוסף.

תוכנית התחלתית בת 30 דקות

5 דקות: התקינו והפעילו את CVAT באופן מקומי.

5 דקות: צרו פרויקט עם 3–5 תוויות ושתי תכונות.

5 דקות: צרו משימה עם 100 תמונות.

10 דקות: בצעו הערות ל-20 תמונות באמצעות תיבות; למדו קיצורי דרך.

5 דקות: ייצאו ל-YOLO והריצו מעבר אימון מהיר.

עד סוף התהליך, יהיה לכם לולאה שלמה מתמונות גולמיות למערך נתונים שניתן לאמן.

היכן ללמוד עוד

יסודות CVAT ומדריכים מהצוות.

פרטי התקנה ותצורה.

תמונת שרת ואזכורי קונטיינר.

מחקר על הערות אינטראקטיביות/עצמיות עבור וידאו כדי לעורר זרימות עבודה מהירות יותר.

עיקרי הדברים

הגדירו את התוויות שלכם תחילה - תכנון סכמה מונע כאב במורד הזרם.

השתמשו באינטרפולציה ומעקב עבור וידאו; בצעו פריימים מרכזיים בצורה חכמה.

הערות אוטומטיות מאיצות את העבודה; ביקורת אנושית מבטיחה איכות.

ייצאו בפורמט שקוד האימון שלכם מצפה לו; גרסו הכל.

התחילו בקטן, בצעו איטרציה מהירה והתרחבו עם הנחיות ברורות.

שאלות נפוצות

ש1: מה זה CVAT וכיצד אוכל להשתמש בו להערות תמונה? CVAT היא פלטפורמת תיוג מבוססת דפדפן לתמונות וסרטונים. צרו פרויקט, הגדירו תוויות, העלו נתונים כמשימה, בצעו הערות עם תיבות או מצולעים וייצאו בפורמטים כמו COCO או YOLO.

ש2: כיצד אוכל להתקין את CVAT במהירות? הדרך הקלה ביותר היא להשתמש ב-Docker. בצעו את שלבי ההתקנה הרשמיים כדי להפעיל את השרת באופן מקומי, ואז גשו לממשק המשתמש של האינטרנט בדפדפן שלכם לצורך הגדרה ויצירת משתמש.

ש3: האם CVAT יכול לבצע הערות אוטומטיות או לעזור במעקב בסרטונים? כן, CVAT תומך באינטרפולציה ומעקב כדי להפיץ הערות על פני פריימים, ויכול לשלב תיוג בסיוע מודל כדי לתייג מראש אובייקטים ולהאיץ את הביקורת.

ש4: אילו פורמטי ייצוא תומך CVAT? ייצוא נפוץ כולל COCO, YOLO ו-Pascal VOC. בחרו את הפורמט שתואם לסכמה הצפויה ולמיפוי אינדקס המחלקות של מסגרת האימון שלכם.

ש5: כיצד אוכל לנהל צוותים ובקרת איכות ב-CVAT? צרו פרויקטים עם תוויות משותפות, פצלו משימות לעבודות, הקצו תפקידים (מבצעי הערות, בודקים) והשתמשו בביקורות, הערות, משימות זהב ובדיקות חפיפה כדי להבטיח איכות עקבית.