Sider.ai
  • دردشة
  • Wisebase
  • أدوات
  • امتداد
  • العملاء
  • التسعير
التحميل الان
تسجيل الدخول

تعلم بشكل أسرع، فكر بعمق، وازدد ذكاءً مع Sider.

المنتجات
التطبيقات
  • الإضافات
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
أدوات
  • مُنشئ الويبNew
  • شرائح الذكاء الاصطناعيNew
  • كاتب المقالات بالذكاء الاصطناعي
  • Nano Banana Pro
  • Nano Banana Infographic
  • مولد الصور بالذكاء الاصطناعي
  • مولد الأفكار المجنونة الإيطالية
  • مزيل الخلفية
  • مغير الخلفية
  • ممحاة الصور
  • مزيل النصوص
  • إعادة الطلاء
  • مكبر الصور
  • إنشاء
  • مترجم الذكاء الاصطناعي
  • مترجم الصور
  • مترجم PDF
Sider
  • اتصل بنا
  • مركز المساعدة
  • تحميل
  • السعر
  • خطة التعليم
  • ما الجديد
  • مدونة
  • مجتمع
  • الشركاء
  • الشراكة
  • دعوة
©2026 جميع الحقوق محفوظة
شروط الاستخدام
سياسة الخصوصية
  • الصفحة الرئيسية
  • مدونة
  • أدوات الذكاء الاصطناعي
  • كيفية استخدام CVAT: دليل سهل ومفصل لعمليات الشرح التوضيحي السريعة والدقيقة

كيفية استخدام CVAT: دليل سهل ومفصل لعمليات الشرح التوضيحي السريعة والدقيقة

تم التحديث في 25 سبتمبر 2025

8 دقيقة


كيفية استخدام CVAT: دليل سهل وشامل خطوة بخطوة لعمل شروحات سريعة ودقيقة

إذا حاولت يومًا تدريب نموذج للرؤية الحاسوبية، فربما واجهت نفس المشكلة التي يواجهها الجميع: البيانات تحتاج إلى تسميات ممتازة. CVAT (أداة شرح الرؤية الحاسوبية) هي واحدة من أكثر المنصات شيوعًا لإنشاء شروحات صور وفيديو عالية الجودة - مفتوحة وقوية ومصممة للتوسع من المشاريع الجانبية إلى خطوط الإنتاج. يرشدك هذا الدليل الإرشادي خلال التثبيت والإعداد وسير عمل وضع العلامات ومساعدي التشغيل الآلي ومراقبة الجودة وعمليات التصدير - حتى تتمكن من الانتقال من الصفر إلى مجموعات بيانات نظيفة دون فوضى.
سنحافظ على الطابع العملي والمباشر، مع أمثلة واختصارات ومزالق لتجنبها.

ما هو CVAT ولماذا نستخدمه؟

CVAT هي أداة قائمة على الويب لشرح الصور ومقاطع الفيديو. وهي تدعم الكشف عن الكائنات والتجزئة والتصنيف والتتبع. يمكنك تشغيله محليًا أو على خادم، ودعوة زملاء الفريق، وإدارة المشاريع/المهام، وتصدير الملصقات إلى تنسيقات شائعة (مثل COCO و YOLO و VOC). إذا كنت بحاجة إلى وضع علامات متكررة وتعاونية ودقيقة، فإن CVAT تقدم لك ذلك.
  • يعمل على المتصفح وقابل للاستخدام عبر الفرق
  • يتعامل مع الصور ومقاطع الفيديو الطويلة مع الاستيفاء/التتبع
  • مخطط تسمية وسمات مرنة
  • تنسيقات تصدير متعددة لأطر التدريب الشائعة
للحصول على توجيه رسمي، فإن "البدء" لفريق CVAT هو تمهيدي مفيد.

إعداد سريع: أسرع طريقة لتشغيل CVAT

يستخدم مسار تثبيت CVAT النموذجي Docker. يقوم بتجميع الخادم وقاعدة البيانات والتبعيات حتى تتمكن من البدء في دقائق.
  1. تثبيت المتطلبات الأساسية
  • Docker و Docker Compose (أو Docker Desktop)
  • مستحسن: وحدة معالجة مركزية حديثة، وذاكرة وصول عشوائي كافية (8-16 جيجابايت + للمهام التي تعتمد على الفيديو بشكل كبير)
  1. سحب وبدء CVAT
  • استنساخ مستودع CVAT وتشغيل البرنامج النصي compose، أو استخدم صور الحاوية مباشرةً. توفر المستندات الرسمية أوامر ومتغيرات بيئة دقيقة. توجد أيضًا صورة خادم منشورة على Docker Hub.
  1. الوصول إلى واجهة المستخدم
  • بمجرد تشغيل الحاويات، افتح متصفحك (عادةً ما يكون {Chrome})، وأنشئ مسؤول/مستخدم، وقم بتسجيل الدخول.
نصيحة: يضمن تخزين البيانات على وحدات التخزين المثبتة استمرار المهام والمشاريع والشروحات عبر التحديثات.

نظرة سريعة على سير عمل CVAT

فكر في ثلاثة طبقات: المشروع → المهمة → الوظيفة.
  • المشروع: مجموعة للمهام ذات الصلة (مثل، "الكشف عن رفوف البيع بالتجزئة 2025"). يحدد التصنيفات العالمية.
  • المهمة: وحدة تسمية واحدة (مثل، دفعة واحدة من 1000 صورة أو مقطع فيديو مدته ساعتان).
  • الوظيفة: تقسيم مهمة (مثل، شرائح من مقطع فيديو طويل) يتم تعيينها للقائمين بالشرح.
يتيح لك هذا الهيكل إدارة مجموعات البيانات الكبيرة وتعيين العمل لزملاء الفريق والحفاظ على تعريفات التسميات متسقة.

الخطوة 1: إنشاء مشروع وتسميات (تصميم المخطط)

قبل تحميل البيانات، حدد علم الوجود الخاص بك - ما الذي تقوم بتسميته وكيف.
  • الفئات: على سبيل المثال، ، ، ، .
  • السمات: على سبيل المثال، ، ، .
  • ترميز الألوان: يحسن الوضوح البصري.
أفضل الممارسات:
  • حافظ على أسماء الفئات قصيرة ومتسقة وواصفة.
  • استخدم السمات للبيانات الوصفية التي لا تتطلب الرسم (على سبيل المثال، "is_crowd").
  • تجنب الفئات المتداخلة ما لم تكن هرمية عن قصد (على سبيل المثال، ).
يمكنك تحديد التصنيفات على مستوى المشروع بحيث ترثها جميع المهام ذات الصلة.

الخطوة 2: إنشاء مهمة وتحميل البيانات

من لوحة التحكم:
  • جديد → مهمة → قم بتسمية مهمتك.
  • حدد المشروع (اختياري ولكنه موصى به).
  • تحميل البيانات: قم بسحب وإفلات الصور، أو الإشارة إلى دليل، أو توفير روابط تخزين سحابية (مثل S3، Azure Blob) اعتمادًا على الإعداد الخاص بك.
  • تأكد من صحة التصنيفات (الموروثة أو الخاصة بالمهمة) واضغط على إنشاء.
بالنسبة لمقاطع الفيديو الطويلة، ضع في اعتبارك تقسيمها أو تمكين تقسيم الوظائف تلقائيًا للحفاظ على كل وظيفة قابلة للإدارة وسريعة الاستجابة للقائمين بالشرح.

الخطوة 3: اختر وضع الشرح الصحيح

يدعم CVAT أدوات شرح متعددة:
  • المربعات المحيطة: الأسرع للكشف عن الكائنات.
  • المضلعات/الخطوط المتعددة: لتجزئة المثيل/الدلالي، ومسارات الطرق، والشقوق.
  • المكعبات: للمربعات ذات المنظور ثلاثي الأبعاد في الصور ثنائية الأبعاد.
  • النقاط: النقاط الرئيسية أو المعالم (الأوضاع والمعالم الوجهية).
  • العلامات: تصنيفات على مستوى الصورة (مثل، "وقت النهار").
تؤدي اختصارات لوحة المفاتيح إلى تسريع الأمور بشكل كبير:
  • N: إنشاء الشكل التالي
  • Z: تكبير
  • V: تبديل الأدوات
  • Ctrl/Cmd + S: حفظ
  • اضغط باستمرار على Shift/Alt للأشكال المقيدة (حسب الأداة) والتقاط الصور.
نصيحة: حافظ على قائمة التصنيفات صغيرة ومركزة. الكثير من الفئات يبطئ القائمين بالشرح ويزيد من معدلات الخطأ.

الخطوة 4: شرح الفيديو - الاستيفاء والتتبع

بالنسبة لمقاطع الفيديو، لا تقم بشرح كل إطار على حدة. بدلا من ذلك:
  • قم بإنشاء مربع أو مضلع على إطار رئيسي.
  • تمكين الاستيفاء/التتبع: يمكن لـ CVAT نشر الأشكال إلى الأمام، ثم تقوم بتصحيحها حسب الحاجة على الإطارات الرئيسية الجديدة.
  • تقسيم أو دمج المسارات عندما تحجب الكائنات أو تظهر مرة أخرى.
  • ضع علامة على الحالات مثل "خارج" أو "محجوب" للحفاظ على نظافة التسلسلات.
يقلل هذا بشكل كبير من الوقت مع الحفاظ على الاتساق الزمني. توصي أفضل الممارسات البحثية والمجتمعية أيضًا بمساعدة الشرح التفاعلي/الذاتي لتسريع تسمية الفيديو.

الخطوة 5: استخدام الشرح التلقائي والأدوات المساعدة

يدعم CVAT التسمية بمساعدة لتسريع العمل. بناءً على النشر الخاص بك، يمكنك:
  • استخدم ميزات بمساعدة النموذج المدمجة لاقتراح مربعات/أقنعة.
  • قم بتشغيل نماذج من جانب الخادم لتسمية الإطارات مسبقًا، ثم قم بتصحيحها.
  • تطبيق الاستيفاء لملء الفجوات.
ابدأ بمجموعة أولية صغيرة وعالية الجودة، وقم بتدريب نموذج سريع، واستخدمه لتسمية البيانات المتبقية مسبقًا. قم بالتصحيح وإعادة التدريب بشكل تكراري.
ملاحظة: تعتمد التفاصيل على النماذج التي تمكنها في بيئتك. توضح المستندات الرسمية والبرامج التعليمية للمجتمع كيفية ربط النماذج بـ CVAT وتمكين الشرح التلقائي في واجهة المستخدم.

الخطوة 6: التعاون مع الأدوار والمراجعات

CVAT متعدد المستخدمين. تشمل الأدوار النموذجية:
  • المسؤول: يدير الخادم والمستخدمين
  • مدير المشروع: يحدد التصنيفات، وينشئ المهام/الوظائف، ويعين القائمين بالشرح
  • القائم بالشرح: ينشئ ويحرر التصنيفات
  • المراجع/ضمان الجودة: يتحقق من العمل، ويطلب إجراء إصلاحات
ضع إرشادات واضحة: أمثلة على الشروحات الصحيحة/غير الصحيحة، وتعريفات السمات، والحالات الحدودية (على سبيل المثال، "هل تسميات الانعكاسات؟"). استخدم أدوات المراجعة - التعليقات وعلامات المشكلات وتغييرات الحالة - لتشديد الجودة.

الخطوة 7: مراقبة الجودة التي يمكنك الوثوق بها

بعض استراتيجيات مراقبة الجودة العملية:
  • مهام ذهبية: أدخل عددًا قليلاً من الصور التي تم تسميتها بخبرة لتقييم القائمين بالشرح.
  • التداخل: قم بتعيين نفس الوظيفة لاثنين من القائمين بالشرح؛ قارن IoU والاتفاق.
  • عمليات التحقق الموضعية: يقوم المراجعون بمراجعة نسبة مئوية من كل وظيفة.
  • المقاييس: تتبع أنماط الالتباس لكل فئة أثناء تدريب النموذج لتحسين الإرشادات.
الاتساق بمرور الوقت أهم من الملصقات المثالية لمرة واحدة. قم بتوثيق القرارات وتحديث دليل الملصقات أثناء اكتشاف الحالات الحدودية.

الخطوة 8: الحفظ والإصدار والتصدير

احفظ بشكل متكرر (CVAT يحفظ تلقائيًا أيضًا). عندما تكون مستعدًا:
  • تنسيقات التصدير: COCO و YOLO و Pascal VOC والمزيد. اختر التنسيق الذي يتوقعه كود التدريب الخاص بك.
  • نطاقات الإطارات: قم بتصدير شرائح معينة أو المهمة بأكملها.
  • عوامل التصفية: قم بتصدير تصنيفات أو سمات معينة فقط إذا لزم الأمر.
راجع الوثائق الرسمية للحصول على خيارات ومعلمات التصدير الحديثة. للحصول على تفاصيل التثبيت وصورة الخادم، تعد المستندات وصفحات Docker Hub مراجع موثوقة.

سيناريوهات ونصائح عملية

السيناريو 1: الكشف عن الكائنات على رفوف البيع بالتجزئة
  • التصنيفات: ، ، .
  • استخدم المربعات للسرعة؛ أضف سمات مثل .
  • تصدير إلى YOLO لخط أنابيب تدريب خفيف الوزن.
السيناريو 2: تجزئة مسار الطريق
  • استخدم الخطوط المتعددة أو المضلعات.
  • الاستيفاء عبر الإطارات؛ التصحيح عند المنعطفات.
  • تصدير إلى COCO بانورامي/تجزئة اعتمادًا على الإطار الخاص بك.
السيناريو 3: الامتثال لمعدات السلامة
  • تتبع ، ، عبر الفيديو.
  • استخدم التتبع + السمات ().
  • راجع الانسدادات بعناية عند نقاط الدخول/الخروج.
نصائح احترافية:
  • احتفظ بالمهام أقل من بضعة آلاف من الصور أو قسّم مقاطع الفيديو الطويلة للحفاظ على استجابة واجهة المستخدم.
  • قم بتطبيع أحجام الصور أو ضغط مقاطع الفيديو لتحقيق التوازن بين الأداء والوضوح.
  • إصدار مجموعات البيانات - التصدير بعلامة واضحة (على سبيل المثال، ) وقفل المهام بمجرد الانتهاء منها.

استكشاف الأخطاء وإصلاحها في المشاكل الشائعة

  • واجهة مستخدم متقطعة على مقاطع فيديو كبيرة: قسّمها إلى وظائف أقصر؛ تقليل دقة المعاينة وحجم الجلب المسبق.
  • انحراف الشرح في التتبع: أضف إطارات رئيسية بشكل متكرر، خاصة أثناء الحركة السريعة أو الانسدادات.
  • تصنيفات مربكة: أعد هيكلة علم الوجود؛ انقل التفاصيل إلى السمات؛ قدم أمثلة بصرية.
  • عدم تطابق التصدير: تحقق مرة أخرى من الحقول المتوقعة لمكتبة التدريب المستهدفة (على سبيل المثال، تعيين فهرس فئة YOLO، ومعرفات فئة COCO).

التكامل في خط أنابيب ML الخاص بك

  • المعالجة المسبقة: قم بتغيير حجم/تطبيع الصور قبل التحميل لتسريع الشرح.
  • التشغيل الآلي: ضع علامة مسبقة بنموذج سريع، وقم بالتصحيح في CVAT، ثم كرر.
  • CI للبيانات: تعامل مع الملصقات مثل التعليمات البرمجية - عمليات التصدير ذات الإصدارات، والمجاميع الاختبارية، وسجلات التغيير.
  • التخزين: استخدم مجموعات السحابة وسياسات دورة الحياة لمجموعات بيانات الفيديو الكبيرة.
جدير بالذكر: إذا كنت تستخدم مساعدين الذكاء الاصطناعي لتوثيق الإرشادات أو إنشاء تصنيفات الملصقات أو تلخيص ملاحظات المراجعين، فيمكن لأداة مثل أن تساعدك في إنشاء تعليمات واضحة وقوائم مراجعة متسقة. يمكنك التقاط القرارات وتوليد الأمثلة وتحويلها إلى كتيبات قابلة للمشاركة لفريقك. راجع للمزيد.

خطة بداية لمدة 30 دقيقة

  • 5 دقائق: قم بتثبيت وتشغيل CVAT محليًا.
  • 5 دقائق: قم بإنشاء مشروع بـ 3-5 تصنيفات و 2 سمات.
  • 5 دقائق: قم بإنشاء مهمة بـ 100 صورة.
  • 10 دقائق: قم بشرح 20 صورة باستخدام المربعات؛ تعلم الاختصارات.
  • 5 دقائق: قم بالتصدير إلى YOLO وقم بتشغيل تمريرة تدريب سريعة.
في النهاية، سيكون لديك حلقة كاملة من الصور الأولية إلى مجموعة بيانات قابلة للتدريب.

أين تتعلم المزيد

  • أساسيات CVAT والبرامج التعليمية من الفريق.
  • تفاصيل التثبيت والتكوين.
  • صورة الخادم ومراجع الحاوية.
  • ابحث عن الشرح التفاعلي/الذاتي للفيديو لإلهام سير عمل أسرع.

النقاط الرئيسية

  • حدد الملصقات الخاصة بك أولاً - تصميم المخطط يمنع الألم في المراحل اللاحقة.
  • استخدم الاستيفاء والتتبع للفيديو؛ الإطار الرئيسي بذكاء.
  • يعمل الشرح التلقائي على تسريع العمل؛ تضمن المراجعة البشرية الجودة.
  • قم بالتصدير بالتنسيق الذي يتوقعه كود التدريب الخاص بك؛ قم بإصدار كل شيء.
  • ابدأ صغيرًا، وكرر بسرعة، وقم بالتوسع بإرشادات واضحة.

أسئلة متكررة


مقالات حديثة
كيفية إتقان ChatPDF: الحصول على رؤى أسرع من المستندات الكثيفة

كيفية إتقان ChatPDF: الحصول على رؤى أسرع من المستندات الكثيفة

أفضل بديل لـ X Auto-Translation لترجمة سريعة ودقيقة للوثائق

أفضل بديل لـ X Auto-Translation لترجمة سريعة ودقيقة للوثائق

هل ترجمة سامسونج بالذكاء الاصطناعي غير متوفرة في إيران؟ حلول عملية

هل ترجمة سامسونج بالذكاء الاصطناعي غير متوفرة في إيران؟ حلول عملية

أدوات الترجمة الفارسية: دليل عملي للعمل بسرعة ودقة

أدوات الترجمة الفارسية: دليل عملي للعمل بسرعة ودقة

أفضل بديل لـ Grok للبحث العميق والمستند إلى المراجع

أفضل بديل لـ Grok للبحث العميق والمستند إلى المراجع

أهم 15 ميزة في مولد الصور بالذكاء الاصطناعي ستستخدمها فعليًا

أهم 15 ميزة في مولد الصور بالذكاء الاصطناعي ستستخدمها فعليًا