CVAT Nasıl Kullanılır: Hızlı ve Doğru Açıklamalar İçin Kullanıcı Dostu, Adım Adım Rehber
Eğer daha önce bir bilgisayarlı görü modeli eğitme girişiminde bulunduysanız, muhtemelen herkesin karşılaştığı aynı engelle karşılaşmışsınızdır: verilerin harika etiketlere ihtiyacı var. CVAT (Computer Vision Annotation Tool - Bilgisayarlı Görü Açıklama Aracı), yüksek kaliteli görüntü ve video açıklamaları oluşturmak için en popüler platformlardan biridir—açık kaynak, güçlü ve yan projelerden üretim hatlarına kadar ölçeklenebilir şekilde inşa edilmiştir. Bu nasıl yapılır kılavuzu, kurulum, ayarlar, etiketleme iş akışları, otomasyon yardımcıları, kalite kontrol ve dışa aktarma konularında size yol gösterir—böylece kaosa girmeden sıfırdan temiz veri kümelerine ulaşabilirsiniz.
Örnekler, kısayollar ve kaçınılması gereken tuzaklarla pratik ve doğrudan olacağız.
CVAT Nedir ve Neden Kullanılır?
CVAT, görüntüleri ve videoları açıklamak için web tabanlı bir araçtır. Nesne tespiti, segmentasyon, sınıflandırma ve takibi destekler. Yerel olarak veya bir sunucuda çalıştırabilir, takım arkadaşlarınızı davet edebilir, projeleri/görevleri yönetebilir ve etiketleri yaygın formatlara (COCO, YOLO, VOC gibi) aktarabilirsiniz. Tekrarlanabilir, işbirlikçi ve doğru etiketlemeye ihtiyacınız varsa—CVAT bunu sağlar.
- Tarayıcı tabanlı, ekipler arasında çalışır
- Enterpolasyon/izleme ile görüntüleri ve uzun videoları işler
- Esnek etiket şeması ve öznitelikleri
- Popüler eğitim çerçeveleri için birden çok dışa aktarma formatı
Resmi bir oryantasyon için, CVAT ekibinin “Başlangıç Kılavuzu” faydalı bir başlangıçtır.
Hızlı Kurulum: CVAT'ı Çalıştırmanın En Hızlı Yolu
CVAT'ın tipik kurulum yolu Docker'ı kullanır. Sunucuyu, veritabanını ve bağımlılıkları bir araya getirir, böylece dakikalar içinde başlayabilirsiniz.
- Docker ve Docker Compose (veya Docker Desktop)
- Önerilen: modern CPU, yeterli RAM (video yoğun görevler için 8–16GB+)
- CVAT deposunu klonlayın ve compose script'ini çalıştırın veya doğrudan container imajlarını kullanın. Resmi belgeler, kesin komutları ve ortam değişkenlerini sağlar. Ayrıca Docker Hub'da yayınlanmış bir sunucu imajı da bulunmaktadır.
- Kullanıcı Arayüzüne Erişin
- Container'lar çalıştıktan sonra, tarayıcınızı açın (genellikle {http://localhost:8080}), bir yönetici/kullanıcı oluşturun ve oturum açın.
İpucu: Verileri bağlı birimlerde saklamak, görevlerinizin, projelerinizin ve açıklamalarınızın güncellemeler boyunca kalıcı olmasını sağlar.
Bir Bakışta CVAT İş Akışı
Üç katman halinde düşünün: Proje → Görev → İş.
- Proje: İlgili görevler için bir koleksiyon (örneğin, “Perakende Rafı Tespiti 2025”). Genel etiketleri tanımlar.
- Görev: Tek bir etiketleme birimi (örneğin, 1.000 resimlik bir toplu iş veya 2 saatlik bir video).
- İş: Bir görevin bölünmüş hali (örneğin, uzun bir videonun etiketleyicilere atanan dilimleri).
Bu yapı, büyük veri kümelerini yönetmenize, işi takım arkadaşlarınıza atamanıza ve etiket tanımlarını tutarlı tutmanıza olanak tanır.
Adım 1: Bir Proje ve Etiketler Oluşturun (Şema Tasarımı)
Veri yüklemeden önce, ontolojinizi tanımlayın—neyi ve nasıl etiketlediğinizi.
- Sınıflar: örneğin, , , , .
- Öznitelikler: örneğin, , , .
- Renk kodlaması: görsel netliği artırır.
En iyi uygulamalar:
- Sınıf adlarını kısa, tutarlı ve açıklayıcı tutun.
- Çizim gerektirmeyen meta veriler için öznitelikleri kullanın (örneğin, “kalabalık_mı”).
- Kasıtlı olarak hiyerarşik olmadıkça çakışan sınıflardan kaçının (örneğin, ).
Etiketleri Proje düzeyinde tanımlayabilirsiniz, böylece ilgili tüm Görevler bunları devralır.
Adım 2: Bir Görev Oluşturun ve Veri Yükleyin
Kontrol panelinden:
- Yeni → Görev → Görevinizi Adlandırın.
- Proje seçin (isteğe bağlı ancak önerilir).
- Veri yükleyin: resimleri sürükleyip bırakın, bir dizine işaret edin veya kurulumunuza bağlı olarak bulut depolama bağlantıları sağlayın (örneğin, S3, Azure Blob).
- Etiketlerin doğru olduğunu doğrulayın (devralınmış veya göreve özel) ve Oluştur'a basın.
Uzun videolar için, her işin etiketleyiciler için yönetilebilir ve duyarlı kalmasını sağlamak için parçalara ayırmayı veya otomatik iş bölmeyi etkinleştirmeyi düşünün.
Adım 3: Doğru Açıklama Modunu Seçin
CVAT birden çok açıklama aracını destekler:
- Sınırlayıcı kutular: nesne tespiti için en hızlı.
- Çokgenler/Çoklu Çizgiler: örnek/semantik segmentasyon, yol şeritleri, çatlaklar için.
- Küboidler: 2D görüntülerde 3D benzeri perspektif kutuları için.
- Noktalar: anahtar noktalar veya işaret noktaları (pozlar, yüz işaret noktaları).
- Etiketler: görüntü düzeyi etiketleri (örneğin, “gündüz”).
Klavye kısayolları işleri önemli ölçüde hızlandırır:
- Şekilleri kısıtlamak (araca bağlı olarak) ve hizalamak için Shift/Alt tuşlarını basılı tutun.
İpucu: Etiket listesini küçük ve odaklı tutun. Çok fazla sınıf, etiketleyicileri yavaşlatır ve hata oranlarını artırır.
Adım 4: Video Açıklaması—Enterpolasyon ve İzleme
Videolar için, her bir kareyi açıklamayın. Bunun yerine:
- Bir anahtar kare üzerinde bir kutu veya çokgen oluşturun.
- Enterpolasyonu/izlemeyi etkinleştirin: CVAT şekilleri ileriye doğru yayabilir, ardından yeni anahtar karelerde gerektiği gibi düzeltirsiniz.
- Nesneler kapandığında veya yeniden göründüğünde parçaları bölün veya birleştirin.
- Dizileri temiz tutmak için “dışarıda” veya “örtülü” gibi durumları işaretleyin.
Bu, zamansal tutarlılığı korurken süreyi önemli ölçüde azaltır. Araştırmalar ve topluluk en iyi uygulamaları ayrıca video etiketlemeyi hızlandırmak için interaktif/kendi kendine açıklama yardımını da önermektedir.
Adım 5: Otomatik Açıklama ve Destekli Araçları Kullanın
CVAT, işi hızlandırmak için destekli etiketlemeyi destekler. Dağıtımınıza bağlı olarak şunları yapabilirsiniz:
- Kutu/maske önermek için yerleşik model destekli özellikleri kullanın.
- Kareleri önceden etiketlemek için sunucu tarafı modellerini çalıştırın, ardından düzeltin.
- Boşlukları doldurmak için enterpolasyonu uygulayın.
Küçük, yüksek kaliteli bir başlangıç kümesiyle başlayın, hızlı bir model eğitin ve kalan verileri önceden etiketlemek için kullanın. Yinelemeli olarak düzeltin ve yeniden eğitin.
Not: Ayrıntılar, ortamınızda hangi modelleri etkinleştirdiğinize bağlıdır. Resmi belgeler ve topluluk eğitimleri, modelleri CVAT'a nasıl bağlayacağınızı ve kullanıcı arayüzünde Otomatik Açıklamayı nasıl etkinleştireceğinizi gösterir.
Adım 6: Roller ve İncelemelerle İşbirliği Yapın
CVAT çok kullanıcılıdır. Tipik roller şunları içerir:
- Yönetici: sunucuyu ve kullanıcıları yönetir
- Proje yöneticisi: etiketleri tanımlar, görevler/işler oluşturur, etiketleyiciler atar
- Etiketleyici: etiketler oluşturur ve düzenler
- Gözden Geçiren/QA: işi kontrol eder, düzeltme ister
Açık yönergeler belirleyin: doğru/yanlış açıklamaların örnekleri, öznitelik tanımları ve uç durumlar (örneğin, “yansımaları etiketleyin mi?”). Kaliteyi artırmak için inceleme araçlarını—yorumlar, sorun işaretleri ve durum değişiklikleri—kullanın.
Adım 7: Güvenebileceğiniz Kalite Kontrol
Birkaç pratik KK stratejisi:
- Altın görevler: etiketleyicileri kıyaslamak için birkaç uzman tarafından etiketlenmiş görüntü ekleyin.
- Çakışma: aynı işi iki etiketleyiciye atayın; IoU ve anlaşmayı karşılaştırın.
- Yerinde kontroller: gözden geçirenler her işin bir yüzdesini denetler.
- Metrikler: yönergeleri iyileştirmek için model eğitimi sırasında sınıf başına karışıklık kalıplarını izleyin.
Zaman içindeki tutarlılık, tek seferlik mükemmel etiketlerden daha önemlidir. Kararları belgeleyin ve uç durumları keşfettikçe etiket kılavuzunu güncelleyin.
Adım 8: Kaydet, Sürümle ve Dışa Aktar
Sık sık kaydedin (CVAT ayrıca otomatik olarak kaydeder). Hazır olduğunuzda:
- Dışa aktarma formatları: COCO, YOLO, Pascal VOC ve daha fazlası. Eğitim kodunuzun beklediği formatı seçin.
- Kare aralıkları: belirli segmentleri veya tüm görevi dışa aktarın.
- Filtreler: gerekirse yalnızca belirli etiketleri veya öznitelikleri dışa aktarın.
Güncel dışa aktarma seçenekleri ve parametreleri için resmi belgelere bakın. Kurulum ve sunucu imajı ayrıntıları için belgeler ve Docker Hub sayfaları yetkili referanslardır.
Pratik Senaryolar ve İpuçları
Senaryo 1: Perakende Raflarında Nesne Tespiti
- Hız için kutuları kullanın; gibi öznitelikler ekleyin.
- Hafif bir eğitim hattı için YOLO'ya aktarın.
Senaryo 2: Yol Şeridi Segmentasyonu
- Çoklu çizgiler veya çokgenler kullanın.
- Kareler arasında enterpolasyon yapın; dönüşlerde düzeltin.
- Çerçevenize bağlı olarak COCO panoptik/segmentasyona aktarın.
Senaryo 3: Güvenlik Ekipmanı Uyumluluğu
- Video boyunca , , 'i takip edin.
- İzleme + öznitelikleri kullanın ().
- Giriş/çıkış noktalarında örtülmeleri dikkatlice inceleyin.
Profesyonel ipuçları:
- Kullanıcı arayüzünü duyarlı tutmak için görevleri birkaç bin görüntünün altında tutun veya uzun videoları bölün.
- Performansı ve netliği dengelemek için görüntü boyutlarını normalleştirin veya videoları sıkıştırın.
- Veri kümelerini sürümleyin—net bir etiketle (örneğin, ) dışa aktarın ve sonlandırıldıktan sonra görevleri kilitleyin.
Yaygın Sorunları Giderme
- Büyük videolarda yavaş kullanıcı arayüzü: daha kısa işlere bölün; önizleme çözünürlüğünü ve ön getirme boyutunu azaltın.
- İzlemede açıklama kayması: özellikle hızlı hareket veya örtülmeler sırasında daha sık anahtar kareler ekleyin.
- Kafa karıştırıcı etiketler: ontolojiyi yeniden düzenleyin; ayrıntıları özniteliklere taşıyın; görsel örnekler sağlayın.
- Dışa aktarma uyuşmazlığı: hedef eğitim kitaplığınızın beklenen alanlarını iki kez kontrol edin (örneğin, YOLO sınıf dizini eşlemesi, COCO kategori kimlikleri).
ML Hattınıza Entegre Etme
- Ön işleme: Açıklamayı hızlandırmak için görüntüleri CVAT'a yüklemeden önce yeniden boyutlandırın/normalleştirin.
- Otomasyon: Hızlı bir modelle önceden etiketleyin, CVAT'ta düzeltin, ardından yineleyin.
- Veriler için CI: Etiketleri kod gibi ele alın—sürümlenmiş dışa aktarmalar, sağlama toplamları ve değişiklik günlükleri.
- Depolama: Büyük video veri kümeleri için bulut depolama alanlarını ve yaşam döngüsü ilkelerini kullanın.
Belirtmekte fayda var: Yönergeleri belgelemek, etiket taksonomileri oluşturmak veya gözden geçiren geri bildirimini özetlemek için yapay zeka asistanlarını kullanırsanız, gibi bir araç, net talimatlar ve tutarlı inceleme kontrol listeleri oluşturmanıza yardımcı olabilir. Kararları yakalayabilir, örnekler oluşturabilir ve bunları ekibiniz için paylaşılabilir oyun kitaplarına dönüştürebilirsiniz. Daha fazlası için 'ye bakın.
30 Dakikalık Başlangıç Planı
- 5 dakika: CVAT'ı yerel olarak kurun ve başlatın.
- 5 dakika: 3–5 etiket ve 2 öznitelikle bir Proje oluşturun.
- 5 dakika: 100 görüntüyle bir Görev oluşturun.
- 10 dakika: Kutuları kullanarak 20 görüntüyü açıklayın; kısayolları öğrenin.
- 5 dakika: YOLO'ya aktarın ve hızlı bir eğitim geçişi yapın.
Sonunda, ham görüntülerden eğitilebilir bir veri kümesine kadar eksiksiz bir döngünüz olacak.
Daha Fazla Bilgi Nereden Edinilir
- Ekipten CVAT temelleri ve eğitimleri.
- Kurulum ve yapılandırma ayrıntıları.
- Sunucu imajı ve container referansları.
- Daha hızlı iş akışlarına ilham vermek için video için interaktif/kendi kendine açıklama üzerine araştırma.
Temel Çıkarımlar
- Önce etiketlerinizi tanımlayın—şema tasarımı, sonraki sorunları önler.
- Video için enterpolasyon ve izleme kullanın; akıllıca anahtar kareler oluşturun.
- Otomatik açıklama işi hızlandırır; insan incelemesi kaliteyi sağlar.
- Eğitim kodunuzun beklediği biçimde dışa aktarın; her şeyi sürümleyin.
- Küçük başlayın, hızlı yineleyin ve net yönergelerle ölçeklendirin.
SSS