Qwen3‑Omni'ye Ses ve Videolara Otomatik Olarak Altyazı Eklemek İçin Nasıl Prompt Verilir
Bir ürün demosunu veya web semineri tekrarını yayınlamak için acele edip de altyazıların eksik olduğunu veya daha da kötüsü, yanlış olduğunu fark ettiyseniz, yalnız değilsiniz. İyi altyazılar sadece bir erişilebilirlik kutucuğu değildir; aynı zamanda keşfedilebilirlik yakıtı, uyumluluk sigortası ve etkileşim güçlendiricidir. İyi haber şu ki, doğru yönlendirme stratejisiyle, Qwen3‑Omni ses ve videolara güvenilir bir doğruluk ve hızla otomatik olarak altyazı ekleyebilir.
Bu pratik, çözüm odaklı kılavuz, otomatik altyazılar için Qwen3‑Omni'ye nasıl prompt vereceğinizi, bunları nasıl çevireceğinizi, farklı platformlar için nasıl biçimlendireceğinizi ve iş akışınızı nasıl ölçeklendireceğinizi tam olarak gösterir. Kopyala-yapıştır prompt şablonları, zorlu sesler için ipuçları ve sizi beladan uzak tutan kalite kontrol adımları elde edeceksiniz.
Öğrenecekleriniz
- Qwen3‑Omni'ye ses ve video dosyalarına otomatik olarak altyazı eklemesi için nasıl prompt verilir
- Transkriptler, altyazılar (SRT/VTT) ve çeviriler için prompt şablonları
- Gürültülü ses, çoklu konuşmacı ve jargon için doğruluk artırıcılar
- Bir içerik kitaplığında ölçeklendirmek için toplu ve API iş akışları
- Kalite kontrol kontrol listeleri ve zamandan tasarruf sağlayan otomasyon ipuçları
Sonunda, altyazısız medyayı SEO dostu, erişilebilir varlıklara dönüştüren tekrarlanabilir bir oyun kitabına sahip olacaksınız.
Otomatik Altyazı için Neden Qwen3‑Omni?
Qwen3‑Omni, metin talimatlarının yanı sıra ses ve video bağlamını anlamak için tasarlanmış çok modlu bir modeldir. Bu, onu talimat odaklı altyazı iş akışları için çok uygun hale getirir:
- Talimat takibi: Çıktı biçimini (SRT, VTT, düz metin veya JSON), konuşmacı etiketlerini, zaman damgalarını ve stili belirleyebilirsiniz.
- Bağlamsal kavrayış: Bir sözlük veya örnekler sağladığınızda alan terimlerini ele alır.
- Çok dilli: Küresel kitleler için kullanışlıdır; kaynak dilde altyazı ekleyin, ardından zamanlamayı koruyarak çevirin.
Amacınız net, tutarlı biçimlendirmeyle güvenilir bir şekilde altyazı eklemekse, Qwen3‑Omni'ye kasıtlı olarak prompt vermek, iyi ve harika sonuçlar arasındaki farktır.
Temel Prompt: Hızlı Temiz Altyazılar Alın
Tek konuşmacılı bir kaynaktan hızlı, okunabilir altyazılar istediğinizde bu temel prompt'u kullanın.
Tek Konuşmacı, Temiz Ses (Yalnızca Transkript)
Sistem: Siz uzman bir transkripsiyon uzmanı ve altyazı biçimlendiricisiniz.
Kullanıcı: Ekli ses/videoyu yazıya dökün. Temiz bir transkripti paragraf şeklinde çıktı olarak verin.
- Dil: Konuşmacının diliyle eşleşsin.
- Anlamı koruyun, bariz yanlış anlamaları düzeltin.
- İçerik uydurmayın.
- Her 30 saniyede bir köşeli parantez içinde [00:30], [01:00] gibi zaman damgaları ekleyin.
- Konuşmacı etiketlerine gerek yok.
Yapılandırılmış Altyazılar (SRT)
Sistem: Siz web videosu için profesyonel bir altyazı uzmanısınız.
Kullanıcı: Ekli medya için SRT altyazıları oluşturun.
- Mümkün olduğunca satırları 42 karakterin altında tutun.
- Altyazı başına 1–2 satır.
- Sıra numaraları ekleyin.
- Başlangıç → bitiş zaman damgalarını SS:DD:SS,mmm şeklinde ekleyin
- Doğal duraklamalarla senkronize edin.
- Sözler mevcut değilse müzik notaları eklemeyin.
- Stil: özlü, okunabilir, gereksiz kelimeler yok.
Web Altyazıları (VTT)
Sistem: Siz bir altyazı uzmanısınız.
Kullanıcı: Ekli medya için WebVTT altyazıları çıktısı verin.
- 'WEBVTT' başlığını ekleyin.
- '.' milisaniye ayırıcılarıyla işaret zamanlamaları kullanın.
- İşaret başına 1–2 satır, satır başına maksimum 42 karakter tutun.
- Aşırı segmentasyondan kaçının; cümle sınırlarına hizalayın.
Profesyonel ipucu: Qwen3‑Omni'ye ses ve videolara otomatik olarak altyazı eklemesi için prompt verdiğinizde, biçim, zamanlama kuralları ve özlük konusunda açık olun. Modeller, kısıtlamaları en iyi ölçülebilir olduklarında takip eder.
Gerçek Dünya Karmaşıklığını Ele Alma
Tüm sesler stüdyo temizliğinde değildir. İşte promptlarınızı karmaşık şeyler için nasıl uyarlayacağınız.
Çoklu Konuşmacılar
Sistem: Siz mahkeme düzeyinde bir transkripsiyon uzmanısınız.
Kullanıcı: Konuşmacı etiketleriyle yazıya dökün.
- Konuşmacıları Konuşmacı 1, Konuşmacı 2 vb. olarak tanımlayın ve etiketleyin.
- Konuşmacı değişikliğinde yeni satır.
- Her konuşmacı dönüşünde [SS:DD:SS] şeklinde zaman damgaları ekleyin.
- Emin değilseniz, ses değişikliklerinden çıkarım yapın; etiketsiz bırakmayın.
- Örnek format:
[00:00] Konuşmacı 1: Herkese hoş geldiniz...
[00:07] Konuşmacı 2: Teşekkürler! Bugün şunları ele alacağız...
Gürültülü Ses veya Çapraz Konuşma
Sistem: Siz bir yayın altyazı editörüsünüz.
Kullanıcı: Gürültüye duyarlı düzenlemelerle SRT altyazıları oluşturun.
- Gerekli olmadıkça dolgu kelimelerini (ıı, eee, gibi) kaldırın.
- Bir kelime belirsizse, . ile parantez içine alın.
- Çakışan konuşma için, baskın sesi seçin ve diğerini parantez içinde özetleyin.
- Örnek: [çakışan] Tekrar eder misiniz?
Teknik Jargon ve İsimler
Qwen3‑Omni'nin alan terimlerine kilitlenmesi için mini bir sözlük sağlayın.
Sistem: Siz teknik bir altyazı uzmanısınız.
Kullanıcı: Doğru terimler/yazımlar için aşağıdaki sözlüğü kullanın:
- Kubernetes (K8s)
- Istio
- Postgres (altyazılarda PostgreSQL değil)
- Gecikme SLO'su
Ardından bu kesin yazımlarla SRT altyazıları üretin.
Sosyal Klipler İçin Hız Ayarı
Sistem: TikTok/Reels için kısa biçimli bir video altyazıcısısınız.
Kullanıcı: Etkileyici, kalıcı altyazılar çıktısı verin.
- İşaret başına maksimum 1 satır, ≤ 24 karakter.
- Anahtar kelimeleri TAMAMI BÜYÜK HARFLERLE vurgulayın.
- İşaretleri ekranda 0,8–1,6 saniye tutun.
- Soru değilse sonunda noktalama işareti yok.
- Hareketli grafikler için işaret zamanlarıyla birlikte bir JSON sidecar ekleyin:
{
"işaretler": [{"t": 0,8, "d": 1,2, "metin": "KAYDIRMAYI DURDUR"}, ...]
}
Uçtan Uca İş Akışı: Ham Medyadan Yayınlanmış Altyazılara
YouTube, LMS, web seminerleri veya şirket içi eğitim için tutarlı çıktıya ihtiyacınız olduğunda bu alanda test edilmiş sırayı kullanın.
- Tutarlı bir şekilde adlandırın:
proje-bölüm-dil-kaynak.uzantı (örneğin, lansman-demo-tr-ses.mp3).
- Daha hızlı işleme için medya dosyalarını toplu başına 2 saatin altında tutun.
- Yükleme ve işlemeyi hızlandırmak için uzun videolar için sesi çıkarın.
- Bağlamı ve terminolojiyi oluşturmak için bir paragraf transkripti için prompt verin.
- Doğruluk <%95 ise, bir sözlük sağlayın ve yeniden prompt verin.
- Doğrulanmış transkriptten, tek seferde hem SRT hem de VTT'yi isteyin:
Kullanıcı: Onaylı transkripti (aşağıya yapıştırılmış) kullanarak çıktı verin:
A) İşaret başına 1–2 satır, ≤ 42 karakter/satır içeren SRT
B) Aynı segmentasyona sahip WebVTT
Zamanlama hizalaması ve tutarlı noktalama sağlayın.
- Qwen3‑Omni'den zaman damgalarını korurken altyazıları çevirmesini isteyin.
- Bölgeye uygun varyantlar kullanın: en‑US, en‑GB, es‑MX, pt‑BR, fr‑FR vb.
Kullanıcı: SRT'yi İspanyolca'ya (es‑MX) işaret zamanlamalarını koruyarak çevirin. İsimleri ve marka terimlerini İngilizce tutun. Satır uzunluklarını koruyun.
- Kalite kontrol kontrol listesi
- Teknik terimleri ve sayıları yerinde kontrol edin.
- Zaman damgalarının çakışmadığını doğrulayın; işaretler 1,0–6,0 saniye arasında kalın.
- Hiçbir işaretin satır başına ~42 karakteri aşmadığından emin olun.
- Okunabilirliği kontrol edin: cümle durumu, kısaltmalar dışında tümü büyük harf yok.
- Bir altyazı düzenleyicisiyle (örneğin, Aegisub) doğrulayın veya özel bir YouTube testi yükleyin.
- SRT/VTT'yi barındırma platformunuza ekleyin.
- Kaynak medyayı, transkripti ve altyazıları gelecekteki düzenlemeler için birlikte saklayın.
Bugün Kopyalayabileceğiniz Prompt Şablonları
Ses ve videolara minimum düzenlemeyle otomatik olarak altyazı eklemek için kullanıma hazır bu snippet'leri kullanın.
Evrensel SRT Altyazı Promptu
Sistem: Siz kıdemli bir altyazı editörüsünüz.
Kullanıcı: Ekli medya için SRT altyazıları oluşturun.
Kurallar:
- 1–2 satır/işaret, ≤ 42 karakter/satır
- İşaretler 1,2–4,0 saniye her biri
- Cümle sınırları tercih edilir; uzun cümleleri doğal duraklamalarda bölün
- Bariz dolgu maddelerini düzeltin ancak tonu koruyun
- Örnek format:
1
00:00:00,000 --> 00:00:02,500
Lansmana hoş geldiniz.
2
00:00:02,500 --> 00:00:05,100
Bugün size yol haritasını göstereceğiz.
Transkript + Konuşmacı Etiketleri
Sistem: Siz bir röportaj transkripsiyoncusunuz.
Kullanıcı: Konuşmacı değişikliğinde zaman damgalarıyla birlikte etiketli bir transkript oluşturun.
Biçim:
[SS:DD:SS] Konuşmacı X: metin...
Yönergeler:
- Cümleleri bozulmadan tutun; cümle ortasında satır sonu yok.
- Kısaltmaları yalnızca belirsiz olduğunda genişletin.
- [anlaşılmaz] etiketini yalnızca gerekliyse etiketleyin.
Zamanlamayı Korurken Çevir
Sistem: Siz bir yerelleştirme editörüsünüz.
Kullanıcı: Bu SRT'yi Fransızca'ya (fr‑FR) çevirin. Zaman damgalarını koruyun. Ürün adlarını İngilizce tutun. Satır sonlarını ve uzunluğunu koruyun. Bir satır çeviriden sonra 42 karakteri aşarsa, doğal bir duraklamada bölün.
Uyumluluk Dostu Altyazılar (WCAG/ADA)
Sistem: Siz bir erişilebilirlik altyazı uzmanısınız.
Kullanıcı: Erişilebilirlik işaretleriyle SRT altyazıları üretin.
- İlgili olduğunda [müzik], [kahkaha], [alkış] ekleyin.
- Anlamı değiştirirse [fısıltı], [bağırış] ekleyin.
- Anlamayı etkileyen temel konuşma dışı sesleri açıklayın.
- Açıklamaları kısa ve parantez içinde tutun.
Daha Akıllı Promptlarla Doğruluğu Artırma
- Bir sözlük besleyin: Qwen3‑Omni'ye kanonik yazımlarla 10–30 alan terimi verin. Bu, ürün adlarının ve kısaltmaların yanlış transkripsiyonlarını önemli ölçüde azaltır.
- Hızı belirtin: Stroboskopik benzeri altyazılardan kaçınmak için modele minimum ve maksimum işaret sürelerinizi söyleyin.
- Bölümlere göre segmentlere ayırın: Uzun videolar için, her bölüm için prompt verin ve SRT'leri birleştirin; bağlamı sıkı tutar ve hataları azaltır.
- Kısa bir stil kılavuzu sağlayın: Noktalama, büyük/küçük harf kullanımı, yasak kelimeler ("ıı", "eee") ve yeniden ifade edip etmeme.
- Bir referans transkripti kullanın: Slaytlarınız veya bir komut dosyanız varsa, ekleyin. Modelden belirsizlikleri referansı kullanarak çözmesini isteyin.
Örnek: 45 Dakikalık Bir Web Seminerini 20 Dakikada Altyazılara Dönüştürme
- MP4'ü yükleyin ve her 30 saniyede bir zaman damgalarıyla birlikte bir paragraf transkripti isteyin.
- Desteden 12 öğelik bir sözlük sağlayın (ürün adları, metrikler, kısaltmalar).
- 1,4–3,5 sn işaretler, maksimum 42 karakter/satır, cümle hizalı SRT isteyin.
- Zamanlamayı koruyarak Japonca ve İspanyolca'ya çevirin.
- İlk 5 dakikayı ve rastgele iki 60 saniyelik bölümü kalite kontrol edin.
- İngilizce SRT + VTT'yi yayınlayın; çevrilmiş SRT'leri isteğe bağlı parçalar olarak tutun.
Kaydedilen süre: manuel altyazıya kıyasla web semineri başına ~2–3 saat.
API ve Toplu İşleme Desenleri
Sohbet arayüzünü beğenseniz bile, toplu altyazı gerçek üretimi açığa çıkarır.
JSON Öncelikli Sözleşme
Otomasyon için Qwen3‑Omni'den altyazıların yanında bir JSON çıktısı vermesini isteyin.
Sistem: Siz bir altyazı hattı asistanısınız.
Kullanıcı: Ekli medya için şunu döndürün:
1) SRT altyazıları
2) Şu alanlara sahip JSON indeksi:
{
"süre_sn": sayı,
"dil": "en-US",
"dakikadaki_kelime_sayısı": sayı,
"işaret_sayısı": sayı,
"ortalama_işaret_uzunluğu_karakter": sayı
}
Uzun Medyayı Parçalara Ayırma
> 60 dakikalık videolar için, sessizlikte veya bölüm işaretlerinde bölün.
- Her bir parçayı aynı prompt ile bağımsız olarak işleyin.
- Parçanın başlangıç ofsetini ekleyerek zaman damgalarını yeniden birleştirin.
- Noktalama ve büyük/küçük harf kullanımını normalleştirmek için son bir geçiş yapın.
Minimum Sözde Kod
from pathlib import Path
media_files = sorted(Path("./media").glob("*.mp3"))
for f in media_files:
# 1) f'yi SRT promptu ile Qwen3-Omni altyazı uç noktanıza gönderin
srt = caption_with_qwen(f, prompt="<evrensel_srt_prompt>")
# 2) İsteğe bağlı: çevir
srt_es = translate_captions(srt, lang="es-MX")
# 3) Dosyaları doğrulayın ve yazın
validate_srt(srt)
Path("./out").mkdir(exist_ok=True)
Path(f"./out/{f.stem}.srt").write_text(srt, encoding="utf-8")
Path(f"./out/{f.stem}.es-MX.srt").write_text(srt_es, encoding="utf-8")
Kalite Kontrol: 3 Dakikalık Bir Yerinde Kontrol Rutini
- Zamanlama: 3–5 rastgele işaretin 1–6 saniye içinde kaldığını ve konuşmayla eşleştiğini doğrulayın.
- Okunabilirlik: Satırlar ≤ 42 karakter, cümle durumu, gerekli olmadıkça cümle ortasında satır sonu yok.
- Doğruluk: İsimler, sayılar, URL'ler ve ürün terimleri kesin; herhangi bir yanlış anlaşılmayı düzeltin.
- Erişilebilirlik: Anlamlı olduğunda konuşma dışı ses işaretleri mevcut.
Bir yerinde kontrolde 1–2'den fazla sorun bulursanız, bir sözlük ve stil kılavuzu ile yeniden prompt verin, ardından yeniden oluşturun.
Sorun Giderme: Altyazılar Yana Kaydığında
- Titrek zamanlama: Açık minimum/maksimum işaret süreleri ekleyin ve cümle sınırlarına hizalama isteyin.
- Garip noktalama: Bir sayfalık bir stil kuralı sağlayın (örneğin, üç nokta yok; em tirelerini seyrek kullanın).
- Konuşmacı karışıklığı: Doğru etiketlerle açıklanmış kısa bir segment sağlayın; modele etiketlemeyi taklit etmesini söyleyin.
- Arka plan müziği baskın: Gürültüye duyarlı transkripsiyon isteyin ve anlamlı olmadıkça konuşma dışı seslere öncelik vermemesini belirtin.
- Platform SRT'yi reddediyor: SRT'de milisaniyeler için virgüllerin (
00:00:01,000) olduğundan ve işaret indekslerinin boşluksuz sıralı olduğundan emin olun.
Her Şeyi Bir Araya Getirme: Yeniden Kullanılabilir Bir Ana Prompt
Öngörülebilir, platforma hazır sonuçlara ihtiyacınız olduğunda bu ana promptu kullanın.
Sistem: Siz yayın kalitesinde altyazılar üreten kıdemli bir altyazı editörüsünüz.
Kullanıcı: Ekli medyaya altyazı ekleyin ve üç çıktı döndürün:
A) Temiz transkript (paragraflar, her 30 saniyede bir zaman damgaları)
B) SRT (1–2 satır/işaret, ≤ 42 karakter/satır, 1,2–4,0 sn/işaret, cümle hizalı)
C) WebVTT (SRT segmentasyonunu yansıtın)
Yönergeler:
- Dil: kaynağı eşleştirin.
- Bariz akıcılık bozukluklarını düzeltin; anlamı yeniden ifade etmeyin.
- Sayılar, isimler ve marka terimleri kesin olmalıdır; emin değilseniz, ile işaretleyin.
- Emoji yok, ek yorum yok.
Bu arada: Sider.ai ile iş akışını hızlandırma
Haftada birden fazla varlığı çeviriyorsanız, tarayıcıdaki bir kenar çubuğu asistanı, araçlar arasında geçiş yaparak zamandan tasarruf sağlar. Belirtmekte fayda var: Sider.ai altyazı iş akışınızın yanında bulunabilir. Oynatmayı izlerken transkriptleri yapıştırabilir, prompt varyantları oluşturabilir, sözlükler taslaklayabilir ve hatta toplu promptları tetikleyebilirsiniz. Özellikle SRT/VTT stillerinde hızlı bir şekilde yineleme yapmak veya tutarlı biçimlendirmeye sahip çevrilmiş altyazı kümeleri oluşturmak için kullanışlıdır. Temel Çıkarımlar
- Qwen3‑Omni'ye ses ve videolara otomatik olarak altyazı eklemesi için prompt vermek için biçim, zamanlama, satır uzunluğu ve stil konusunda açık olun.
- Her zaman bir transkriptle başlayın, ardından SRT/VTT oluşturmadan önce bir sözlük aracılığıyla terminolojiyi kilitleyin.
- Zaman damgalarını koruyan çeviriler kullanın; kısa yerinde kontrollerle kalite kontrol yapın.
- Parçalara ayırma, JSON sidecarlar ve basit toplu iş komut dosyalarıyla ölçeklendirin.
- Bir erişilebilirlik zihniyetini koruyun; anlamayı değiştirdiği durumlarda konuşma dışı ses ekleyin.
Sonraki Adımlar
- Yukarıdaki şablonlardan birini seçin ve 2–3 dakikalık bir klipte çalıştırın.
- Alanınız için 10 terimlik bir sözlük oluşturun ve yeniden prompt verin.
- Otomatikleştirin: favori promptunuzu ön ayar olarak kaydedin ve bir ek dile çeviriyi test edin.
- 3 dakikalık bir kalite kontrol kontrol listesi oluşturun ve yayınlamadan önce uygulayın.
Bu promptlar ve desenlerle, ham medyadan doğru, platforma hazır altyazılara saatler değil, dakikalar içinde geçeceksiniz.
SSS
S1:Qwen3‑Omni'ye seslere otomatik olarak altyazı eklemesi için nasıl prompt veririm?
Biçimi (SRT, VTT veya transkript), zamanlama kurallarını ve satır sınırlarını belirten açık bir talimat kullanın. Örneğin, işaret başına 1–2 satır, işaret başına 1,2–4,0 saniye ve satır başına ≤ 42 karakter içeren SRT isteyin.
S2:Qwen3‑Omni aynı videodan çok dilli altyazılar oluşturabilir mi?
Evet. Önce kaynak dilde altyazılar oluşturun, ardından Qwen3‑Omni'den zaman damgalarını koruyarak çevirmesini isteyin. Daha iyi akıcılık için es‑MX veya fr‑FR gibi yerel ayar varyantlarını belirtin.
S3:YouTube altyazıları için en iyi biçim nedir: SRT mi yoksa VTT mi?
Her ikisi de işe yarar, ancak SRT yaygın olarak kullanılır ve doğrulaması basittir. Web'e özgü özelliklere ihtiyacınız varsa, WebVTT idealdir ve HTML5 oynatıcıları tarafından yaygın olarak desteklenir.
S4:Teknik terimler ve isimlerle doğruluğu nasıl artırabilirim?
Promptunuzda kanonik yazımlara ve kısaltmalara sahip mini bir sözlük sağlayın. Qwen3‑Omni'den sözlük terimlerini tercih etmesini ve belirsizlikleri ile işaretlemesini isteyin.
S5:Otomatik altyazı eklerken uzun videoları nasıl ele alırım?
Medyayı bölümlere veya sessizliğe dayalı parçalara ayırın, her birine aynı prompt ile altyazı ekleyin, ardından zaman damgalarını yeniden birleştirin. Bu, kaymayı azaltır ve tutarlılığı artırır.