Sider.ai
  • Čet
  • Wisebase
  • Алати
  • Продужетак
  • Клијенти
  • Прицинг
Преузми сада
Пријавите се

Učite brže, razmišljajte dublje i rastite pametnije uz Sider.

Proizvodi
Aplikacije
  • Ekstenzije
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Alati
  • Kreator vebaNew
  • AI SlajdoviNew
  • AI Pisac Eseja
  • Nano Banana Pro
  • Nano Banana Infographic
  • AI Generator Slika
  • Italijanski generator mozgalica
  • Uklanjanje Pozadine
  • Menjač Pozadine
  • Brisanje Fotografija
  • Uklanjanje Teksta
  • Inpaint
  • Povećanje Rezolucije Slika
  • Kreiraj
  • AI Prevodilac
  • Prevodilac Slika
  • PDF Prevodilac
Sider
  • Kontaktirajte nas
  • Centar za pomoć
  • Preuzimanje
  • Cene
  • Plan obrazovanja
  • Šta je novo
  • Blog
  • Zajednica
  • Partneri
  • Partnerstvo
  • Pozovi
©2026 Sva prava zadržana
Uslovi korišćenja
Politika privatnosti
  • Почетна страница
  • Блог
  • AI Alati
  • DeepSeek-OCR Uputstvo: Kompresovanje Istorije Razgovora, Logova & Podataka za LLM-ove

DeepSeek-OCR Uputstvo: Kompresovanje Istorije Razgovora, Logova & Podataka za LLM-ove

Ažurirano 23. Okt. 2025.

5 min


Uvod: Zašto je kompresija sada supersila za LLM-ove Ako ste ikada pokušali da ugurate nedeljne istorije četova, telemetrije ili tragove aplikacija sa više sistema u prompt, naišli ste na tvrdi limit kontekstualnih prozora. Uobičajeni pristup – sumiranje, proređivanje, deljenje na delove – pomaže samo do određene mere pre nego što se uvuče gubitak signala. DeepSeek‑OCR uvodi izvanredan obrt: kompresuje tekst u vizuelne tokene korišćenjem OCR‑VLM pipeline-a da bi dramatično smanjio kontekst bez odbacivanja značenja. Rani izveštaji zajednice navode efikasnost kompresije reda veličine iskorišćavanjem vizuelnih tokena umesto sirovih tekstualnih tokena, paradigmu koju neke analize opisuju kao „Optička kompresija konteksta“ i „hiljade tekstualnih tokena u nekoliko stotina vizuelnih tokena“ za radne tokove dugog konteksta.
U ovom praktičnom, korak-po-korak DeepSeek‑OCR tutorijalu, naučićete kako da kompresujete istorije četova, logove i podatke za LLM-ove uz zadržavanje preciznosti preuzimanja—plus kako da kombinujete kompresiju zasnovanu na OCR-u sa sumiranjem, hijerarhijskim deljenjem na delove i RAG-om za moćno promptovanje sa niskom latencijom.
Kome je ovaj vodič namenjen
  • Kreatorima AI autopilota koji moraju da unose dugačke četove i tragove aktivnosti
  • Data inženjerima koji se bore sa logovima, tragovima i metrikama za LLM rezonovanje
  • Istraživačima koji prototipiziraju radne tokove ultra-dugog konteksta sa ograničenim budžetom
Udica u jednoj rečenici: Ako možete da pretvorite razvučeni tekst u kompaktne vizuelne reprezentacije koje LLM-ovi mogu da čitaju, vraćate budžet konteksta bez žrtvovanja mrvica rezonovanja.
Šta je DeepSeek‑OCR kompresija? Osnovna ideja
  • Kompresija vizuelnih tokena: Pretvorite guste raspone teksta u vizuelne ugradnje visokog nivoa informacija; vizuelni tokeni mogu biti jeftiniji i kompaktniji od ekvivalentnih tekstualnih tokena.
  • Optička kompresija konteksta: Koristite OCR/VLM za kodiranje velikog tekstualnog konteksta kao slika ili vizuelno strukturiranih izgleda, čuvajući semantičku strukturu uz smanjenje broja tokena.
  • Radni tokovi dugog konteksta: Kompresujte hiljade tokena u stotine vizuelnih tokena, omogućavajući veće radne setove za planiranje, upotrebu alata ili rezonovanje u više koraka.
Kada ga koristiti
  • Istorije četova sa ponavljajućim frazama ili predvidljivom strukturom
  • Sistemski logovi, tragovi, izlazi izgradnje ili analitički ispisi
  • Snimci dokumentacije, kontrolne table ili polu-strukturirani izveštaji
Šta ćete izgraditi u ovom tutorijalu Implementiraćete pipeline za:
  1. Normalizujte i segmentirajte podatke četova/logova.
  1. Izaberite strategije kompresije (OCR‑visual, tekstualno sumiranje ili hibrid).
  1. Generišite kompaktne vizuelne reprezentacije putem DeepSeek‑OCR.
  1. Indeksirajte sa metapodacima za preuzimanje.
  1. Postavite upit sa hibridnim RAG promptom koji prihvata i tekst i slike.
  1. Procenite vernost i cenu.
Odeljak 1 — Priprema podataka: Učinite neuredne istorije modelima prikladnim
  • Normalizujte vremenske oznake i uloge: npr. .
  • Protiv: zahteva VLM podršku; potrebno je renderovanje i image I/O.
  • Koristite kada: vam je potrebna vernost dugog konteksta, dijagrami/tabele ili tačno zadržavanje fraza.
  • Hibridni (preporučeno)
  • Zadržite „skeletni“ tekstualni rezime za sidrenje + priložite kompresovane vizuelne kartice za dubinu.
  • Ovo balansira preciznost preuzimanja (tekst) i podsećanje/vernost (vizija).
Odeljak 3 — Izgradnja vizuelnih kontekstualnih kartica sa DeepSeek‑OCR Cilj: Transformišite 5–20 KB raspona teksta u slike od 512–1024 px optimizovane za OCR/VLM čitanje.
Predlozi šablona
  • Naslovna traka: ID sesije, vremenski opseg, oznaka teme.
  • Raspored u dve kolone: leva kolona za ključne korake/logove; desna kolona za istaknute delove (greške, odluke, komande, metrike).
  • Monospace blokovi za linije koda/logova; rezimei sa nabrajanjem za kontekst.
  • Tema pogodna za kontrast; izbegavajte sitne fontove (<11–12 pt pri uvećanju 1x).
Saveti za renderovanje
  • Koristite HTML/CSS da biste proizveli čiste, dosledne kartice (npr. snimci ekrana Puppeteer/Playwright).
  • Uključite stabilna sidra (brojeve redova, ID-ove) da biste referencirali određene stavke u promptovima.
  • Ograničite na ~200–400 reči po kartici; napravite stek kartica po sesiji.
DeepSeek‑OCR prolaz
  • Pokrenite DeepSeek‑OCR da biste osigurali vernost povratnog putovanja: kartica → OCR tekst. Ovo dvostruko proverava da se vaš raspored i fontovi tačno dekodiraju.
  • Ako se OCR tekst razlikuje, podesite fontove, razmak ili razbijte gusti kod u više kartica.
Zašto ovo radi Izveštaji zajednice i trećih strana ukazuju na značajna poboljšanja efikasnosti prilikom kompresije tekstualnog konteksta u vizuelne tokene uz zadržavanje čitljivosti.
Odeljak 4 — Slojevi sumiranja: Zadržite skelet, sačuvajte mišić Implementirajte slojevite rezimee tako da možete povećati rezoluciju samo kada je potrebno.
  • L0: Atomske oznake linija/okreta — uloga, vremenska oznaka, tip (greška, napomena, kod), ugrađivanje.
  • L1: Mikro-rezime (1–2 rečenice) za svakih 20–40 okretaja ili 2–5 minuta logova.
  • L2: Apstrakt sesije (5–8 stavki) sa odlukama, blokatorima, ishodima i vezama do vizuelnih kartica.
  • L3: Niz-od-nizova — nedeljni ili zbirni podaci na nivou projekta.
Praktična heuristika
  • Uvek uključite doslovna sidra: kodove grešaka, SQL ID-ove, trace ID-ove, commit SHA-ove.
  • Koristite ekstraktivne rezimee pre apstraktivnih; zatim precizirajte sa apstraktivnim radi čitljivosti.
  • Dodajte stavku „šta se promenilo od poslednje sesije“ da biste ubrzali promptovanje za sustizanje.
Odeljak 5 — Indeksiranje i preuzimanje za hibridni RAG Šema metapodataka
  • doc_id, session_id, time_range, roles, topic labels
  • importance score, error severity, component/service
  • links: .
  • Kombinujte kompresiju zasnovanu na OCR-u sa slojevitim rezimeima i RAG-om za preciznost i dubinu.
  • Optimizujte rasporede, fontove i indeksiranje da biste održali visoku vernost i nisku latenciju.
  • Tretirajte kompresovane kartice kao dokaz prvog reda i citirajte ih u promptovima.
Sledeći koraci
  • Prototipizirajte minimalni pipeline na jednom projektu četovanja ili skupu podataka logova.
  • A/B testirajte samo tekstualnu vs hibridnu kompresiju za 10 tipičnih upita.
  • Podesite dizajn kartice, miks preuzimača i budžete na osnovu metrike vernosti.
  • Skalirajte na timske radne tokove sa keširanjem, ACL-ovima i monitoringom.

FAQ

P1: Šta je DeepSeek‑OCR i zašto ga koristiti za kompresovanje istorije četova za LLM-ove? DeepSeek‑OCR omogućava optičku kompresiju konteksta — kodiranje velikih raspona teksta kao vizuelnih tokena koje VLM-ovi mogu efikasno da obrade. Ovo može smanjiti budžete tokena i bolje sačuvati strukturu od tekstualnog sumiranja uz održavanje visoke vernosti za duge kontekste.
P2: Kako se kompresija vizuelnih tokena poredi sa sumiranjem teksta? Kompresija vizuelnih tokena često postiže veću efektivnu kompresiju uz zadržavanje rasporeda i tačnog fraziranja, što pomaže kod citata, koda i nizova grešaka. Sumiranje je brže i jednostavnije, ali može izostaviti retke detalje ili uvesti greške apstrakcije.
P3: Mogu li da kombinujem DeepSeek‑OCR sa RAG-om za logove i četove? Da. Koristite tekstualne rezimee za brzo podsećanje i priložite vizuelne kartice validirane OCR-om za dubinu. Dvo-fazni preuzimač može prvo da preuzme apstrakte, a zatim najrelevantnije kartice, balansirajući preciznost i pokrivenost konteksta.
P4: Koji rasporedi najbolje funkcionišu za OCR-kompresovane kontekstualne kartice? Koristite čist HTML/CSS sa naslovnom trakom, sadržajem u dve kolone, monospace blokovima za kod i jasnim nabrajanjem za istaknute delove. Držite 200–400 reči po kartici, fontove od 11–12 pt ili veće i potvrdite čitljivost OCR povratnim putovanjem.
P5: Kako da izmerim da li kompresija gubi važne informacije? Pratite Fidelity@K u odnosu na zlatni skup činjenica, pokrivenost dokaza putem citata brojeva redova i metrike latencije/cene. Ciljajte ≥95% zadržavanja činjenica i osigurajte da većina odgovora citira liniju kartice ili ID sidra.

Nedavni članci
Kako savladati ChatPDF: Brže do uvida iz složenih dokumenata

Kako savladati ChatPDF: Brže do uvida iz složenih dokumenata

Najbolja alternativa za X Auto-Translation za brze i precizne dokumente

Najbolja alternativa za X Auto-Translation za brze i precizne dokumente

Samsung AI Prevod Nije Dostupan u Iranu? Praktična Rešenja

Samsung AI Prevod Nije Dostupan u Iranu? Praktična Rešenja

Alati za prevođenje na persijski: praktičan vodič za brži i tačniji rad

Alati za prevođenje na persijski: praktičan vodič za brži i tačniji rad

Najbolja Grok alternativa za dubinsko, citirano istraživanje

Najbolja Grok alternativa za dubinsko, citirano istraživanje

Top 15 Funkcija AI Generatora Slika Koje Ćete Zaista Koristiti

Top 15 Funkcija AI Generatora Slika Koje Ćete Zaista Koristiti