What is DeepSeek‑OCR and why use it to compress chat histories for LLMs?

DeepSeek‑OCR enables Context Optical Compression—encoding large text spans as visual tokens that VLMs can process efficiently. This can shrink token budgets and preserve structure better than text‑only summarization while maintaining high fidelity for long contexts.

How does visual token compression compare to text summarization?

Visual token compression often achieves higher effective compression while retaining layout and exact phrasing, which helps with quotations, code, and error strings. Summarization is faster and simpler but can omit rare details or introduce abstraction errors.

Can I mix DeepSeek‑OCR with RAG for logs and chats?

Yes. Use text summaries for fast recall and attach OCR‑validated visual cards for depth. A two‑stage retriever can fetch abstracts first, then the most relevant cards, balancing precision and context coverage.

What layouts work best for OCR‑compressed context cards?

Use clean HTML/CSS with a title bar, two‑column content, monospace blocks for code, and clear bullets for highlights. Keep 200–400 words per card, 11–12 pt fonts or larger, and validate readability with an OCR round‑trip.

How do I measure whether compression is losing important information?

Track Fidelity@K against a gold set of facts, evidence coverage via line‑number citations, and latency/cost metrics. Target ≥95% fact retention and ensure most answers cite a card line or anchor ID.

DeepSeek-OCR Uputstvo: Kompresovanje Istorije Razgovora, Logova & Podataka za LLM-ove

Uvod: Zašto je kompresija sada supersila za LLM-ove Ako ste ikada pokušali da ugurate nedeljne istorije četova, telemetrije ili tragove aplikacija sa više sistema u prompt, naišli ste na tvrdi limit kontekstualnih prozora. Uobičajeni pristup – sumiranje, proređivanje, deljenje na delove – pomaže samo do određene mere pre nego što se uvuče gubitak signala. DeepSeek‑OCR uvodi izvanredan obrt: kompresuje tekst u vizuelne tokene korišćenjem OCR‑VLM pipeline-a da bi dramatično smanjio kontekst bez odbacivanja značenja. Rani izveštaji zajednice navode efikasnost kompresije reda veličine iskorišćavanjem vizuelnih tokena umesto sirovih tekstualnih tokena, paradigmu koju neke analize opisuju kao „Optička kompresija konteksta“ i „hiljade tekstualnih tokena u nekoliko stotina vizuelnih tokena“ za radne tokove dugog konteksta.

U ovom praktičnom, korak-po-korak DeepSeek‑OCR tutorijalu, naučićete kako da kompresujete istorije četova, logove i podatke za LLM-ove uz zadržavanje preciznosti preuzimanja—plus kako da kombinujete kompresiju zasnovanu na OCR-u sa sumiranjem, hijerarhijskim deljenjem na delove i RAG-om za moćno promptovanje sa niskom latencijom.

Kome je ovaj vodič namenjen

Kreatorima AI autopilota koji moraju da unose dugačke četove i tragove aktivnosti

Data inženjerima koji se bore sa logovima, tragovima i metrikama za LLM rezonovanje

Istraživačima koji prototipiziraju radne tokove ultra-dugog konteksta sa ograničenim budžetom

Udica u jednoj rečenici: Ako možete da pretvorite razvučeni tekst u kompaktne vizuelne reprezentacije koje LLM-ovi mogu da čitaju, vraćate budžet konteksta bez žrtvovanja mrvica rezonovanja.

Šta je DeepSeek‑OCR kompresija? Osnovna ideja

Kompresija vizuelnih tokena: Pretvorite guste raspone teksta u vizuelne ugradnje visokog nivoa informacija; vizuelni tokeni mogu biti jeftiniji i kompaktniji od ekvivalentnih tekstualnih tokena.

Optička kompresija konteksta: Koristite OCR/VLM za kodiranje velikog tekstualnog konteksta kao slika ili vizuelno strukturiranih izgleda, čuvajući semantičku strukturu uz smanjenje broja tokena.

Radni tokovi dugog konteksta: Kompresujte hiljade tokena u stotine vizuelnih tokena, omogućavajući veće radne setove za planiranje, upotrebu alata ili rezonovanje u više koraka.

Kada ga koristiti

Istorije četova sa ponavljajućim frazama ili predvidljivom strukturom

Sistemski logovi, tragovi, izlazi izgradnje ili analitički ispisi

Snimci dokumentacije, kontrolne table ili polu-strukturirani izveštaji

Šta ćete izgraditi u ovom tutorijalu Implementiraćete pipeline za:

Normalizujte i segmentirajte podatke četova/logova.

Izaberite strategije kompresije (OCR‑visual, tekstualno sumiranje ili hibrid).

Generišite kompaktne vizuelne reprezentacije putem DeepSeek‑OCR.

Indeksirajte sa metapodacima za preuzimanje.

Postavite upit sa hibridnim RAG promptom koji prihvata i tekst i slike.

Procenite vernost i cenu.

Odeljak 1 — Priprema podataka: Učinite neuredne istorije modelima prikladnim

Normalizujte vremenske oznake i uloge: npr. .

Protiv: zahteva VLM podršku; potrebno je renderovanje i image I/O.

Koristite kada: vam je potrebna vernost dugog konteksta, dijagrami/tabele ili tačno zadržavanje fraza.

Hibridni (preporučeno)

Zadržite „skeletni“ tekstualni rezime za sidrenje + priložite kompresovane vizuelne kartice za dubinu.

Ovo balansira preciznost preuzimanja (tekst) i podsećanje/vernost (vizija).

Odeljak 3 — Izgradnja vizuelnih kontekstualnih kartica sa DeepSeek‑OCR Cilj: Transformišite 5–20 KB raspona teksta u slike od 512–1024 px optimizovane za OCR/VLM čitanje.

Predlozi šablona

Naslovna traka: ID sesije, vremenski opseg, oznaka teme.

Raspored u dve kolone: leva kolona za ključne korake/logove; desna kolona za istaknute delove (greške, odluke, komande, metrike).

Monospace blokovi za linije koda/logova; rezimei sa nabrajanjem za kontekst.

Tema pogodna za kontrast; izbegavajte sitne fontove (<11–12 pt pri uvećanju 1x).

Saveti za renderovanje

Koristite HTML/CSS da biste proizveli čiste, dosledne kartice (npr. snimci ekrana Puppeteer/Playwright).

Uključite stabilna sidra (brojeve redova, ID-ove) da biste referencirali određene stavke u promptovima.

Ograničite na ~200–400 reči po kartici; napravite stek kartica po sesiji.

DeepSeek‑OCR prolaz

Pokrenite DeepSeek‑OCR da biste osigurali vernost povratnog putovanja: kartica → OCR tekst. Ovo dvostruko proverava da se vaš raspored i fontovi tačno dekodiraju.

Ako se OCR tekst razlikuje, podesite fontove, razmak ili razbijte gusti kod u više kartica.

Zašto ovo radi Izveštaji zajednice i trećih strana ukazuju na značajna poboljšanja efikasnosti prilikom kompresije tekstualnog konteksta u vizuelne tokene uz zadržavanje čitljivosti.

Odeljak 4 — Slojevi sumiranja: Zadržite skelet, sačuvajte mišić Implementirajte slojevite rezimee tako da možete povećati rezoluciju samo kada je potrebno.

L0: Atomske oznake linija/okreta — uloga, vremenska oznaka, tip (greška, napomena, kod), ugrađivanje.

L1: Mikro-rezime (1–2 rečenice) za svakih 20–40 okretaja ili 2–5 minuta logova.

L2: Apstrakt sesije (5–8 stavki) sa odlukama, blokatorima, ishodima i vezama do vizuelnih kartica.

L3: Niz-od-nizova — nedeljni ili zbirni podaci na nivou projekta.

Praktična heuristika

Uvek uključite doslovna sidra: kodove grešaka, SQL ID-ove, trace ID-ove, commit SHA-ove.

Koristite ekstraktivne rezimee pre apstraktivnih; zatim precizirajte sa apstraktivnim radi čitljivosti.

Dodajte stavku „šta se promenilo od poslednje sesije“ da biste ubrzali promptovanje za sustizanje.

Odeljak 5 — Indeksiranje i preuzimanje za hibridni RAG Šema metapodataka

doc_id, session_id, time_range, roles, topic labels

importance score, error severity, component/service

links: .

Kombinujte kompresiju zasnovanu na OCR-u sa slojevitim rezimeima i RAG-om za preciznost i dubinu.

Optimizujte rasporede, fontove i indeksiranje da biste održali visoku vernost i nisku latenciju.

Tretirajte kompresovane kartice kao dokaz prvog reda i citirajte ih u promptovima.

Sledeći koraci

Prototipizirajte minimalni pipeline na jednom projektu četovanja ili skupu podataka logova.

A/B testirajte samo tekstualnu vs hibridnu kompresiju za 10 tipičnih upita.

Podesite dizajn kartice, miks preuzimača i budžete na osnovu metrike vernosti.

Skalirajte na timske radne tokove sa keširanjem, ACL-ovima i monitoringom.

FAQ

P1: Šta je DeepSeek‑OCR i zašto ga koristiti za kompresovanje istorije četova za LLM-ove? DeepSeek‑OCR omogućava optičku kompresiju konteksta — kodiranje velikih raspona teksta kao vizuelnih tokena koje VLM-ovi mogu efikasno da obrade. Ovo može smanjiti budžete tokena i bolje sačuvati strukturu od tekstualnog sumiranja uz održavanje visoke vernosti za duge kontekste.

P2: Kako se kompresija vizuelnih tokena poredi sa sumiranjem teksta? Kompresija vizuelnih tokena često postiže veću efektivnu kompresiju uz zadržavanje rasporeda i tačnog fraziranja, što pomaže kod citata, koda i nizova grešaka. Sumiranje je brže i jednostavnije, ali može izostaviti retke detalje ili uvesti greške apstrakcije.

P3: Mogu li da kombinujem DeepSeek‑OCR sa RAG-om za logove i četove? Da. Koristite tekstualne rezimee za brzo podsećanje i priložite vizuelne kartice validirane OCR-om za dubinu. Dvo-fazni preuzimač može prvo da preuzme apstrakte, a zatim najrelevantnije kartice, balansirajući preciznost i pokrivenost konteksta.

P4: Koji rasporedi najbolje funkcionišu za OCR-kompresovane kontekstualne kartice? Koristite čist HTML/CSS sa naslovnom trakom, sadržajem u dve kolone, monospace blokovima za kod i jasnim nabrajanjem za istaknute delove. Držite 200–400 reči po kartici, fontove od 11–12 pt ili veće i potvrdite čitljivost OCR povratnim putovanjem.

P5: Kako da izmerim da li kompresija gubi važne informacije? Pratite Fidelity@K u odnosu na zlatni skup činjenica, pokrivenost dokaza putem citata brojeva redova i metrike latencije/cene. Ciljajte ≥95% zadržavanja činjenica i osigurajte da većina odgovora citira liniju kartice ili ID sidra.