“ലോൺ-കോണ്ടക്റ്റ് എ.ഐ.”ന്റെ പ്രത്യേകതയെക്കുറിച്ച് വിളിച്ചു പറയുന്നത് എല്ലാരും പഴയ തിരക്ക് വച്ചൊപ്പിക്കുകയാണ്—പേജ് 47ന്റെ വിശദമായ ചോദ്യങ്ങൾക്ക് നിങ്ങള്ക്ക് ചോദിക്കുന്നത് വരെ. ആ സമയത്തിന് വേഗത്തിൽ, അത് ഒരു തലഭ്യോയനായ കാണ്മാൻ കഴിയുന്നു. DeepSeek-OCR ഈ വിവൃത്തിയുടെ നടുവിലാണ് ഉണ്ട് രോഗം കൊണ്ട് ഒരു സാദാരണ-സത്യമായ അവകാശവാദവുമായി: ശ്രദ്ധിക്കേണ്ടതും ഉള്ളത് കംപ്രസ് ചെയ്യുക, ഘടന നിലനിർത്തുക, 2023ല് പോലെ ടോകൺ പുകയ്ക്കുന്നതിൽ നിർത്തുക. വാഗ്ദാനം “OCR, എന്നാലും മികച്ചതാണ്” അല്ല. ഇത് ഘടനയെ ശംസിക്കുന്നു കൂടാതെ നിങ്ങളുടെ കോൺടക്ട് വിന്ഡോയെ ശൃംഖലകൾ കൊണ്ട് പള്ളിയില് ദേവന്റെ ഘടനകൊണ്ട് വീശാൻ അനുവദിക്കല്ല.
അതും, ഇത് തന്നെ പലത് പറഞ്ഞിട്ടുള്ള ലോൺ-കോണ്ടക്റ്റ് പൈപ്പ്ലൈൻ മിക്കവാറും എങ്ങനെ തെറ്റിയെന്നു ആഗോളതലത്തിൽ തെറ്റിച്ചിട്ടുള്ളത്. അവർ മോഡലിൽ കച്ചവടത്തിൽ കച്ചവടത്തിലൂടെ പരമാവധി текста ഉളിപ്പിക്കുന്നത്, അതിനുശേഷം നിങ്ങൾക്ക് അവളുടെ കിടാനില് ആരംഭത്തിന്റെ അവസാനത്തെ ദിവസവായിച്ച് സംഗതികൾ സൃഷ്ടിച്ചിട്ടുണ്ടെങ്കിലും.
DeepSeek-OCR യാഥാർത്ഥ്യത്തിൽ ഒരു നല്ല ലോൺ-കോണ്ടക്റ്റ് പൈപ്പ്ലൈൻ ആക്കുന്നതെങ്ങനെ എന്ന് നമുക്ക് കാറും എടുക്കാം—ഒന്ന് യഥാർത്ഥത്തിൽ സ്കെയിൽ ചെയ്യുന്നതും, കംപ്യൂട്ടിന്റെ പണം കടന്നു പോകുന്നതും, PDFയിൽ աղുക്കാർക്കു ഒപ്പമുണ്ടാക്കിയാൽ തകർന്നു പോകുന്നതും അല്ല.
DeepSeek-OCR മറ്റൊരു വിധത്തിൽ എങ്ങിനെ വ്യത്യസ്തമാണ് (മുഴുവൻ ആഗ്രഹകരമാണ്)
- ഘടന ഡാറ്റയാണ്: ദീര്ഘവിവരണങ്ങൾ വെറും എഴുത്തും അല്ല; അവ സമ്പ്രദായിക വാദങ്ങളുമാണ്. മേലും, കോളങ്ങളും, പട്ടികകളും, ചിത്രങ്ങളുടെ ക്യാപ്ഷനുകളും—ഇവയൊക്കെ അർത്ഥം ആണ്. DeepSeek-OCR പ്രഥമ-ക്ലാസ്സ് സിറ്റിസൻ എന്ന നിലയിൽ ആ ഘടന നിലനിർത്താൻ ഉദ്ദേശിക്കുന്നു; ഇത് വളരെ കാര്യമായ വാർത്തകൾക്ക് കണക്കാകെ സർത്ത്സി 摩臣ാൻ ആവശ്യമാണ്, നാം ആയിരുന്നാൽ നാം ഇഷ്ടപ്പെട്ടില്ലക്ക് ചേര്ന്നത് ശോതൃഞ്ചമാളി ചെയ്യുന്നു.
- ലോൺ-കണ്ടക്ഷൻ ഇല്ലാതാക്കുന്നത്: സിഗ്നലിനെ പ്രതിപാദിക്കുന്നതല്ല - എല്ലായ്പ്പോഴും ഒരു 8K വിൻഡോയിലേക്ക് സമ്മർദ്ദം ചെയ്യുന്നതിന് വേണ്ട മാർക്ക് ചെയ്യരുത്. അത് സിഗ്നൽ നിലനിർത്തുക-കൊമ്മ-സംഘടിത, നാവിഗേറ്റുകൾ-ബലവിന്ദി, മറ്റുള്ളവയേക്കാൾ കുറച്ച് രേഖാമൂല്യങ്ങൾ ഞങ്ങൾ നിന്നതാണ്.
- താഴെയാണെങ്കിൽ എങ്ങനെ പോകും: RAG, സംക്ഷേപണം, ലോൺ-കോണ്ടക്റ്റ് ട്രാൻസ്ഫോർമറുകൾ, ഇവയെല്ലാം പങ്കറിയുകയാണ്. നിങ്ങളുടെ OCR പരിരക്ഷ അറിയുന്നുണ്ടെങ്കിൽ, നിങ്ങളുടെ തിരുത്തൽ, യുക്തി സ്തുന്നിപ്പിക്കുന്ന കിഴക്ക് പ്രമാണങ്ങളാകണം.
നിങ്ങളുടെ നിർമ്മാണം: ഒരു ലോൺ-കോണ്ടക്റ്റ് പൈപ്പ്ലൈൻ ഒരു സ്പൈൻ ആണ്
പൈപ്പ്ലൈൻ അഞ്ചു ഭാഗങ്ങളായി ചിന്തിക്കുക, ഓരോന്നും ഒരു ജോലി നല്ല രീതിയിൽ ചെയ്യുന്നത്:
- ഞാൻ അകത്ത് ഇട്ടുകൊണ്ട് ഞാൻ തിരിച്ചായിരിക്കുന്നു
- പ്രവേശകം: PDFs (ജന്മദിനവും സ്കാൻ ചെയ്തതും), ചിത്രങ്ങൾ, സ്കാനർ മുതൽ TIFFകൾ, അക്രമിത ഓഫീസ് എക്സ്പോർട്ട്സ്.
- മുൻഗണന: അനുതലിക്കുക, ഡെനോയസ് ചെയ്യുക, ആവശ്യമായുണ്ട് എങ്കിൽ ബൈനറൈസ് ചെയ്യുക, യുഗ്മമാക്കുന്ന പേജുകൾ സ്ഥിരമായി ആയി. ഓരോ പേജ് മെച്ചമായി സൂക്ഷിക്കുക—പേജ് നമ്പർ, സ്റ്റോഴ്സ് ഫൈൽ, സെക്ഷൻ ആങ്കറുകൾ.
- ഔട്ട്പുട്ട് ലക്ഷ്യം: തിന്റെ നിരക്ക് (PNG അല്ലെങ്കിൽ JPEG) ഏകദിവസമാക്കുന്നത് ചില നിരക്കിട്ട ഐയോഗണയുള്ള ഡിസ്പ്ലേയിലും.
- ദിവസത്തിൽ ഓരോ പേജിലും DeepSeek-OCR പ്രവർത്തിപ്പിക്കുക:
- ബൗണ്ടിംഗ് ബോക്സ് (x, y, വീതിയലി) ഉള്ള എഴുത്തിന്റെ സ്പാനുകൾ
- ബ്ലോക്ക് പ്രാവർത്തികമാനങ്ങളും: പേരുകളും, പാരഗ്രാഫുകളും, പട്ടികകൾ, ചിത്രങ്ങൾ, കുറിപ്പുകൾ
- വായനയുടെ_ORDER ഉം ഹൈറാർക്കിക്കൽ ഘടനയും (ഡോക്യുമെന്റ് മരം)
- അനുവദിച്ച എഴുത്തും ഘടനാ യൂണിറ്റും സംരക്ഷിക്കുക. ഇത് ടോകൺ-ലെവൽ മാപ്പ് സ്വീകരിക്കാൻ ഉണ്ടെങ്കിൽ, അതിനെ എടുക്കുക. പട്ടികകൾ ഘടിതമാക്കണം (CSV/HTML) കൂടാതെ അവരുടെ കോർഡിനേറ്റുകൾക്ക് തിരിച്ചുള്ളതാണോ.