Sider.ai
  • Klepet
  • Wisebase
  • Orodja
  • Razširitev
  • Stranke
  • Cenitev
Prenesi zdaj
Vpiši se

Učite se hitreje, razmišljajte globlje in rastite pametneje s Sider.

Izdelki
Aplikacije
  • Razširitve
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Orodja
  • Ustvarjalec spletnih straniNew
  • AI DiapozitiviNew
  • AI pisec esejev
  • Nano Banana Pro
  • Nano Banana Infographic
  • AI generator slik
  • Italijanski generator možganske zmešnjave
  • Odstranjevalec ozadja
  • Menjalnik ozadja
  • Brisalo za fotografije
  • Odstranjevalec besedila
  • Inpaint
  • Povečevalnik slik
  • Ustvari
  • AI prevajalnik
  • Prevajalnik slik
  • PDF prevajalnik
Sider
  • Kontaktirajte nas
  • Center za pomoč
  • Prenesi
  • Cenik
  • Izobraževalni načrt
  • Kaj je novega
  • Blog
  • Skupnost
  • Partnerji
  • Partnerski program
  • Povabi
©2026 Vse pravice pridržane
Pogoji uporabe
Politika zasebnosti
  • Domača stran
  • Blog
  • AI Orodja
  • 10 najboljših vadnic za RAGFlow za obvladovanje generiranja z razširjenim pridobivanjem (Retrieval-Augmented Generation)

10 najboljših vadnic za RAGFlow za obvladovanje generiranja z razširjenim pridobivanjem (Retrieval-Augmented Generation)

Posodobljeno 19. sep. 2025

10 min


10 najboljših vadnic RAGFlow za obvladovanje generiranja, podprtega s pridobivanjem (Retrieval-Augmented Generation)

Če ste kdaj poskušali dobiti velik jezikovni model, da bi odgovoril na domensko specifična vprašanja in ste ga opazovali, kako samozavestno halucinira, ste občutili bolečino, ki jo rešuje RAGFlow. Generiranje, podprto s pridobivanjem (RAG), združuje iskalno plast z generiranjem, tako da vaš model navaja dejstva iz vaših lastnih podatkov. RAGFlow je odprt, vizualen in cevovodno voden način za izgradnjo tega sistema od začetka do konca – od vnosa dokumentov do razčlenjevanja, vdelave, vektorskega iskanja in utemeljenih odgovorov.
V tem priročniku zbiramo najboljše vadnice RAGFlow, ki jim lahko sledite danes, kako izbrati pravo za svoj nabor tehnologij in praktičen načrt za prehod od "hello world" do produkcije. Ohranili bomo pragmatičnost s primeri, pastmi in nekaj močnimi nasveti, ki jih ne boste našli v osnovnih predstavitvah.
Uporabljamo praktičen pristop, usmerjen v rešitve: kratke razlage, jasni koraki in izrezljive (copy-paste) kode. Poskrbimo, da boste ustvarili aplikacijo RAGFlow, ki bo dejansko pravilno odgovarjala.

Kaj naredi "najboljšo vadnico RAGFlow"?

Niso vse vadnice enake. Najboljše vadnice RAGFlow imajo nekaj skupnih lastnosti:
  • Tok od začetka do konca: Vnos → razčlenjevanje → vdelava → indeksiranje → pridobivanje → generiranje, vse v eni poti.
  • Realistični dokumenti: PDF-ji, HTML, predstavitve diapozitivov ali neurejeni dnevniki – ne samo igrače markdown.
  • Vgrajena ocena: Učijo, kako meriti utemeljenost, zakasnitev in kakovost odgovorov.
  • Produkcijska vprašanja: Predpomnjenje, ponovni poskusi, opazovanje in zaščitni mehanizmi.
  • Razširljivost: Pokažejo, kje zamenjati modele, strategije razčlenjevanja ali vektorske shrambe.
Imejte te kriterije v mislih, ko izbirate svojo učno pot.

Trenutno 10 najboljših vadnic RAGFlow

Spodaj je kuriran seznam od začetnih do naprednih. Vsak vnos vključuje, zakaj je uporaben, kaj boste zgradili in komu je namenjen.

1) Hiter začetek RAGFlow: Vaš prvi cevovod od začetka do konca

  • Zakaj je odličen: Najhitrejši način za razumevanje premikajočih se delov – idealen za odpravo blokad.
  • Zgradili boste: Minimalen cevovod: naložite PDF, samodejno razčlenite, vdelajte, indeksirajte in poizvedujte z navedbami.
  • Ključni koraki:
  1. Zaženite RAGFlow in odprite graditelj cevovodov.
  1. Dodajte vozlišče za vnos datotek in pokažite na PDF.
  1. Vstavite razčlenjevalnik (npr. rekurzivni + naslovi) in vozlišče modela za vdelavo.
  1. Povežite se z vektorsko shrambo, nato dodajte vozlišča za pridobivanje in generiranje z LLM.
  1. Testirajte z nekaj poizvedbami in preglejte vire.
  • Dobro za: Absolutne začetnike; ekipe, ki potrjujejo osnovni tok RAGFlow.

2) RAGFlow + več virov podatkov: PDF-ji, spletne strani in Notion

  • Zakaj je odličen: Večina resničnih projektov združuje neurejene vire; ta vadnica prikazuje, kako.
  • Zgradili boste: Cevovod, ki vnaša PDF-je, pregleduje URL-je in sinhronizira strani Notion po urniku.
  • Ključni koraki:
  • Uporabite ločena vozlišča za vnos za vsak vir.
  • Normalizirajte metapodatke (naslov, URL, avtor, odsek).
  • Označite kose po viru za boljše filtriranje ob času pridobivanja.
  • Dobro za: Baze znanja, wikiji in notranji portali.

3) Mojstrski tečaj razčlenjevanja: Od naivnih delitev do semantičnih oken

  • Zakaj je odličen: Razčlenjevanje je tisto, kjer se večina kakovosti RAG pridobi ali izgubi.
  • Zgradili boste: Vzporedno oceno strategij razčlenjevanja z meritvami utemeljenosti.
  • Ključni koraki:
  • Primerjajte fiksno velikost, rekurzivno naslavljanje in semantično razčlenjevanje.
  • Uporabite prekrivajoča se okna za tabele in bloke kode.
  • Ocenite natančnost/odzivnost pridobljenih kosov.
  • Nasvet: Kose naj bodo dovolj majhne za ustreznost, vendar dovolj velike za kontekst (pogosto 300–700 žetonov z 10–20 % prekrivanjem).

4) Vdelave v merilu: Zamenjava modelov in vektorskih shramb

  • Zakaj je odličen: Izbira modela tiho odloča o vaši zgornji meji pridobivanja.
  • Zgradili boste: Različico cevovoda, ki zamenja vdelave (npr. text-embedding-3-large, BGE, E5) in vektorske shrambe (FAISS, Milvus, PGVector).
  • Ključni koraki:
  • Izvedite A/B teste pridobivanja z doslednimi poizvedbami.
  • Spremljajte stopnje zadetkov in povprečni recipročni rang (Mean Reciprocal Rank).
  • Izberite kosinusno podobnost proti podobnosti s produktom pike glede na navodila modela.
  • Dobro za: Ekipe, ki se pripravljajo na rast ali optimizacijo stroškovne učinkovitosti.

5) Zaščitni mehanizmi in blaženje halucinacij v RAGFlow

  • Zakaj je odličen: Varnost v produkciji ni neobvezna.
  • Zgradili boste: Cevovod, podprt s pridobivanjem, z omejitvami odgovorov, politikami zavrnitve in preverjanjem navedb.
  • Ključni koraki:
  • Dodajte vozlišče za preverjanje odgovorov, da zagotovite, da vsak odgovor navaja vsaj N virov.
  • Uporabite predlogo navodil, ki prepoveduje ugibanje in zahteva »Ne vem«, ko dokazi manjkajo.
  • Dodajte preverjanje dejstev po generiranju glede na pridobljene kose.

6) RAGFlow za strukturirane podatke: Hibridno pridobivanje SQL + besedila

  • Zakaj je odličen: Mnoga vprašanja združujejo dokumente in baze podatkov.
  • Zgradili boste: Cevovod z dvojnim pridobivalnikom: semantično pridobivanje za dokumente in klicanje orodij za SQL.
  • Ključni koraki:
  • Preusmerite kvantitativna vprašanja v SQL prek klicanja funkcij.
  • Vključite tabelo rezultatov SQL kot artefakt konteksta v LLM.
  • Združite z izrezki dokumentov za pripovedne razlage.

7) Ocenjevanje kakovosti RAG z zlatimi nabori in človeškim pregledom

  • Zakaj je odličen: Brez ocen letite na slepo.
  • Zgradili boste: Ocenjevalni sistem, ki meri utemeljenost, pokritost navedb in koristnost.
  • Ključni koraki:
  • Pripravite 50–200 zlatih parov vprašanj in odgovorov z viri.
  • Nastavite samodejne izvajanja po vsaki spremembi cevovoda.
  • Uporabite točkovanje ujemanja med odgovori modela in zlatimi referencami.

8) RAGFlow v produkciji: Predpomnjenje, časovne omejitve in opazovanje

  • Zakaj je odličen: Produkcija uvaja zakasnitev, omejitve hitrosti in stroškovne omejitve.
  • Zgradili boste: Robusten cevovod s predpomnjenjem zahtev, ponovnimi poskusi in nadzornimi ploščami sledenja.
  • Ključni koraki:
  • Dodajte vektorske in generacijske predpomnilnike, indeksirane s standardiziranimi poizvedbami.
  • Izvedite odmik za ponudnikove težave.
  • Oddajajte razpone/metrike za zakasnitev pridobivanja in uporabo žetonov.

9) Domensko specifični priročniki: Pravni, zdravstveni in podporni

  • Zakaj je odličen: Domenske omejitve spremenijo vse.
  • Zgradili boste: Predloge, ki upoštevajo skladnost, besedišče in vzorce sklepanja na domeno.
  • Ključni koraki:
  • Pravni: dajte prednost odsekom, navedbam z ID-ji odstavkov.
  • Zdravstveni: odstranite identifikacijo PHI, omejite nasvete na smernice.
  • Podpora: integrirajte zgodovino vozovnic; tehtajte nedavne dokumente višje.

10) RAGFlow + klicanje funkcij: Dejanja, ne samo odgovori

  • Zakaj je odličen: Najmočnejši sistemi RAG lahko berejo, sklepajo in delujejo.
  • Zgradili boste: Cevovod, kjer LLM pridobi dokumente, nato pa pokliče orodja – pošiljanje e-pošte, odpiranje vozovnic ali načrtovanje opravil.
  • Ključni koraki:
  • Določite sheme JSON za orodja.
  • Dodajte usmerjevalnik odločitev za ločevanje poizvedb »odgovor« proti »delovanje«.
  • Zabeležite vsak klic orodja z zaščitnimi mehanizmi in odobritvami.

Praktičen načrt: Od vadnice do produkcije v 30 dneh

Uporabite zgornje vadnice v tem štirifaznem načrtu. Obravnavajte to kot svoj »RAGFlow bootcamp«.

1. teden: Temelji in prve zmage

  • Dokončajte vadnico 1 (Hiter začetek) in vadnico 3 (Mojstrski tečaj razčlenjevanja).
  • Izvedite dokazilo o konceptu, ki odgovarja na 20–30 testnih vprašanj iz vaših dokumentov.
  • Dodajte osnovne predloge odgovorov za uveljavljanje navedb in zavrnitev.

2. teden: Globina podatkov in zanesljivost

  • Dodajte vnos iz več virov (vadnica 2) in načrtujte ponovno indeksiranje.
  • Zamenjajte vdelave in vektorsko shrambo (vadnica 4); izberite zmagovalca stroškov/kakovosti.
  • Uvedite predpomnjenje in časovne omejitve (vadnica 8), da ohranite dosledno zakasnitev.

3. teden: Ocene, zaščitni mehanizmi in domenska ustreznost

  • Zgradite zlati nabor in samodejne ocene (vadnica 7).
  • Dodajte preverjanje dejstev po generiranju in politiko zavrnitve (vadnica 5).
  • Uporabite domenski priročnik (vadnica 9) s prilagojenimi pozivi.

4. teden: Hibridno pridobivanje in možnost ukrepanja

  • Povežite SQL/klicanje orodij (vadnica 6) za mešane poizvedbe.
  • Dodajte klicanje funkcij in odobritve (vadnica 10), da bo vaša aplikacija RAGFlow lahko izvajala dejanja.
  • Instrumentirajte nadzorne plošče opazovanja; nastavite SLO za natančnost in zakasnitev.

Koncepti RAGFlow, ki jih morate poznati

Tudi najboljše vadnice RAGFlow predpostavljajo nekaj osrednjih idej. Tukaj je hitra osvežitev.
  • Generiranje, podprto s pridobivanjem (RAG): Razširite kontekst LLM s pridobljenimi kosi iz vaše baze znanja, tako da so odgovori utemeljeni v dokazih.
  • Razčlenjevanje: Razdelitev dokumentov na enote, ki jih je mogoče pridobiti. Prekrivanja ohranjajo kontekst; naslovi ustvarjajo meje; semantične metode uporabljajo vdelave za iskanje naravnih prelomnih točk.
  • Vdelave: Vektorske reprezentacije kosov in poizvedb. Boljše vdelave izboljšajo ustreznost pridobivanja in zmanjšajo halucinacije.
  • Vektorska shramba: Baza podatkov za vektorje s podobnostnim iskanjem. Izbire vplivajo na hitrost, odzivnost in obseg.
  • Ponovno razvrščanje: Izbirni ocenjevalnik druge stopnje za ponovno razvrščanje pridobljenih kosov glede na ustreznost.
  • Oblikovanje pozivov: Jasna navodila za zahtevanje navedb, prepoved ugibanja in oblikovanje izhodnih podatkov.
  • Ocene: Sistematično merjenje z uporabo zlatih naborov, človeškega pregleda in samodejnih metrik.

Začetni komplet za kopiranje in lepljenje: Osnovna predloga poziva RAG

Uporabite to predlogo v svojem vozlišču za generiranje, da zmanjšate halucinacije in uveljavite navedbe.
Ste pazljiv pomočnik, ki odgovarja SAMO z informacijami, ki jih najdete v pridobljenem kontekstu.
Pravila:
- Po vsaki trditvi navedite dokaze z [ime_vira:stran_ali_odsek].
- Če odgovora ni v kontekstu, recite: "Glede na priložene vire ne vem."
- Za definicije dajte prednost neposrednim citatom; za postopke povzemite.
Kontekst:
{{retrieved_context}}
Vprašanje:
{{user_query}}
Odgovor:

Primer: Zamenjava vdelav in merjenje vpliva

# Psevdokoda, ki ponazarja eksperimentalno logiko, ki jo boste videli v naprednih vadnicah
from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness
pipelines = []
for model in ["text-embedding-3-large", "bge-large", "e5-large"]:
emb = EmbeddingNode(model=model)
vs = VectorStoreNode(kind="milvus", metric="cosine")
pl = Pipeline.add_nodes([
"ingest", "chunk", emb, vs, "retrieve", "generate"
])
pipelines.append((model, pl))
h = EvalHarness(goldset="gold_qa.jsonl")
results = {}
for model, pl in pipelines:
results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"])
print(results)
Goljufijski list za razlago:
  • Če utemeljenost poskoči po zamenjavi modela, ga obdržite – tudi če žetoni stanejo nekoliko več.
  • Če se zakasnitev poveča, dodajte predpomnjenje ali zmanjšajte največje število pridobljenih kosov z 8 → 5.
  • Če pokritost navedb pade, prilagodite velikost kosa ali dodajte ponovno razvrščanje.

Pogoste pasti, ki se jim pomagate izogniti s temi vadnicami

  • Prekomerno razčlenjevanje: Premajhni kosi vodijo do manjkajočega konteksta in hrupnih odgovorov.
  • Premalo razčlenjevanja: Ogromni kosi onesnažujejo okna konteksta z nepomembnim besedilom.
  • Vdelave, ki ustrezajo vsem: Domenski jezik (pravni, klinični) lahko zahteva domensko prilagojene modele.
  • Brez ocen: Spreminjanje česar koli brez izhodiščne vrednosti ustvarja fantomske regresije.
  • Ignoriranje svežine: Zastareli indeksi vodijo do pravilnih, a zastarelih odgovorov.
  • Preskakovanje zaščitnih mehanizmov: Brez pravil o zavrnitvi vaš model ugiba.

Izbira prave vadnice za vaš primer uporabe

  • Bot za podporo zagonu: Vadnice 1, 2, 5, 8, 9.
  • Notranji raziskovalni pomočnik: Vadnice 1, 3, 4, 7.
  • Kopilot za podatkovno analitiko: Vadnice 6, 10.
  • Regulirane panoge: Najprej vadnici 5 in 9, nato 7.

Mimogrede: Hitrejši prototip s Sider.AI

Ko ponavljate pozive RAG, preizkušate poizvedbe in primerjate odgovore, je preklapljanje konteksta drago. Omembe vredno: Sider.AI (https://sider.ai/) vam omogoča klepet z več modeli drug ob drugem, pripenjanje pozivov in vzdrževanje delovnega prostora znanja. Priročen je za:
  • Primerjava odgovorov iz različnih nastavitev pridobivanja in pozivov.
  • Izvajanje hitrih preizkusov "kaj če", preden spremembe vgradite v RAGFlow.
  • Organiziranje izrezkov, navedb in zlatih vprašanj in odgovorov za vaš ocenjevalni sistem.
Uporabite ga kot svoj beležnik, medtem ko sledite vadnicam RAGFlow; nato kodificirajte zmagovalca v svojem cevovodu.

Vodnik za odpravljanje težav: Hitre popravke, ko se stvari pokvarijo

  • Simptom: Odgovori so splošni in nimajo navedb.
  • Popravek: Uveljavite zahtevo po navedbi v pozivu in dodajte vozlišče za preverjanje.
  • Simptom: Pridobljeni so nepomembni kosi.
  • Popravek: Povečajte prekrivanje kosov, preklopite na boljši model za vdelavo ali dodajte ponovno razvrščanje.
  • Simptom: Zakasnitev > 3 sekunde.
  • Popravek: Predpomnite vektorske rezultate, omejite pridobljene kose in uporabite pretočne žetone.
  • Simptom: Nasprotujoči si odgovori med poizvedbami.
  • Popravek: Normalizirajte metapodatke, odstranite podvojene skoraj enake kose, stehtajte novejše dokumente.
  • Simptom: Model prepogosto zavrne z »Ne vem«.
  • Popravek: Sprostite prag zavrnitve, razširite globino pridobivanja ali izboljšajte meje kosov.

Ključni zaključki

  • Najboljše vadnice RAGFlow poučujejo sisteme od začetka do konca z realističnimi podatki in ocenami.
  • Razčlenjevanje in vdelave imajo največji vpliv na kakovost odgovorov.
  • Za uspeh v produkciji so potrebni predpomnjenje, opazovanje, zaščitni mehanizmi in zlati nabor.
  • Uporabite domenske priročnike in klicanje funkcij, da presežete vprašanja in odgovore v resnične poteke dela.
  • Izkoristite orodja, kot je Sider.AI, med eksperimentiranjem za hitro primerjavo pozivov in rezultatov.

Kaj storiti naprej

  1. Izberite dve vadnici, ki ustrezata vaši neposredni potrebi (npr. Hiter začetek + Mojstrski tečaj razčlenjevanja).
  1. Sestavite zlati nabor vprašanj in odgovorov iz svojih dokumentov (začnite s 50 vprašanji).
  1. Izvedite eno spremembo naenkrat; po vsaki izmerite utemeljenost in zakasnitev.
  1. Premaknite se na produkcijske predloge s predpomnjenjem in zaščitnimi mehanizmi, ko se vaše ocene stabilizirajo.
  1. Plastite v klicanje funkcij in domenske politike, ko je vaša izhodiščna vrednost zanesljiva.

Pogosta vprašanja

V1:Katera je najboljša vadnica RAGFlow za popolne začetnike? Začnite s hitro vadnico RAGFlow, ki zajema vnos PDF-ja, razčlenjevanje, vdelavo, indeksiranje, pridobivanje in generiranje z navedbami. Hitro vam da občutek od začetka do konca in vas pripravi na globlje vadnice RAGFlow.
V2:Kako lahko izboljšam natančnost v RAGFlow poleg osnovnih vadnic? Osredotočite se na strategijo razčlenjevanja, kakovost vdelav in ponovno razvrščanje. Napredne vadnice RAGFlow prav tako prikazujejo, kako dodati zaščitne mehanizme in ocenjevalne sisteme za zmanjšanje halucinacij in količinsko opredelitev utemeljenosti.
V3:Katere vdelave najbolje delujejo z RAGFlow za dokumente podjetja? Preizkusite močne splošne modele, kot so text-embedding-3-large, E5 ali BGE, nato pa izmerite metrike pridobivanja na svojih podatkih. Najboljše vadnice RAGFlow priporočajo A/B teste med modeli in vektorskimi shrambami, da izberete zmagovalca.
V4:Ali lahko RAGFlow obravnava strukturirane podatke, kot je SQL, skupaj z dokumenti? Da. Vadnice za hibridno pridobivanje za RAGFlow prikazujejo, kako usmerjati kvantitativne poizvedbe v SQL prek klicanja funkcij, medtem ko še vedno uporabljate semantično pridobivanje za nestrukturirane dokumente, nato pa združite rezultate ob času generiranja.
V5:Kako ocenim cevovod RAGFlow, preden grem v živo? Sledite vadnicam RAGFlow, osredotočenim na ocenjevanje: ustvarite zlati nabor vprašanj in odgovorov z viri, izvedite samodejne teste po spremembah in spremljajte utemeljenost, pokritost navedb, zakasnitev in koristnost. Uvedite samo, ko se metrike stabilizirajo.

Novi članki
Kako obvladati ChatPDF: Hitrejši vpogledi v obsežne dokumente

Kako obvladati ChatPDF: Hitrejši vpogledi v obsežne dokumente

Najboljša alternativa X samodejnemu prevajanju za hitre in natančne dokumente

Najboljša alternativa X samodejnemu prevajanju za hitre in natančne dokumente

Samsung AI prevajanje ni na voljo v Iranu? Praktične rešitve

Samsung AI prevajanje ni na voljo v Iranu? Praktične rešitve

Orodja za prevajanje v perzijski jezik: praktičen vodnik za hitrejše in natančno delo

Orodja za prevajanje v perzijski jezik: praktičen vodnik za hitrejše in natančno delo

Najboljša alternativa Groku za poglobljene, citirane raziskave

Najboljša alternativa Groku za poglobljene, citirane raziskave

Top 15 funkcij generatorja slik z umetno inteligenco, ki jih boste dejansko uporabljali

Top 15 funkcij generatorja slik z umetno inteligenco, ki jih boste dejansko uporabljali