10 labākie RAGFlow mācību materiāli, lai apgūtu Retrieval-Augmented Generation
Ja kādreiz esi centies likt lielajam valodas modelim atbildēt uz konkrētas nozares jautājumiem un redzējis, kā tas pārliecinoši izdomā atbildes, tad zini to problēmu, ko RAGFlow risina. Retrieval-Augmented Generation (RAG) apvieno meklēšanas slāni ar ģenerēšanu, lai tavs modelis balstītos uz faktiem no tava paša datu kopuma. RAGFlow ir atvērts, vizuāls un caur plūsmas soļiem vadāms veids, kā izveidot šo sistēmu no gala līdz galam — sākot ar dokumentu importēšanu, dalīšanu, iegulšanu, vektoru meklēšanu un balstītām atbildēm.
Šajā ceļvedī apkopojam labākos RAGFlow mācību materiālus, ko varat sākt izmantot jau šodien, kā izvēlēties piemērotāko savam tehnoloģiju komplektam un praktisku ceļvedi, kā no "hello world" nonākt līdz ražošanā gatavai sistēmai. Saglabāsim pragmatismu ar piemēriem, riskiem un dažiem paņēmieniem, ko nevar atrast pamata instrukcijās.
Mūsu pieeja ir praktiska un risinājumiem orientēta: īsas skaidrojošas sadaļas, skaidri soļi un gatavas kodiņu daļas kopēšanai. Palīdzēsim tev palaist RAGFlow lietotni, kas patiesi atbild pareizi.
Kas raksturo “labāko RAGFlow mācību materiālu”?
Ne visi mācību materiāli ir vienlīdz labi. Labākie RAGFlow materiāli apvieno vairākas īpašības:
- Pilns process no sākuma līdz beigām: Importē → dala → iegulda → indeksē → atrod → ģenerē, viss vienā plūsmā.
- Reālistiski dokumenti: PDF, HTML, prezentācijas vai haotiski žurnāli — ne tikai vienkārši markdown faili.
- Iebūvēta vērtēšana: Mācība par to, kā izmērīt atbilstību faktiem, aizturi un atbilžu kvalitāti.
- Ražošanas vajadzības: Kešošana, atkārtojumi, novēršana un drošības barjeras.
- Paplašināmība: Parāda, kur var aizvietot modeļus, dalīšanas stratēģijas vai vektoru datubāzes.
Ņem vērā šos kritērijus, izvēloties savu apguves ceļu.
10 labākie RAGFlow mācību materiāli šobrīd
Zemāk ir atlasīts saraksts no iesācēja līdz ekspertam. Katrs ieraksts ietver, kāpēc tas ir noderīgs, ko tu izveidosi un kam tas ir domāts.
1) RAGFlow Quickstart: Tavs pirmais pilna procesa ceļš
- Kāpēc tas ir labs: Ātrākais veids, kā saprast procesā iesaistītās daļas — ideāli, lai ātri iesāktu.
- Ko būsi izveidojis: Vienkārša plūsma: augšupielādē PDF, automātiski dala, iegulda, indeksē un veic vaicājumus ar atsaucēm.
- Palaid RAGFlow un atver plūsmas veidotāju.
- Pievieno failu importētāja mezglu un norādi PDF failu.
- Ievieto dalītāju (piemēram, rekursīvu ar galvenēm) un iegūšanas mezglu ar iegulšanas modeli.
- Savieno ar vektoru krātuvi, pēc tam pievieno meklēšanas un LLM ģenerēšanas mezglus.
- Testē ar dažiem vaicājumiem un pārbaudi avotus.
- Labāk piemērots: Pilnīgiem iesācējiem; komandām, kas pārbauda RAGFlow pamata plūsmu.
2) RAGFlow + daudzi datu avoti: PDF, tīmekļa lapas un Notion
- Kāpēc tas ir labs: Lielākā daļa reālu projektu apvieno dažādus haotiskus avotus; šis materiāls rāda, kā to izdarīt.
- Ko būsi izveidojis: Plūsma, kas importē PDF, pārlūko URL un sinhronizē Notion lapas pēc grafika.
- Izmanto atsevišķus importētāju mezglus katram avotam.
- Normalizē metadatus (nosaukums, URL, autors, sadaļa).
- Atzīmē fragmentus ar avotiem, lai labāk filtrētu meklēšanas laikā.
- Labāk piemērots: Zināšanu bāzēm, vikiem un iekšējiem portāliem.
3) Dalīšanas meistarklase: no primitīviem sadalījumiem līdz semantiskām logām
- Kāpēc tas ir labs: Dalīšanai ir izšķiroša nozīme RAG kvalitātē.
- Ko būsi izveidojis: Blakus vērtējums dažādām dalīšanas stratēģijām ar balstīšanās mērījumiem.
- Salīdzini fiksēta izmēra, rekursīvus galvenes un semantiskos dalījumus.
- Izmanto pārklājošus logus tabulām un koda blokiem.
- Novērtē atgūto fragmentu precizitāti/atsauksmju attiecību.
- Padoms: Fragmenti jānotur pietiekami mazi, lai būtu relevanti, bet gana lieli konteksta nodrošināšanai (parasti 300–700 tokenu ar 10–20% pārklājumu).
4) Iegulšanas mērogošana: modeļu un vektoru krātuvju aizvietošana
- Kāpēc tas ir labs: Modeļu izvēle klusējoši nosaka tavus meklēšanas ierobežojumus.
- Ko būsi izveidojis: Plūsmas varianti, kas aizvieto iegulšanas modeļus (piemēram,
text-embedding-3-large, BGE, E5) un vektoru datubāzes (FAISS, Milvus, PGVector).
- Veic A/B meklēšanas testus ar konsekventiem vaicājumiem.
- Se ko hit rate un vidējo apgriezto vietu.
- Izvēlies kosinusa versus skaitliskās reizināšanas līdzību saskaņā ar modeļa ieteikumiem.
- Labāk piemērots: Komandām, kas gatavojas izaugsmei vai izmaksu-performances pielāgošanai.
5) Drošības barjeras un halucināciju mazināšana RAGFlow
- Kāpēc tas ir labs: Drošība ražošanā nav izvēle.
- Ko būsi izveidojis: Meklēšanas paplašināta plūsma ar atbilžu ierobežojumiem, atteikšanās politiku un atsauču pārbaudēm.
- Pievieno atbildes validācijas mezglu, kas prasa vismaz N avotus katrai atbildei.
- Izmanto instrukciju šablonu, kas aizliedz minēt un prasa “Es nezinu” situācijās bez pierādījumiem.
- Pievieno post-ģenerēšanas faktu pārbaudi pret atgūtiem fragmentiem.
6) RAGFlow strukturētiem datiem: SQL + teksta hibrīdatskaņošana
- Kāpēc tas ir labs: Daudzi jautājumi apvieno dokumentus un datubāzes.
- Ko būsi izveidojis: Divu meklētāju plūsma: semantiskā meklēšana dokumentiem un funkciju izsaukšana SQL.
- Nosūti kvantitatīvos jautājumus uz SQL ar funkciju izsaukšanu.
- Iekļauj SQL rezultātu tabulu kā konteksta sastāvdaļu LLM.
- Apvieno ar dokumentu fragmentiem, lai veidotu paskaidrojošas atbildes.
7) RAG kvalitātes vērtēšana ar zelta kopām un cilvēku pārskatīšanu
- Kāpēc tas ir labs: Bez vērtējuma tu darbojas uz dullo.
- Ko būsi izveidojis: Vērtēšanas sistēmu, kas mēra balstītību, atsauču segumu un noderīgumu.
- Sagatavo 50–200 zelta Q&A pārus ar avotiem.
- Piedāvā automātiskas pārbaudes pēc katras plūsmas izmaiņas.
- Izmanto atbilstības punktu skaitīšanu starp modeļa atbildēm un zelta atsaucēm.
8) RAGFlow ražošanā: kešošana, termiņi un novērošana
- Kāpēc tas ir labs: Ražošana pievieno aizturi, ātruma ierobežojumus un izmaksu apsvērumus.
- Ko būsi izveidojis: Stabila plūsma ar vaicājumu kešošanu, atkārtojumiem un ieskatu paneļiem.
- Pievieno vektoru un ģenerēšanas kešus, atslēgotus pēc normalizētiem vaicājumiem.
- Ieviest atkāpes mēģinājumus pakalpojumu sniedzēja problēmu gadījumos.
- Izvadīt laika logus/metriku par meklēšanas aizturi un tokenu izmantošanu.
9) Nozares specifiski rokasgrāmatas: juridiskā, veselības aprūpe un atbalsts
- Kāpēc tas ir labs: Nozares ierobežojumi ietekmē pilnīgi visu.
- Ko būsi izveidojis: Šablonus, kas ievēro atbilstību, terminoloģiju un domāšanas modeļus katrā nozarē.
- Juridiskā: prioritizē sadaļas, atsauces ar rindkopu ID.
- Veselības aprūpe: noņem personas datus (PHI), ierobežo padomus līdz vadlīnijām.
- Atbalsts: integrē biļešu vēsturi; piešķir augstāku svaru jaunākiem dokumentiem.
10) RAGFlow + funkciju izsaukšana: darbības, ne tikai atbildes
- Kāpēc tas ir labs: Spēcīgākās RAG sistēmas spēj lasīt, domāt un rīkoties.
- Ko būsi izveidojis: Plūsmu, kur LLM meklē dokumentus, tad izsauc rīkus — sūta e-pastus, atver biļetes vai plāno darbus.
- Definē JSON shēmas rīkiem.
- Pievieno lēmumu maršrutētāju, kas atdala "atbildes" un "rīcības" vaicājumus.
- Ieraksti katru rīka izsaukumu ar drošības barjerām un apstiprinājumiem.
Praktisks ceļvedis: no mācībām līdz ražošanai 30 dienās
Izmanto iepriekš minētos materiālus šādā 4 posmu plānā. Uztver to kā savu “RAGFlow bootcamp”.
1. nedēļa: pamati un pirmie panākumi
- Pabeidz 1. un 3. materiālu (Quickstart un Chunking Masterclass).
- Izstrādā koncepcijas pierādījumu, kas atbild uz 20–30 testjautājumiem no taviem dokumentiem.
- Pievieno pamata atbilžu šablonus, lai nodrošinātu atsauces un atteikšanos.
2. nedēļa: datu dziļums un drošība
- Pievieno vairāku avotu importu (materiāls 2) un ieplāno pārrindošanu.
- Aizvieto iegulšanas modeļus un vektoru krātuvi (materiāls 4); izvēlies izmaksu/kvalitātes uzvarētāju.
- Ievies kešošanu un termiņus (materiāls 8), lai saglabātu vienmērīgu aizturi.
3. nedēļa: vērtēšana, drošības barjeras un nozares pielāgošana
- Izveido zelta kopu un automātiskas vērtēšanas (materiāls 7).
- Pievieno post-ģenerēšanas faktu pārbaudes un atteikšanās politiku (materiāls 5).
- Pielieto nozares rokasgrāmatu (materiāls 9) ar pielāgotiem promptiem.
4. nedēļa: hibrīdmežģināšana un darbspēja
- Savieno SQL/rīku izsaukšanu (materiāls 6) jauktiem vaicājumiem.
- Pievieno funkciju izsaukšanu un apstiprinājumus (materiāls 10), lai tava RAGFlow lietotne varētu veikt darbības.
- Ierīko novērošanas paneļus; uzstādi SLO precizitātei un aizturei.
Svarīgākās RAGFlow jēdzieni, ko jāzina
Pat labākie materiāli pieņem dažas pamatidejas. Šeit īss atsvaidzinājums.
- Retrieval Augmented Generation (RAG): Paplašini LLM kontekstu ar fragmentiem no tavas zināšanu bāzes, lai atbildes būtu balstītas pierādījumos.
- Dalīšana: dokumentu sadalīšana atgūstamās vienībās. Pārklāšanās saglabā kontekstu; galvenes nosaka robežas; semantiskās metodes izmanto iegulšanas, lai atrastu dabiskas pārrāvumu vietas.
- Iegulsmes: vektoru attēlojumi fragmentiem un vaicājumiem. Labākas iegulsmes uzlabo meklēšanas precizitāti un samazina halucinācijas.
- Vektoru krātuve: vektoru datubāze ar līdzības meklēšanu. Izvēles ietekmē ātrumu, atsaukšanu un mērogojamību.
- Pārkārtošana: izvēles otrā kārtas rīks, lai pārkārtotu atrastos fragmentus pēc atbilstības.
- Promptu inženierija: skaidras instrukcijas, kas prasa atsauces, aizliedz minēt un formatē izvadi.
- Vērtēšana: sistemātiska mērīšana ar zelta komplektiem, cilvēku pārskatīšanu un automātiskām metriku metodēm.
Kopē un ielīmē sākotnējo: pamata RAG prompta šablons
Izmanto šo šablonu ģenerēšanas mezglā, lai samazinātu halucinācijas un nodrošinātu atsauces.
Tu esi uzmanīgs asistents, kas atbild TIKAI ar informāciju no atgūtā konteksta.
Noteikumi:
- Katras apgalvojuma beigās atsaucies uz avotu ar [source_name:page_or_section].
- Ja atbilde nav kontekstā, saki "Es nezinu, pamatojoties uz sniegtajiem avotiem."
- Definīciju gadījumā dod priekšroku tiešām citātēm; procedūrām apkopo.
Konteksts:
{{retrieved_context}}
Jautājums:
{{user_query}}
Atbilde:
Piemērs: iegulšanas modeļu aizvietošana un ietekmes mērīšana
# pseido kods, kas ilustrē eksperimenta loģiku, ko redzēsi padziļinātos materiālos
from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness
pipelines = []
for model in ["text-embedding-3-large", "bge-large", "e5-large"]:
emb = EmbeddingNode(model=model)
vs = VectorStoreNode(kind="milvus", metric="cosine")
pl = Pipeline.add_nodes([
"ingest", "chunk", emb, vs, "retrieve", "generate"
])
pipelines.append((model, pl))
h = EvalHarness(goldset="gold_qa.jsonl")
results = {}
for model, pl in pipelines:
results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"])
print(results)
Interpretācijas atgādinājums:
- Ja balstītība kāpj pēc modeļa maiņas, saglabā to pat, ja tokenu izmaksas nedaudz pieaug.
- Ja aizture palielinās, pievieno kešošanu vai samazini maksimāli atgūsto fragmentu skaitu no 8 līdz 5.
- Ja atsauču pārklājums sarūk, koriģē fragmenta izmēru vai pievieno pārkārtošanu.
Biežākie riski, ko šie materiāli palīdz izvairīties
- Pārāk smalka dalīšana: pārāk mazi fragmenti noved pie trūkstoša konteksta un trokšņainām atbildēm.
- Pārāk liela dalīšana: lieli fragmenti piesārņo konteksta logus ar nerelevantu tekstu.
- Viena izmēra iegulsmes: Nozares valodām (juridiskā, medicīna) vajag nozares pielāgotus modeļus.
- Bez vērtēšanas: jebkādas izmaiņas bez pamata rada fantoma regresijas.
- Freshness ignorēšana: novecojuši indeksi noved pie pareizām, bet novecojušām atbildēm.
- Drošības barjeru neievērošana: bez atteikšanās noteikumiem modelis min un var kļūdīties.
Kā izvēlēties piemērotāko materiālu savai vajadzībai
- Startapa atbalsta bots: materiāli 1, 2, 5, 8, 9.
- Iekšējais pētniecības asistents: materiāli 1, 3, 4, 7.
- Datu analīzes palīgs: materiāli 6, 10.
- Regulētas nozares: vispirms 5 un 9, pēc tam 7.
Starp citu: ātrāk veido prototipus ar Sider.AI
Kad tu iterē RAG promptus, testē vaicājumus un salīdzini atbildes, konteksta maiņa prasa laiku. Vērts zināt: Sider.AI (https://sider.ai/) ļauj sarunāties ar vairākiem modeļiem vienlaikus, piespraust promptus un uzturēt zināšanu darba telpu. Tas noder šādiem uzdevumiem: - Salīdzināt atbildes no dažādiem meklēšanas iestatījumiem un promptiem.
- Veikt ātras "kas būtu, ja" pārbaudes pirms izmaiņu ieviešanas RAGFlow.
- Kārtot fragmentus, atsauces un zelta Q&A savam vērtēšanas rīkam.
Izmanto to kā piezīmju grāmatiņu, kamēr seko RAGFlow apmācībām; tad ieviest uzvarētāju savā plūsmā.
Problēmu novēršanas ceļvedis: ātri risinājumi, ja kas aiziet greizi
- Simptoms: atbildes ir vispārīgas un bez atsaucēm.
- Risinājums: nodrošini atsauču prasību promptā un pievieno validācijas mezglu.
- Simptoms: atgūtie fragmenti nav saistīti ar jautājumu.
- Risinājums: palielini fragmentu pārklājumu, nomaini uz labāku iegulšanas modeli vai pievieno pārkārtošanu.
- Simptoms: aizture pārsniedz 3 sekundes.
- Risinājums: kešo vektoru rezultātus, ierobežo atgūsto fragmentu skaitu un izmanto tokenu straumēšanu.
- Simptoms: pretrunīgas atbildes dažādos vaicājumos.
- Risinājums: normalizē metadatus, dzēs gandrīz identiskus fragmentus, piešķir lielāku svaru jaunākiem dokumentiem.
- Simptoms: modelis pārāk bieži atsakās ar "Es nezinu."
- Risinājums: atslābini atteikšanās slieksni, palielini meklēšanas dziļumu vai uzlabo fragmentu robežas.
Galvenās atziņas
- Labākie RAGFlow materiāli māca pilna procesa sistēmas ar reāliem datiem un vērtēšanu.
- Dalīšana un iegulsmes visvairāk ietekmē atbilžu kvalitāti.
- Ražošanā jādomā par kešošanu, novērošanu, drošības barjerām un zelta kopu.
- Izmanto nozares rokasgrāmatas un funkciju izsaukšanu, lai pārvarētu vienkāršu jautājumu un atbilžu ierobežojumus un iekļautu reālus darba procesus.
- Eksperimentējot, izmanto tādus rīkus kā Sider.AI, lai ātri salīdzinātu promptus un rezultātus.
Ko darīt tālāk
- Izvēlies divus mācību materiālus, kas visvairāk atbilst tavai tūlītējai vajadzībai (piemēram, Quickstart + Chunking Masterclass).
- Savāc zelta Q&A komplektu no saviem dokumentiem (sāc ar 50 jautājumiem).
- Veic pa vienai izmaiņai, mēri balstītību un aizturi pēc katras no tām.
- Kad vērtējumi stabilizējas, pārej uz ražošanas šabloniem ar kešošanu un drošības barjerām.
- Pievieno funkciju izsaukšanu un nozares politikas, kad tava pamata plūsma ir stabila.
BUJ
J1: Kurš ir labākais RAGFlow materiāls pilnīgiem iesācējiem?
Sāc ar RAGFlow Quickstart mācību materiālu, kurā aptver PDF importēšanu, dalīšanu, iegulšanu, indeksēšanu, atgūšanu un ģenerēšanu ar atsaucēm. Tas ātri sniedz pilna procesa pārskatu un sagatavo dziļākām RAGFlow mācībām.
J2: Kā uzlabot precizitāti RAGFlow ārpus pamata materiāliem?
Koncentrējies uz dalīšanas stratēģiju, iegulšanas kvalitāti un pārkārtošanu. Padziļinātos materiālos arī rāda, kā pievienot drošības barjeras un vērtēšanas rīkus halucināciju samazināšanai un balstītības kvantificēšanai.
J3: Kuras iegulsmes vislabāk der RAGFlow uzņēmumu dokumentiem?
Izmēģini spēcīgus vispārīgus modeļus kā text-embedding-3-large, E5 vai BGE, pēc tam mērīšanas metrikas uz sava datu kopuma. Labākie materiāli iesaka A/B testus starp modeļiem un vektoru krātuvēm, lai izvēlētos uzvarētāju.
J4: Vai RAGFlow var apstrādāt strukturētos datus kā SQL kopā ar dokumentiem?
Jā. Hibrīdmeklēšanas materiāli rāda, kā kvantitatīvos vaicājumus virzīt uz SQL, izmantojot funkciju izsaukšanu, kamēr semantiskā meklēšana izmantojama nestrukturētiem dokumentiem, un apvienot rezultātus ģenerēšanas brīdī.
J5: Kā novērtēt RAGFlow plūsmu pirms darbības uzsākšanas?
Izmanto vērtēšanas orientētos materiālus: izveido zelta jautājumu/atbilžu kopu ar avotiem, palaid automātiskos testus pēc izmaiņām un seko balstītībai, atsauču pārklājumam, aizturei un noderīgumam. Izvieto tikai tad, kad metri stabilizējas.