Sider.ai
  • Xat
  • Wisebase
  • Eines
  • Extensió
  • Clients
  • Preus
Descarrega ara
iniciar Sessió

Aprèn més ràpid, pensa més profundament i creix més intel·ligent amb Sider.

Productes
Aplicacions
  • Extensions
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Eines
  • Creador de llocs webNew
  • AI SlidesNew
  • Escriptor d'assajos AI
  • Nano Banana Pro
  • Nano Banana Infographic
  • Generador d'imatges AI
  • Generador de Brainrot Italià
  • Eliminador de fons
  • Canviador de fons
  • Esborrador de fotos
  • Eliminador de text
  • Repintar
  • Millorador d'imatges
  • Crear
  • Traductor AI
  • Traductor d'imatges
  • Traductor de PDF
Sider
  • Contacta'ns
  • Centre d'ajuda
  • Descarregar
  • Preus
  • Pla d'Educació
  • Què hi ha de nou
  • Blog
  • Comunitat
  • Socis
  • Afiliat
  • Convida
©2026 Tots els drets reservats
Condicions d'ús
Política de privacitat
  • Pàgina d'inici
  • Bloc
  • Eines d'IA
  • 10 Millors tutorials de RAGFlow per dominar la generació augmentada per recuperació

10 Millors tutorials de RAGFlow per dominar la generació augmentada per recuperació

Actualitzat el 19 Set. 2025

10 min


Els 10 millors tutorials de RAGFlow per dominar la generació augmentada per recuperació

Si alguna vegada has intentat que un model de llenguatge gran respongui a preguntes específiques del domini i l'has vist al·lucinar amb confiança, has sentit el dolor que RAGFlow resol. La generació augmentada per recuperació (RAG) combina una capa de cerca amb la generació perquè el teu model citi fets de les teves pròpies dades. RAGFlow és una manera oberta, visual i basada en pipelines de construir aquest sistema d'extrem a extrem: des de la ingesta de documents fins a la fragmentació, l'embedding, la cerca vectorial i les respostes fonamentades.
En aquesta guia, reunim els millors tutorials de RAGFlow que pots seguir avui, com triar el més adequat per al teu stack i un roadmap pràctic per passar de "hola món" a la producció. Ho mantindrem pragmàtic, amb exemples, problemes i alguns consells poderosos que no trobaràs en els walkthroughs bàsics.
Estem adoptant un enfocament pràctic i orientat a la solució: explicacions breus, passos clars i fragments que es poden copiar i enganxar. Aconseguim que enviïs una aplicació RAGFlow que realment respongui correctament.

Què fa que un tutorial de "millor RAGFlow" sigui el millor?

No tots els tutorials són iguals. Els millors tutorials de RAGFlow comparteixen alguns trets:
  • Flux d'extrem a extrem: Ingesta → fragment → incrustació → index → recuperació → generació, tot en un sol camí.
  • Documents realistes: PDF, HTML, presentacions de diapositives o registres desordenats, no només markdown de joguina.
  • Avaluació integrada: Ensenyen a mesurar el fonament, la latència i la qualitat de la resposta.
  • Preocupacions de producció: Emmagatzematge en memòria cau, reintents, observabilitat i salvaguardes.
  • Extensible: Mostra on canviar models, estratègies de fragmentació o emmagatzematges de vectors.
Tingues en compte aquests criteris mentre tries el teu camí d'aprenentatge.

Els 10 millors tutorials de RAGFlow ara mateix

A continuació, hi ha una llista seleccionada que abasta des de principiant fins a avançat. Cada entrada inclou per què és útil, què construiràs i per a qui és.

1) RAGFlow Quickstart: El teu primer pipeline d'extrem a extrem

  • Per què és genial: La manera més ràpida d'entendre les parts mòbils: perfecte per desbloquejar-se.
  • Construiràs: Un pipeline mínim: puja un PDF, fragmenta automàticament, incrusta, indexa i consulta amb cites.
  • Passos clau:
  1. Activa RAGFlow i obre el constructor de pipelines.
  1. Afegeix un node d'ingestor de fitxers i apunta a un PDF.
  1. Insereix un fragmentador (per exemple, recursiu + encapçalaments) i un node de model d'embedding.
  1. Connecta't a un emmagatzematge de vectors, després afegeix nodes de recuperació i generació LLM.
  1. Prova amb algunes consultes i inspecciona les fonts.
  • Bo per a: Principiants absoluts; equips que validen el flux bàsic de RAGFlow.

2) RAGFlow + Múltiples fonts de dades: PDF, pàgines web i Notion

  • Per què és genial: La majoria dels projectes reals combinen fonts desordenades; aquest tutorial mostra com.
  • Construiràs: Un pipeline que ingereix PDF, rastreja URL i sincronitza pàgines de Notion segons la programació.
  • Passos clau:
  • Utilitza nodes d'ingestor separats per font.
  • Normalitza les metadades (títol, URL, autor, secció).
  • Etiqueta els fragments per font per a un millor filtratge en el moment de la recuperació.
  • Bo per a: Bases de coneixement, wikis i portals interns.

3) Masterclass de fragmentació: De divisions ingènues a finestres semàntiques

  • Per què és genial: La fragmentació és on es guanya o es perd la major part de la qualitat RAG.
  • Construiràs: Una avaluació cara a cara de les estratègies de fragmentació amb mètriques de fonament.
  • Passos clau:
  • Compara la fragmentació de mida fixa, recursiva-encapçalament i semàntica.
  • Utilitza finestres de superposició per a taules i blocs de codi.
  • Avalua la precisió/recuperació dels fragments recuperats.
  • Consell: Mantingues els fragments prou petits per a la rellevància, però prou grans per al context (sovint entre 300 i 700 tokens amb un 10-20% de superposició).

4) Incrustacions a escala: Canvi de models i emmagatzematges de vectors

  • Per què és genial: L'elecció del model decideix silenciosament el teu sostre de recuperació.
  • Construiràs: Una variant de pipeline que canvia les incrustacions (per exemple, text-embedding-3-large, BGE, E5) i els emmagatzematges de vectors (FAISS, Milvus, PGVector).
  • Passos clau:
  • Executa proves de recuperació A/B amb consultes consistents.
  • Fes un seguiment de les taxes d'èxit i del rang recíproc mitjà.
  • Tria la similitud cosinus vs. producte punt per guia del model.
  • Bo per a: Equips que es preparen per al creixement o l'ajustament del cost-rendiment.

5) Salvaguardes i mitigació d'al·lucinacions a RAGFlow

  • Per què és genial: La seguretat no és opcional en la producció.
  • Construiràs: Un pipeline augmentat per recuperació amb restriccions de resposta, polítiques de rebuig i comprovacions de cites.
  • Passos clau:
  • Afegeix un node de validador de respostes per assegurar-te que cada resposta citi almenys N fonts.
  • Utilitza una plantilla d'instruccions que prohibeix endevinar i requereix "No ho sé basant-me en les fonts proporcionades" quan falten proves.
  • Afegeix una comprovació de fets posterior a la generació contra els fragments recuperats.

6) RAGFlow per a dades estructurades: Recuperació híbrida SQL + Text

  • Per què és genial: Moltes preguntes combinen documents i bases de dades.
  • Construiràs: Un pipeline de doble recuperador: recuperació semàntica per a documents i crida d'eines per a SQL.
  • Passos clau:
  • Dirigeix les preguntes quantitatives a SQL mitjançant la crida de funcions.
  • Inclou la taula de resultats SQL com a artefacte de context per a la LLM.
  • Combina amb fragments de documents per a explicacions narratives.

7) Avaluació de la qualitat RAG amb conjunts d'or i revisió humana

  • Per què és genial: Sense avaluacions, estàs volant a cegues.
  • Construiràs: Un arnés d'avaluació que mesura el fonament, la cobertura de cites i la utilitat.
  • Passos clau:
  • Prepara 50-200 parells d'or de preguntes i respostes amb fonts.
  • Configura execucions automàtiques després de cada canvi de pipeline.
  • Utilitza la puntuació d'acord entre les respostes del model i les referències d'or.

8) RAGFlow en producció: Emmagatzematge en memòria cau, temps d'espera i observabilitat

  • Per què és genial: La producció introdueix latència, límits de velocitat i restriccions de costos.
  • Construiràs: Un pipeline robust amb emmagatzematge en memòria cau de sol·licituds, reintents i taulers de control de seguiment.
  • Passos clau:
  • Afegeix memòries cau de vectors i generació amb clau per consultes normalitzades.
  • Implementa la retirada per als problemes del proveïdor.
  • Emet espais/mètriques per a la latència de recuperació i l'ús de tokens.

9) Playbooks específics del domini: Legal, assistència sanitària i suport

  • Per què és genial: Les restriccions de domini canvien tot.
  • Construiràs: Plantilles que respecten el compliment, el vocabulari i els patrons de raonament per domini.
  • Passos clau:
  • Legal: prioritza les seccions, les cites amb els identificadors de paràgraf.
  • Assistència sanitària: desidentifica la PHI, restringeix els consells a les directrius.
  • Suport: integra l'historial de tiquets; pondera els documents recents més alt.

10) RAGFlow + Crida de funcions: Accions, no només respostes

  • Per què és genial: Els sistemes RAG més potents poden llegir, raonar i actuar.
  • Construiràs: Un pipeline on la LLM recupera documents, després crida eines, enviant correus electrònics, obrint tiquets o programant treballs.
  • Passos clau:
  • Defineix esquemes JSON per a les eines.
  • Afegeix un encaminador de decisions per separar les consultes de "resposta" vs. "actuar".
  • Registra cada crida d'eina amb salvaguardes i aprovacions.

Un roadmap pràctic: Del tutorial a la producció en 30 dies

Utilitza els tutorials anteriors en aquest pla de 4 etapes. Tracta això com el teu "camp d'entrenament RAGFlow".

Setmana 1: Fonaments i primeres victòries

  • Completa el tutorial 1 (Quickstart) i el tutorial 3 (Masterclass de fragmentació).
  • Envia una prova de concepte que respongui a 20-30 preguntes de prova dels teus documents.
  • Afegeix plantilles de resposta bàsiques per fer complir les cites i els rebutjos.

Setmana 2: Profunditat de dades i fiabilitat

  • Afegeix la ingesta de múltiples fonts (Tutorial 2) i programa la reindexació.
  • Canvia les incrustacions i l'emmagatzematge de vectors (Tutorial 4); tria el guanyador de cost/qualitat.
  • Introdueix l'emmagatzematge en memòria cau i els temps d'espera (Tutorial 8) per mantenir la latència consistent.

Setmana 3: Avaluacions, salvaguardes i ajust del domini

  • Construeix un conjunt d'or i avaluacions automàtiques (Tutorial 7).
  • Afegeix comprovacions de fets posteriors a la generació i una política de rebuig (Tutorial 5).
  • Aplica un playbook de domini (Tutorial 9) amb prompts personalitzats.

Setmana 4: Recuperació híbrida i capacitat d'acció

  • Connecta la crida d'SQL/eines (Tutorial 6) per a consultes mixtes.
  • Afegeix la crida de funcions i les aprovacions (Tutorial 10) perquè la teva aplicació RAGFlow pugui prendre mesures.
  • Instrumenta els taulers de control d'observabilitat; estableix SLO per a la precisió i la latència.

Conceptes de RAGFlow que has de conèixer

Fins i tot els millors tutorials de RAGFlow assumeixen algunes idees bàsiques. Aquí hi ha un repàs ràpid.
  • Generació augmentada per recuperació (RAG): Augmenta el context de la LLM amb fragments recuperats de la teva base de coneixement perquè les respostes es basin en proves.
  • Fragmentació: Dividir els documents en unitats recuperables. Les superposicions conserven el context; els encapçalaments creen límits; els mètodes semàntics utilitzen incrustacions per trobar punts de ruptura naturals.
  • Incrustacions: Representacions vectorials de fragments i consultes. Les millors incrustacions milloren la rellevància de la recuperació i redueixen les al·lucinacions.
  • Emmagatzematge de vectors: Base de dades per a vectors amb cerca de similitud. Les eleccions afecten la velocitat, la recuperació i l'escala.
  • Reclassificació: Puntuador de segona etapa opcional per reordenar els fragments recuperats per rellevància.
  • Enginyeria de prompt: Instruccions clares per requerir cites, prohibir conjectures i formatar la sortida.
  • Avaluacions: Mesura sistemàtica mitjançant conjunts d'or, revisió humana i mètriques automàtiques.

Inici ràpid de copiar i enganxar: Plantilla de prompt RAG de referència

Utilitza aquesta plantilla en el teu node de generació per reduir les al·lucinacions i fer complir les cites.
Ets un assistent atent que respon NOMÉS amb informació que es troba en el context recuperat.
Regles:
- Cita les proves amb [source_name:page_or_section] després de cada afirmació.
- Si la resposta no es troba en el context, digues "No ho sé basant-me en les fonts proporcionades."
- Prefereix les cites directes per a les definicions; resumeix per als procediments.
Context:
{{retrieved_context}}
Pregunta:
{{user_query}}
Resposta:

Exemple: Canviar incrustacions i mesurar l'impacte

# Pseudocodi que il·lustra la lògica de l'experiment que veuràs en els tutorials avançats
from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness
pipelines = []
for model in ["text-embedding-3-large", "bge-large", "e5-large"]:
emb = EmbeddingNode(model=model)
vs = VectorStoreNode(kind="milvus", metric="cosine")
pl = Pipeline.add_nodes([
"ingest", "chunk", emb, vs, "retrieve", "generate"
])
pipelines.append((model, pl))
h = EvalHarness(goldset="gold_qa.jsonl")
results = {}
for model, pl in pipelines:
results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"])
print(results)
Full de trucs d'interpretació:
  • Si el fonament salta després del canvi de model, mantingues-lo, fins i tot si els tokens costen una mica més.
  • Si la latència augmenta, afegeix l'emmagatzematge en memòria cau o redueix el nombre màxim de fragments recuperats de 8 → 5.
  • Si la cobertura de cites disminueix, ajusta la mida del fragment o afegeix la reclassificació.

Errors comuns que aquests tutorials t'ajuden a evitar

  • Sobre-fragmentació: Els fragments massa petits condueixen a la pèrdua de context i a respostes sorolloses.
  • Sub-fragmentació: Els fragments enormes contaminen les finestres de context amb text irrelevant.
  • Incrustacions de talla única: El llenguatge de domini (legal, clínic) pot requerir models ajustats al domini.
  • Sense avaluacions: Canviar res sense una línia de base crea regressions fantasma.
  • Ignorar la frescor: Els índexs obsolets condueixen a respostes correctes però obsoletes.
  • Ometre les salvaguardes: Sense regles de rebuig, el teu model endevina.

Seleccionar el tutorial adequat per al teu cas d'ús

  • Bot de suport per a startups: Tutorials 1, 2, 5, 8, 9.
  • Assistent de recerca intern: Tutorials 1, 3, 4, 7.
  • Copilot d'anàlisi de dades: Tutorials 6, 10.
  • Indústries regulades: Tutorials 5 i 9 primer, després 7.

Per cert: Prototipa més ràpid amb Sider.AI

Quan estàs iterant en prompts RAG, provant consultes i comparant respostes, el canvi de context és costós. Val la pena assenyalar: Sider.AI (https://sider.ai/) et permet xatejar amb múltiples models cara a cara, fixar prompts i mantenir un espai de treball de coneixement en execució. És útil per a:
  • Comparar respostes de diferents configuracions de recuperació i prompts.
  • Executar proves ràpides de què passaria si abans d'incorporar canvis a RAGFlow.
  • Organitzar fragments, cites i preguntes i respostes d'or per al teu arnés d'avaluació.
Utilitza'l com el teu bloc de notes mentre segueixes els tutorials de RAGFlow; després codifica el guanyador en el teu pipeline.

Guia de resolució de problemes: Solucions ràpides quan les coses es trenquen

  • Símptoma: Les respostes són genèriques i no tenen cites.
  • Solució: Aplica el requisit de cites en el prompt i afegeix un node validador.
  • Símptoma: Fragments irrellevants recuperats.
  • Solució: Augmenta la superposició de fragments, canvia a un millor model d'embedding o afegeix la reclassificació.
  • Símptoma: Latència > 3 segons.
  • Solució: Emmagatzema en memòria cau els resultats vectorials, limita els fragments recuperats i utilitza tokens de transmissió.
  • Símptoma: Respostes contradictòries entre consultes.
  • Solució: Normalitza les metadades, desduplica els fragments gairebé idèntics, pondera els documents més nous.
  • Símptoma: El model es nega massa sovint amb "No ho sé".
  • Solució: Afluixa el llindar de rebuig, expandeix la profunditat de recuperació o refina els límits de fragments.

Conclusions clau

  • Els millors tutorials de RAGFlow ensenyen sistemes d'extrem a extrem amb dades i avaluacions realistes.
  • La fragmentació i les incrustacions tenen el major impacte en la qualitat de la resposta.
  • L'èxit de la producció requereix l'emmagatzematge en memòria cau, l'observabilitat, les salvaguardes i un conjunt d'or.
  • Utilitza playbooks de domini i crida de funcions per anar més enllà de les preguntes i respostes cap a fluxos de treball reals.
  • Aprofita eines com Sider.AI durant l'experimentació per comparar prompts i resultats ràpidament.

Què fer després

  1. Tria dos tutorials que coincideixin amb la teva necessitat immediata (per exemple, Quickstart + Masterclass de fragmentació).
  1. Reuneix un conjunt d'or de preguntes i respostes dels teus propis documents (comença amb 50 preguntes).
  1. Executa un canvi a la vegada; mesura el fonament i la latència després de cada un.
  1. Mou-te a les plantilles de producció amb l'emmagatzematge en memòria cau i les salvaguardes quan les teves avaluacions s'estabilitzin.
  1. Afegeix la crida de funcions i les polítiques de domini una vegada que la teva línia de base sigui fiable.

Preguntes freqüents

P1: Quin és el millor tutorial de RAGFlow per a principiants absoluts? Comença amb un tutorial d'inici ràpid de RAGFlow que cobreixi la ingesta d'un PDF, la fragmentació, la incrustació, la indexació, la recuperació i la generació amb cites. Et dóna una sensació d'extrem a extrem ràpid i et prepara per a tutorials de RAGFlow més profunds.
P2: Com puc millorar la precisió a RAGFlow més enllà dels tutorials bàsics? Centra't en l'estratègia de fragmentació, la qualitat de les incrustacions i la reclassificació. Els tutorials avançats de RAGFlow també mostren com afegir salvaguardes i arnesos d'avaluació per reduir les al·lucinacions i quantificar el fonament.
P3: Quines incrustacions funcionen millor amb RAGFlow per a documents empresarials? Prova models generals forts com text-embedding-3-large, E5 o BGE, després mesura les mètriques de recuperació a les teves dades. Els millors tutorials de RAGFlow recomanen proves A/B entre models i emmagatzematges de vectors per triar el guanyador.
P4: Pot RAGFlow gestionar dades estructurades com SQL juntament amb documents? Sí. Els tutorials de recuperació híbrida per a RAGFlow mostren com dirigir les consultes quantitatives a SQL mitjançant la crida de funcions, mentre que encara utilitzen la recuperació semàntica per a documents no estructurats, després combinen els resultats en el moment de la generació.
P5: Com puc avaluar un pipeline RAGFlow abans de posar-lo en marxa? Segueix els tutorials de RAGFlow centrats en l'avaluació: crea un conjunt d'or de preguntes i respostes amb fonts, executa proves automatitzades després dels canvis i fes un seguiment del fonament, la cobertura de cites, la latència i la utilitat. Només desplega quan les mètriques s'estabilitzin.

Articles Recents
Com dominar ChatPDF: obtenir informació més ràpidament de documents densos

Com dominar ChatPDF: obtenir informació més ràpidament de documents densos

La millor alternativa a X Auto-Translation per a documents ràpids i precisos

La millor alternativa a X Auto-Translation per a documents ràpids i precisos

La traducció AI de Samsung no està disponible a l'Iran? Solucions pràctiques

La traducció AI de Samsung no està disponible a l'Iran? Solucions pràctiques

Eines de traducció persa: una guia pràctica per a un treball més ràpid i precís

Eines de traducció persa: una guia pràctica per a un treball més ràpid i precís

La millor alternativa a Grok per a una recerca profunda i citada

La millor alternativa a Grok per a una recerca profunda i citada

Les 15 millors funcions del generador d'imatges d'IA que realment utilitzaràs

Les 15 millors funcions del generador d'imatges d'IA que realment utilitzaràs