What is the best RAGFlow tutorial for absolute beginners?

Start with a RAGFlow quickstart tutorial that covers ingesting a PDF, chunking, embedding, indexing, retrieving, and generating with citations. It gives you an end-to-end feel fast and sets you up for deeper RAGFlow tutorials.

How do I improve accuracy in RAGFlow beyond basic tutorials?

Focus on chunking strategy, embeddings quality, and reranking. Advanced RAGFlow tutorials also show how to add guardrails and evaluation harnesses to reduce hallucinations and quantify groundedness.

Which embeddings work best with RAGFlow for enterprise docs?

Try strong general models like text-embedding-3-large, E5, or BGE, then measure retrieval metrics on your data. The best RAGFlow tutorials recommend A/B tests across models and vector stores to pick the winner.

Can RAGFlow handle structured data like SQL along with documents?

Yes. Hybrid retrieval tutorials for RAGFlow show how to route quantitative queries to SQL via function calling while still using semantic retrieval for unstructured docs, then merge results at generation time.

How do I evaluate a RAGFlow pipeline before going live?

Follow evaluation-focused RAGFlow tutorials: create a golden Q&A set with sources, run automated tests after changes, and track groundedness, citation coverage, latency, and helpfulness. Only deploy when metrics stabilize.

10 najlepszych samouczków RAGFlow do opanowania generowania wspomaganego wyszukiwaniem (Retrieval-Augmented Generation)

Jeśli kiedykolwiek próbowałeś nakłonić duży model językowy do odpowiadania na pytania specyficzne dla danej dziedziny i obserwowałeś, jak z pewnością siebie halucynuje, to poczułeś ból, który rozwiązuje RAGFlow. Generowanie wspomagane wyszukiwaniem (RAG) łączy warstwę wyszukiwania z generowaniem, dzięki czemu twój model cytuje fakty z twoich własnych danych. RAGFlow to otwarty, wizualny sposób oparty na potokach do budowania systemu od końca do końca — od pobierania dokumentów po dzielenie na fragmenty, osadzanie, wyszukiwanie wektorowe i ugruntowane odpowiedzi.

W tym przewodniku zebraliśmy najlepsze samouczki RAGFlow, z których możesz skorzystać już dziś, jak wybrać odpowiedni dla swojego stosu i praktyczny plan działania, aby przejść od „hello world” do produkcji. Zachowamy pragmatyczne podejście, z przykładami, pułapkami i kilkoma zaawansowanymi wskazówkami, których nie znajdziesz w podstawowych instrukcjach.

Przyjmujemy podejście praktyczne i zorientowane na rozwiązania: krótkie wyjaśnienia, jasne kroki i fragmenty kodu, które można kopiować i wklejać. Sprawimy, że dostarczysz aplikację RAGFlow, która faktycznie odpowiada poprawnie.

Co sprawia, że samouczek „Najlepszy samouczek RAGFlow” jest najlepszy?

Nie wszystkie samouczki są sobie równe. Najlepsze samouczki RAGFlow mają kilka cech wspólnych:

Przepływ end-to-end: Pobieranie → dzielenie na fragmenty → osadzanie → indeksowanie → wyszukiwanie → generowanie, wszystko w jednej ścieżce.

Realistyczne dokumenty: Pliki PDF, HTML, prezentacje slajdów lub zagmatwane dzienniki — nie tylko zabawkowy markdown.

Wbudowana ocena: Uczą, jak mierzyć ugruntowanie, opóźnienia i jakość odpowiedzi.

Kwestie produkcyjne: Buforowanie, ponawianie prób, obserwowalność i zabezpieczenia.

Rozszerzalność: Pokazują, gdzie wymieniać modele, strategie dzielenia na fragmenty lub magazyny wektorowe.

Pamiętaj o tych kryteriach, wybierając ścieżkę uczenia się.

10 najlepszych samouczków RAGFlow w tej chwili

Poniżej znajduje się lista starannie dobranych pozycji, od początkujących do zaawansowanych. Każda pozycja zawiera informacje o tym, dlaczego jest przydatna, co zbudujesz i dla kogo jest przeznaczona.

1) Szybki start z RAGFlow: Twój pierwszy potok end-to-end

Dlaczego jest świetny: Najszybszy sposób na zrozumienie ruchomych części — idealny do odblokowania.

Zbudujesz: Minimalny potok: prześlij plik PDF, automatycznie podziel na fragmenty, osadź, indeksuj i wysyłaj zapytania z cytatami.

Kluczowe kroki:

Uruchom RAGFlow i otwórz kreator potoków.

Dodaj węzeł pobierania plików i wskaż plik PDF.

Wstaw fragmentator (np. rekurencyjny + nagłówki) i węzeł modelu osadzania.

Połącz się z magazynem wektorowym, a następnie dodaj węzły pobierania i generowania LLM.

Przetestuj za pomocą kilku zapytań i sprawdź źródła.

Dobry dla: Absolutnych początkujących; zespołów walidujących podstawowy przepływ RAGFlow.

2) RAGFlow + wiele źródeł danych: Pliki PDF, strony internetowe i Notion

Dlaczego jest świetny: Większość prawdziwych projektów łączy zagmatwane źródła; ten samouczek pokazuje, jak to zrobić.

Zbudujesz: Potok, który pobiera pliki PDF, przeszukuje adresy URL i synchronizuje strony Notion zgodnie z harmonogramem.

Kluczowe kroki:

Użyj oddzielnych węzłów pobierania dla każdego źródła.

Znormalizuj metadane (tytuł, adres URL, autor, sekcja).

Oznacz fragmenty według źródła, aby lepiej filtrować w czasie pobierania.

Dobry dla: Baz wiedzy, wiki i portali wewnętrznych.

3) Klasa mistrzowska dzielenia na fragmenty: Od naiwnych podziałów po okna semantyczne

Dlaczego jest świetny: Dzielenie na fragmenty to miejsce, w którym zyskuje się lub traci większość jakości RAG.

Zbudujesz: Porównanie strategii dzielenia na fragmenty z metrykami ugruntowania.

Kluczowe kroki:

Porównaj stały rozmiar, nagłówki rekurencyjne i dzielenie semantyczne na fragmenty.

Użyj okien nakładających się dla tabel i bloków kodu.

Oceń precyzję/odzyskiwanie pobranych fragmentów.

Wskazówka: Utrzymuj fragmenty wystarczająco małe, aby były istotne, ale wystarczająco duże, aby zawierały kontekst (często 300–700 tokenów z 10–20% nakładaniem się).

4) Osadzanie na dużą skalę: Wymiana modeli i magazynów wektorowych

Dlaczego jest świetny: Wybór modelu po cichu decyduje o twoim pułapie pobierania.

Zbudujesz: Wariant potoku, który zamienia osadzanie (np. text-embedding-3-large, BGE, E5) i magazyny wektorowe (FAISS, Milvus, PGVector).

Kluczowe kroki:

Uruchom testy pobierania A/B ze spójnymi zapytaniami.

Śledź współczynniki trafień i średnią odwrotną rangę.

Wybierz podobieństwo cosinusowe vs. iloczynu skalarnego zgodnie z wytycznymi modelu.

Dobry dla: Zespołów przygotowujących się do wzrostu lub dostrajania kosztów i wydajności.

5) Zabezpieczenia i łagodzenie halucynacji w RAGFlow

Dlaczego jest świetny: Bezpieczeństwo nie jest opcjonalne w produkcji.

Zbudujesz: Potok wspomagany wyszukiwaniem z ograniczeniami odpowiedzi, zasadami odrzucania i kontrolami cytatów.

Kluczowe kroki:

Dodaj węzeł walidatora odpowiedzi, aby upewnić się, że każda odpowiedź cytuje co najmniej N źródeł.

Użyj szablonu instrukcji, który zabrania zgadywania i wymaga „Nie wiem”, gdy brakuje dowodów.

Dodaj weryfikację faktów po generowaniu w odniesieniu do pobranych fragmentów.

6) RAGFlow dla danych ustrukturyzowanych: Hybrydowe wyszukiwanie SQL + tekst

Dlaczego jest świetny: Wiele pytań łączy dokumenty i bazy danych.

Zbudujesz: Potok z podwójnym pobieraniem: pobieranie semantyczne dla dokumentów i wywoływanie narzędzi dla SQL.

Kluczowe kroki:

Kieruj pytania ilościowe do SQL za pośrednictwem wywoływania funkcji.

Dołącz tabelę wyników SQL jako artefakt kontekstu do LLM.

Połącz ze fragmentami dokumentów, aby uzyskać narracyjne wyjaśnienia.

7) Ocena jakości RAG za pomocą złotych zbiorów i recenzji ludzkich

Dlaczego jest świetny: Bez ocen latasz na oślep.

Zbudujesz: Uprząż do oceny, która mierzy ugruntowanie, pokrycie cytatami i przydatność.

Kluczowe kroki:

Przygotuj 50–200 złotych par pytań i odpowiedzi ze źródłami.

Skonfiguruj automatyczne uruchamianie po każdej zmianie potoku.

Użyj punktacji zgodności między odpowiedziami modelu a złotymi odniesieniami.

8) RAGFlow w produkcji: Buforowanie, limity czasu i obserwowalność

Dlaczego jest świetny: Produkcja wprowadza opóźnienia, limity szybkości i ograniczenia kosztów.

Zbudujesz: Solidny potok z buforowaniem żądań, ponawianiem prób i panelami śledzenia.

Kluczowe kroki:

Dodaj pamięci podręczne wektorów i generowania oparte na znormalizowanych zapytaniach.

Zaimplementuj wycofywanie dla problemów z dostawcą.

Emituj zakresy/metryki dla opóźnienia pobierania i zużycia tokenów.

9) Książki zabaw specyficzne dla domeny: Prawo, opieka zdrowotna i wsparcie

Dlaczego jest świetny: Ograniczenia domeny zmieniają wszystko.

Zbudujesz: Szablony, które przestrzegają zgodności, słownictwa i wzorców rozumowania w każdej domenie.

Kluczowe kroki:

Prawo: priorytetowo traktuj sekcje, cytaty z identyfikatorami akapitów.

Opieka zdrowotna: usuń identyfikatory PHI, ogranicz porady do wytycznych.

Wsparcie: zintegruj historię zgłoszeń; waż najnowsze dokumenty wyżej.

10) RAGFlow + wywoływanie funkcji: Działania, nie tylko odpowiedzi

Dlaczego jest świetny: Najpotężniejsze systemy RAG mogą czytać, rozumować i działać.

Zbudujesz: Potok, w którym LLM pobiera dokumenty, a następnie wywołuje narzędzia — wysyłając e-maile, otwierając zgłoszenia lub planując zadania.

Kluczowe kroki:

Zdefiniuj schematy JSON dla narzędzi.

Dodaj router decyzyjny, aby oddzielić zapytania „odpowiedz” od zapytań „działaj”.

Rejestruj każde wywołanie narzędzia za pomocą zabezpieczeń i zatwierdzeń.

Praktyczny plan działania: Od samouczka do produkcji w 30 dni

Skorzystaj z powyższych samouczków w tym 4-etapowym planie. Traktuj to jako swój „obóz szkoleniowy RAGFlow”.

Tydzień 1: Fundamenty i pierwsze sukcesy

Ukończ samouczek 1 (Szybki start) i samouczek 3 (Klasa mistrzowska dzielenia na fragmenty).

Dostarcz dowód koncepcji odpowiadający na 20–30 pytań testowych z twoich dokumentów.

Dodaj podstawowe szablony odpowiedzi, aby wymusić cytaty i odmowy.

Tydzień 2: Głębokość danych i niezawodność

Dodaj pobieranie z wielu źródeł (Samouczek 2) i zaplanuj ponowne indeksowanie.

Zamień osadzanie i magazyn wektorowy (Samouczek 4); wybierz zwycięzcę pod względem kosztów/jakości.

Wprowadź buforowanie i limity czasu (Samouczek 8), aby zapewnić spójne opóźnienia.

Tydzień 3: Oceny, zabezpieczenia i dopasowanie do domeny

Zbuduj złoty zbiór i automatyczne oceny (Samouczek 7).

Dodaj weryfikację faktów po generowaniu i zasadę odrzucania (Samouczek 5).

Zastosuj książkę zabaw dla domeny (Samouczek 9) z niestandardowymi podpowiedziami.

Tydzień 4: Hybrydowe pobieranie i możliwość działania

Podłącz wywoływanie SQL/narzędzi (Samouczek 6) dla zapytań mieszanych.

Dodaj wywoływanie funkcji i zatwierdzenia (Samouczek 10), aby twoja aplikacja RAGFlow mogła podejmować działania.

Instrumentuj panele obserwowalności; ustaw SLO dla dokładności i opóźnień.

Koncepcje RAGFlow, które musisz znać

Nawet najlepsze samouczki RAGFlow zakładają kilka podstawowych idei. Oto krótkie przypomnienie.

Generowanie wspomagane wyszukiwaniem (RAG): Rozszerz kontekst LLM o pobrane fragmenty z twojej bazy wiedzy, aby odpowiedzi były oparte na dowodach.

Dzielenie na fragmenty: Dzielenie dokumentów na jednostki, które można pobrać. Nakładanie się zachowuje kontekst; nagłówki tworzą granice; metody semantyczne używają osadzania, aby znaleźć naturalne punkty przerwania.

Osadzanie: Reprezentacje wektorowe fragmentów i zapytań. Lepsze osadzanie poprawia trafność pobierania i zmniejsza halucynacje.

Magazyn wektorowy: Baza danych dla wektorów z wyszukiwaniem podobieństw. Wybory wpływają na szybkość, odzyskiwanie i skalę.

Ponowne ocenianie: Opcjonalny moduł oceniający drugiego etapu, który zmienia kolejność pobranych fragmentów według trafności.

Inżynieria podpowiedzi: Jasne instrukcje wymagające cytatów, zakazujące zgadywania i formatujące dane wyjściowe.

Oceny: Systematyczny pomiar przy użyciu złotych zbiorów, recenzji ludzkich i automatycznych metryk.

Kopiuj-wklej starter: Podstawowy szablon podpowiedzi RAG

Użyj tego szablonu w węźle generowania, aby zmniejszyć halucynacje i wymusić cytaty.

Jesteś uważnym asystentem, który odpowiada TYLKO informacjami znalezionymi w pobranym kontekście.
Zasady:
- Cytuj dowody z [source_name:page_or_section] po każdym twierdzeniu.
- Jeśli odpowiedzi nie ma w kontekście, powiedz „Nie wiem na podstawie dostarczonych źródeł”.
- Preferuj bezpośrednie cytaty dla definicji; podsumuj procedury.
Kontekst:
{{retrieved_context}}
Pytanie:
{{user_query}}
Odpowiedź:

Przykład: Wymiana osadzania i pomiar wpływu

# Pseudokod ilustrujący logikę eksperymentu, którą zobaczysz w zaawansowanych samouczkach
from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness
pipelines = []
for model in ["text-embedding-3-large", "bge-large", "e5-large"]:
emb = EmbeddingNode(model=model)
vs = VectorStoreNode(kind="milvus", metric="cosine")
pl = Pipeline.add_nodes([
"ingest", "chunk", emb, vs, "retrieve", "generate"
])
pipelines.append((model, pl))
h = EvalHarness(goldset="gold_qa.jsonl")
results = {}
for model, pl in pipelines:
results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"])
print(results)

Ściągawka interpretacyjna:

Jeśli ugruntowanie wzrasta po wymianie modelu, zachowaj go — nawet jeśli tokeny kosztują nieco więcej.

Jeśli opóźnienie wzrasta, dodaj buforowanie lub zmniejsz maksymalną liczbę pobranych fragmentów z 8 → 5.

Jeśli pokrycie cytatami spada, dostosuj rozmiar fragmentu lub dodaj ponowne ocenianie.

Typowe pułapki, których pomogą ci uniknąć te samouczki

Nadmierne dzielenie na fragmenty: Zbyt małe fragmenty prowadzą do braku kontekstu i zaszumionych odpowiedzi.

Niedostateczne dzielenie na fragmenty: Ogromne fragmenty zanieczyszczają okna kontekstu nieistotnym tekstem.

Osadzanie uniwersalne: Język specyficzny dla domeny (prawny, kliniczny) może wymagać modeli dostrojonych do domeny.

Brak ocen: Zmiana czegokolwiek bez punktu odniesienia powoduje upiorne regresje.

Ignorowanie świeżości: Nieaktualne indeksy prowadzą do poprawnych, ale przestarzałych odpowiedzi.

Pomijanie zabezpieczeń: Bez zasad odrzucania twój model zgaduje.

Wybór odpowiedniego samouczka dla twojego przypadku użycia

Bot wsparcia dla startupu: Samouczki 1, 2, 5, 8, 9.

Wewnętrzny asystent badawczy: Samouczki 1, 3, 4, 7.

Kopilot analizy danych: Samouczki 6, 10.

Branże regulowane: Najpierw samouczki 5 i 9, a następnie 7.

Przy okazji: Szybciej twórz prototypy dzięki Sider.AI

Kiedy iterujesz podpowiedzi RAG, testujesz zapytania i porównujesz odpowiedzi, przełączanie kontekstu jest kosztowne. Warto zauważyć: Sider.AI (https://sider.ai/) umożliwia czatowanie z wieloma modelami obok siebie, przypinanie podpowiedzi i prowadzenie bieżącego obszaru roboczego wiedzy. Jest to przydatne do:

Porównywanie odpowiedzi z różnych ustawień pobierania i podpowiedzi.

Uruchamianie szybkich testów „co by było, gdyby” przed wprowadzeniem zmian do RAGFlow.

Organizowanie fragmentów kodu, cytatów i złotych pytań i odpowiedzi dla twojej uprzęży oceny.

Użyj go jako brudnopisu podczas korzystania z samouczków RAGFlow; następnie skodyfikuj zwycięzcę w swoim potoku.

Przewodnik rozwiązywania problemów: Szybkie poprawki, gdy coś się zepsuje

Objaw: Odpowiedzi są ogólne i brakuje im cytatów.

Naprawa: Wymuś wymaganie cytowania w podpowiedzi i dodaj węzeł walidatora.

Objaw: Pobrano nieistotne fragmenty.

Naprawa: Zwiększ nakładanie się fragmentów, przełącz się na lepszy model osadzania lub dodaj ponowne ocenianie.

Objaw: Opóźnienie > 3 sekundy.

Naprawa: Buforuj wyniki wektorowe, ogranicz pobrane fragmenty i użyj tokenów przesyłanych strumieniowo.

Objaw: Sprzeczne odpowiedzi w różnych zapytaniach.

Naprawa: Znormalizuj metadane, usuń duplikaty prawie identycznych fragmentów, waż nowsze dokumenty.

Objaw: Model zbyt często odmawia odpowiedzi, mówiąc „Nie wiem”.

Naprawa: Zmniejsz próg odrzucania, zwiększ głębokość pobierania lub doprecyzuj granice fragmentów.

Kluczowe wnioski

Najlepsze samouczki RAGFlow uczą systemów end-to-end z realistycznymi danymi i ocenami.

Dzielenie na fragmenty i osadzanie mają największy wpływ na jakość odpowiedzi.

Sukces produkcyjny wymaga buforowania, obserwowalności, zabezpieczeń i złotego zbioru.

Używaj książek zabaw dla domeny i wywoływania funkcji, aby wyjść poza pytania i odpowiedzi i przejść do rzeczywistych przepływów pracy.

Wykorzystaj narzędzia takie jak Sider.AI podczas eksperymentowania, aby szybko porównywać podpowiedzi i wyniki.

Co robić dalej

Wybierz dwa samouczki, które pasują do twoich bieżących potrzeb (np. Szybki start + Klasa mistrzowska dzielenia na fragmenty).

Zbierz złoty zestaw pytań i odpowiedzi z własnych dokumentów (zacznij od 50 pytań).

Wprowadzaj jedną zmianę na raz; mierz ugruntowanie i opóźnienie po każdej zmianie.

Przejdź do szablonów produkcyjnych z buforowaniem i zabezpieczeniami, gdy twoje oceny się ustabilizują.

Dodaj wywoływanie funkcji i zasady domeny, gdy twój punkt odniesienia będzie niezawodny.

FAQ

P1: Jaki jest najlepszy samouczek RAGFlow dla absolutnych początkujących? Zacznij od samouczka szybkiego startu RAGFlow, który obejmuje pobieranie pliku PDF, dzielenie na fragmenty, osadzanie, indeksowanie, pobieranie i generowanie z cytatami. Daje ci to szybkie wrażenie end-to-end i przygotowuje cię do głębszych samouczków RAGFlow.

P2: Jak poprawić dokładność w RAGFlow poza podstawowymi samouczkami? Skoncentruj się na strategii dzielenia na fragmenty, jakości osadzania i ponownym ocenianiu. Zaawansowane samouczki RAGFlow pokazują również, jak dodawać zabezpieczenia i uprzęże oceny, aby zmniejszyć halucynacje i określić ilościowo ugruntowanie.

P3: Które osadzanie najlepiej współpracuje z RAGFlow dla dokumentów korporacyjnych? Wypróbuj silne modele ogólne, takie jak text-embedding-3-large, E5 lub BGE, a następnie zmierz metryki pobierania na swoich danych. Najlepsze samouczki RAGFlow zalecają testy A/B na różnych modelach i magazynach wektorowych, aby wybrać zwycięzcę.

P4: Czy RAGFlow może obsługiwać dane ustrukturyzowane, takie jak SQL, wraz z dokumentami? Tak. Samouczki hybrydowego pobierania dla RAGFlow pokazują, jak kierować zapytania ilościowe do SQL za pośrednictwem wywoływania funkcji, jednocześnie używając pobierania semantycznego dla nieustrukturyzowanych dokumentów, a następnie łączyć wyniki w czasie generowania.

P5: Jak ocenić potok RAGFlow przed uruchomieniem? Postępuj zgodnie z samouczkami RAGFlow skoncentrowanymi na ocenie: utwórz złoty zestaw pytań i odpowiedzi ze źródłami, uruchamiaj automatyczne testy po zmianach i śledź ugruntowanie, pokrycie cytatami, opóźnienia i przydatność. Wdrażaj tylko wtedy, gdy metryki się ustabilizują.