10 najlepszych samouczków RAGFlow do opanowania generowania wspomaganego wyszukiwaniem (Retrieval-Augmented Generation)
Jeśli kiedykolwiek próbowałeś nakłonić duży model językowy do odpowiadania na pytania specyficzne dla danej dziedziny i obserwowałeś, jak z pewnością siebie halucynuje, to poczułeś ból, który rozwiązuje RAGFlow. Generowanie wspomagane wyszukiwaniem (RAG) łączy warstwę wyszukiwania z generowaniem, dzięki czemu twój model cytuje fakty z twoich własnych danych. RAGFlow to otwarty, wizualny sposób oparty na potokach do budowania systemu od końca do końca — od pobierania dokumentów po dzielenie na fragmenty, osadzanie, wyszukiwanie wektorowe i ugruntowane odpowiedzi.
W tym przewodniku zebraliśmy najlepsze samouczki RAGFlow, z których możesz skorzystać już dziś, jak wybrać odpowiedni dla swojego stosu i praktyczny plan działania, aby przejść od „hello world” do produkcji. Zachowamy pragmatyczne podejście, z przykładami, pułapkami i kilkoma zaawansowanymi wskazówkami, których nie znajdziesz w podstawowych instrukcjach.
Przyjmujemy podejście praktyczne i zorientowane na rozwiązania: krótkie wyjaśnienia, jasne kroki i fragmenty kodu, które można kopiować i wklejać. Sprawimy, że dostarczysz aplikację RAGFlow, która faktycznie odpowiada poprawnie.
Co sprawia, że samouczek „Najlepszy samouczek RAGFlow” jest najlepszy?
Nie wszystkie samouczki są sobie równe. Najlepsze samouczki RAGFlow mają kilka cech wspólnych:
- Przepływ end-to-end: Pobieranie → dzielenie na fragmenty → osadzanie → indeksowanie → wyszukiwanie → generowanie, wszystko w jednej ścieżce.
- Realistyczne dokumenty: Pliki PDF, HTML, prezentacje slajdów lub zagmatwane dzienniki — nie tylko zabawkowy markdown.
- Wbudowana ocena: Uczą, jak mierzyć ugruntowanie, opóźnienia i jakość odpowiedzi.
- Kwestie produkcyjne: Buforowanie, ponawianie prób, obserwowalność i zabezpieczenia.
- Rozszerzalność: Pokazują, gdzie wymieniać modele, strategie dzielenia na fragmenty lub magazyny wektorowe.
Pamiętaj o tych kryteriach, wybierając ścieżkę uczenia się.
10 najlepszych samouczków RAGFlow w tej chwili
Poniżej znajduje się lista starannie dobranych pozycji, od początkujących do zaawansowanych. Każda pozycja zawiera informacje o tym, dlaczego jest przydatna, co zbudujesz i dla kogo jest przeznaczona.
1) Szybki start z RAGFlow: Twój pierwszy potok end-to-end
- Dlaczego jest świetny: Najszybszy sposób na zrozumienie ruchomych części — idealny do odblokowania.
- Zbudujesz: Minimalny potok: prześlij plik PDF, automatycznie podziel na fragmenty, osadź, indeksuj i wysyłaj zapytania z cytatami.
- Uruchom RAGFlow i otwórz kreator potoków.
- Dodaj węzeł pobierania plików i wskaż plik PDF.
- Wstaw fragmentator (np. rekurencyjny + nagłówki) i węzeł modelu osadzania.
- Połącz się z magazynem wektorowym, a następnie dodaj węzły pobierania i generowania LLM.
- Przetestuj za pomocą kilku zapytań i sprawdź źródła.
- Dobry dla: Absolutnych początkujących; zespołów walidujących podstawowy przepływ RAGFlow.
2) RAGFlow + wiele źródeł danych: Pliki PDF, strony internetowe i Notion
- Dlaczego jest świetny: Większość prawdziwych projektów łączy zagmatwane źródła; ten samouczek pokazuje, jak to zrobić.
- Zbudujesz: Potok, który pobiera pliki PDF, przeszukuje adresy URL i synchronizuje strony Notion zgodnie z harmonogramem.
- Użyj oddzielnych węzłów pobierania dla każdego źródła.
- Znormalizuj metadane (tytuł, adres URL, autor, sekcja).
- Oznacz fragmenty według źródła, aby lepiej filtrować w czasie pobierania.
- Dobry dla: Baz wiedzy, wiki i portali wewnętrznych.
3) Klasa mistrzowska dzielenia na fragmenty: Od naiwnych podziałów po okna semantyczne
- Dlaczego jest świetny: Dzielenie na fragmenty to miejsce, w którym zyskuje się lub traci większość jakości RAG.
- Zbudujesz: Porównanie strategii dzielenia na fragmenty z metrykami ugruntowania.
- Porównaj stały rozmiar, nagłówki rekurencyjne i dzielenie semantyczne na fragmenty.
- Użyj okien nakładających się dla tabel i bloków kodu.
- Oceń precyzję/odzyskiwanie pobranych fragmentów.
- Wskazówka: Utrzymuj fragmenty wystarczająco małe, aby były istotne, ale wystarczająco duże, aby zawierały kontekst (często 300–700 tokenów z 10–20% nakładaniem się).
4) Osadzanie na dużą skalę: Wymiana modeli i magazynów wektorowych
- Dlaczego jest świetny: Wybór modelu po cichu decyduje o twoim pułapie pobierania.
- Zbudujesz: Wariant potoku, który zamienia osadzanie (np.
text-embedding-3-large, BGE, E5) i magazyny wektorowe (FAISS, Milvus, PGVector).
- Uruchom testy pobierania A/B ze spójnymi zapytaniami.
- Śledź współczynniki trafień i średnią odwrotną rangę.
- Wybierz podobieństwo cosinusowe vs. iloczynu skalarnego zgodnie z wytycznymi modelu.
- Dobry dla: Zespołów przygotowujących się do wzrostu lub dostrajania kosztów i wydajności.
5) Zabezpieczenia i łagodzenie halucynacji w RAGFlow
- Dlaczego jest świetny: Bezpieczeństwo nie jest opcjonalne w produkcji.
- Zbudujesz: Potok wspomagany wyszukiwaniem z ograniczeniami odpowiedzi, zasadami odrzucania i kontrolami cytatów.
- Dodaj węzeł walidatora odpowiedzi, aby upewnić się, że każda odpowiedź cytuje co najmniej N źródeł.
- Użyj szablonu instrukcji, który zabrania zgadywania i wymaga „Nie wiem”, gdy brakuje dowodów.
- Dodaj weryfikację faktów po generowaniu w odniesieniu do pobranych fragmentów.
6) RAGFlow dla danych ustrukturyzowanych: Hybrydowe wyszukiwanie SQL + tekst
- Dlaczego jest świetny: Wiele pytań łączy dokumenty i bazy danych.
- Zbudujesz: Potok z podwójnym pobieraniem: pobieranie semantyczne dla dokumentów i wywoływanie narzędzi dla SQL.
- Kieruj pytania ilościowe do SQL za pośrednictwem wywoływania funkcji.
- Dołącz tabelę wyników SQL jako artefakt kontekstu do LLM.
- Połącz ze fragmentami dokumentów, aby uzyskać narracyjne wyjaśnienia.
7) Ocena jakości RAG za pomocą złotych zbiorów i recenzji ludzkich
- Dlaczego jest świetny: Bez ocen latasz na oślep.
- Zbudujesz: Uprząż do oceny, która mierzy ugruntowanie, pokrycie cytatami i przydatność.
- Przygotuj 50–200 złotych par pytań i odpowiedzi ze źródłami.
- Skonfiguruj automatyczne uruchamianie po każdej zmianie potoku.
- Użyj punktacji zgodności między odpowiedziami modelu a złotymi odniesieniami.
8) RAGFlow w produkcji: Buforowanie, limity czasu i obserwowalność
- Dlaczego jest świetny: Produkcja wprowadza opóźnienia, limity szybkości i ograniczenia kosztów.
- Zbudujesz: Solidny potok z buforowaniem żądań, ponawianiem prób i panelami śledzenia.
- Dodaj pamięci podręczne wektorów i generowania oparte na znormalizowanych zapytaniach.
- Zaimplementuj wycofywanie dla problemów z dostawcą.
- Emituj zakresy/metryki dla opóźnienia pobierania i zużycia tokenów.
9) Książki zabaw specyficzne dla domeny: Prawo, opieka zdrowotna i wsparcie
- Dlaczego jest świetny: Ograniczenia domeny zmieniają wszystko.
- Zbudujesz: Szablony, które przestrzegają zgodności, słownictwa i wzorców rozumowania w każdej domenie.
- Prawo: priorytetowo traktuj sekcje, cytaty z identyfikatorami akapitów.
- Opieka zdrowotna: usuń identyfikatory PHI, ogranicz porady do wytycznych.
- Wsparcie: zintegruj historię zgłoszeń; waż najnowsze dokumenty wyżej.
10) RAGFlow + wywoływanie funkcji: Działania, nie tylko odpowiedzi
- Dlaczego jest świetny: Najpotężniejsze systemy RAG mogą czytać, rozumować i działać.
- Zbudujesz: Potok, w którym LLM pobiera dokumenty, a następnie wywołuje narzędzia — wysyłając e-maile, otwierając zgłoszenia lub planując zadania.
- Zdefiniuj schematy JSON dla narzędzi.
- Dodaj router decyzyjny, aby oddzielić zapytania „odpowiedz” od zapytań „działaj”.
- Rejestruj każde wywołanie narzędzia za pomocą zabezpieczeń i zatwierdzeń.
Praktyczny plan działania: Od samouczka do produkcji w 30 dni
Skorzystaj z powyższych samouczków w tym 4-etapowym planie. Traktuj to jako swój „obóz szkoleniowy RAGFlow”.
Tydzień 1: Fundamenty i pierwsze sukcesy
- Ukończ samouczek 1 (Szybki start) i samouczek 3 (Klasa mistrzowska dzielenia na fragmenty).
- Dostarcz dowód koncepcji odpowiadający na 20–30 pytań testowych z twoich dokumentów.
- Dodaj podstawowe szablony odpowiedzi, aby wymusić cytaty i odmowy.
Tydzień 2: Głębokość danych i niezawodność
- Dodaj pobieranie z wielu źródeł (Samouczek 2) i zaplanuj ponowne indeksowanie.
- Zamień osadzanie i magazyn wektorowy (Samouczek 4); wybierz zwycięzcę pod względem kosztów/jakości.
- Wprowadź buforowanie i limity czasu (Samouczek 8), aby zapewnić spójne opóźnienia.
Tydzień 3: Oceny, zabezpieczenia i dopasowanie do domeny
- Zbuduj złoty zbiór i automatyczne oceny (Samouczek 7).
- Dodaj weryfikację faktów po generowaniu i zasadę odrzucania (Samouczek 5).
- Zastosuj książkę zabaw dla domeny (Samouczek 9) z niestandardowymi podpowiedziami.
Tydzień 4: Hybrydowe pobieranie i możliwość działania
- Podłącz wywoływanie SQL/narzędzi (Samouczek 6) dla zapytań mieszanych.
- Dodaj wywoływanie funkcji i zatwierdzenia (Samouczek 10), aby twoja aplikacja RAGFlow mogła podejmować działania.
- Instrumentuj panele obserwowalności; ustaw SLO dla dokładności i opóźnień.
Koncepcje RAGFlow, które musisz znać
Nawet najlepsze samouczki RAGFlow zakładają kilka podstawowych idei. Oto krótkie przypomnienie.
- Generowanie wspomagane wyszukiwaniem (RAG): Rozszerz kontekst LLM o pobrane fragmenty z twojej bazy wiedzy, aby odpowiedzi były oparte na dowodach.
- Dzielenie na fragmenty: Dzielenie dokumentów na jednostki, które można pobrać. Nakładanie się zachowuje kontekst; nagłówki tworzą granice; metody semantyczne używają osadzania, aby znaleźć naturalne punkty przerwania.
- Osadzanie: Reprezentacje wektorowe fragmentów i zapytań. Lepsze osadzanie poprawia trafność pobierania i zmniejsza halucynacje.
- Magazyn wektorowy: Baza danych dla wektorów z wyszukiwaniem podobieństw. Wybory wpływają na szybkość, odzyskiwanie i skalę.
- Ponowne ocenianie: Opcjonalny moduł oceniający drugiego etapu, który zmienia kolejność pobranych fragmentów według trafności.
- Inżynieria podpowiedzi: Jasne instrukcje wymagające cytatów, zakazujące zgadywania i formatujące dane wyjściowe.
- Oceny: Systematyczny pomiar przy użyciu złotych zbiorów, recenzji ludzkich i automatycznych metryk.
Kopiuj-wklej starter: Podstawowy szablon podpowiedzi RAG
Użyj tego szablonu w węźle generowania, aby zmniejszyć halucynacje i wymusić cytaty.
Jesteś uważnym asystentem, który odpowiada TYLKO informacjami znalezionymi w pobranym kontekście.
Zasady:
- Cytuj dowody z [source_name:page_or_section] po każdym twierdzeniu.
- Jeśli odpowiedzi nie ma w kontekście, powiedz „Nie wiem na podstawie dostarczonych źródeł”.
- Preferuj bezpośrednie cytaty dla definicji; podsumuj procedury.
Kontekst:
{{retrieved_context}}
Pytanie:
{{user_query}}
Odpowiedź:
Przykład: Wymiana osadzania i pomiar wpływu
# Pseudokod ilustrujący logikę eksperymentu, którą zobaczysz w zaawansowanych samouczkach
from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness
pipelines = []
for model in ["text-embedding-3-large", "bge-large", "e5-large"]:
emb = EmbeddingNode(model=model)
vs = VectorStoreNode(kind="milvus", metric="cosine")
pl = Pipeline.add_nodes([
"ingest", "chunk", emb, vs, "retrieve", "generate"
])
pipelines.append((model, pl))
h = EvalHarness(goldset="gold_qa.jsonl")
results = {}
for model, pl in pipelines:
results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"])
print(results)
Ściągawka interpretacyjna:
- Jeśli ugruntowanie wzrasta po wymianie modelu, zachowaj go — nawet jeśli tokeny kosztują nieco więcej.
- Jeśli opóźnienie wzrasta, dodaj buforowanie lub zmniejsz maksymalną liczbę pobranych fragmentów z 8 → 5.
- Jeśli pokrycie cytatami spada, dostosuj rozmiar fragmentu lub dodaj ponowne ocenianie.
Typowe pułapki, których pomogą ci uniknąć te samouczki
- Nadmierne dzielenie na fragmenty: Zbyt małe fragmenty prowadzą do braku kontekstu i zaszumionych odpowiedzi.
- Niedostateczne dzielenie na fragmenty: Ogromne fragmenty zanieczyszczają okna kontekstu nieistotnym tekstem.
- Osadzanie uniwersalne: Język specyficzny dla domeny (prawny, kliniczny) może wymagać modeli dostrojonych do domeny.
- Brak ocen: Zmiana czegokolwiek bez punktu odniesienia powoduje upiorne regresje.
- Ignorowanie świeżości: Nieaktualne indeksy prowadzą do poprawnych, ale przestarzałych odpowiedzi.
- Pomijanie zabezpieczeń: Bez zasad odrzucania twój model zgaduje.
Wybór odpowiedniego samouczka dla twojego przypadku użycia
- Bot wsparcia dla startupu: Samouczki 1, 2, 5, 8, 9.
- Wewnętrzny asystent badawczy: Samouczki 1, 3, 4, 7.
- Kopilot analizy danych: Samouczki 6, 10.
- Branże regulowane: Najpierw samouczki 5 i 9, a następnie 7.
Przy okazji: Szybciej twórz prototypy dzięki Sider.AI
Kiedy iterujesz podpowiedzi RAG, testujesz zapytania i porównujesz odpowiedzi, przełączanie kontekstu jest kosztowne. Warto zauważyć: Sider.AI (https://sider.ai/) umożliwia czatowanie z wieloma modelami obok siebie, przypinanie podpowiedzi i prowadzenie bieżącego obszaru roboczego wiedzy. Jest to przydatne do: - Porównywanie odpowiedzi z różnych ustawień pobierania i podpowiedzi.
- Uruchamianie szybkich testów „co by było, gdyby” przed wprowadzeniem zmian do RAGFlow.
- Organizowanie fragmentów kodu, cytatów i złotych pytań i odpowiedzi dla twojej uprzęży oceny.
Użyj go jako brudnopisu podczas korzystania z samouczków RAGFlow; następnie skodyfikuj zwycięzcę w swoim potoku.
Przewodnik rozwiązywania problemów: Szybkie poprawki, gdy coś się zepsuje
- Objaw: Odpowiedzi są ogólne i brakuje im cytatów.
- Naprawa: Wymuś wymaganie cytowania w podpowiedzi i dodaj węzeł walidatora.
- Objaw: Pobrano nieistotne fragmenty.
- Naprawa: Zwiększ nakładanie się fragmentów, przełącz się na lepszy model osadzania lub dodaj ponowne ocenianie.
- Objaw: Opóźnienie > 3 sekundy.
- Naprawa: Buforuj wyniki wektorowe, ogranicz pobrane fragmenty i użyj tokenów przesyłanych strumieniowo.
- Objaw: Sprzeczne odpowiedzi w różnych zapytaniach.
- Naprawa: Znormalizuj metadane, usuń duplikaty prawie identycznych fragmentów, waż nowsze dokumenty.
- Objaw: Model zbyt często odmawia odpowiedzi, mówiąc „Nie wiem”.
- Naprawa: Zmniejsz próg odrzucania, zwiększ głębokość pobierania lub doprecyzuj granice fragmentów.
Kluczowe wnioski
- Najlepsze samouczki RAGFlow uczą systemów end-to-end z realistycznymi danymi i ocenami.
- Dzielenie na fragmenty i osadzanie mają największy wpływ na jakość odpowiedzi.
- Sukces produkcyjny wymaga buforowania, obserwowalności, zabezpieczeń i złotego zbioru.
- Używaj książek zabaw dla domeny i wywoływania funkcji, aby wyjść poza pytania i odpowiedzi i przejść do rzeczywistych przepływów pracy.
- Wykorzystaj narzędzia takie jak Sider.AI podczas eksperymentowania, aby szybko porównywać podpowiedzi i wyniki.
Co robić dalej
- Wybierz dwa samouczki, które pasują do twoich bieżących potrzeb (np. Szybki start + Klasa mistrzowska dzielenia na fragmenty).
- Zbierz złoty zestaw pytań i odpowiedzi z własnych dokumentów (zacznij od 50 pytań).
- Wprowadzaj jedną zmianę na raz; mierz ugruntowanie i opóźnienie po każdej zmianie.
- Przejdź do szablonów produkcyjnych z buforowaniem i zabezpieczeniami, gdy twoje oceny się ustabilizują.
- Dodaj wywoływanie funkcji i zasady domeny, gdy twój punkt odniesienia będzie niezawodny.
FAQ
P1: Jaki jest najlepszy samouczek RAGFlow dla absolutnych początkujących?
Zacznij od samouczka szybkiego startu RAGFlow, który obejmuje pobieranie pliku PDF, dzielenie na fragmenty, osadzanie, indeksowanie, pobieranie i generowanie z cytatami. Daje ci to szybkie wrażenie end-to-end i przygotowuje cię do głębszych samouczków RAGFlow.
P2: Jak poprawić dokładność w RAGFlow poza podstawowymi samouczkami?
Skoncentruj się na strategii dzielenia na fragmenty, jakości osadzania i ponownym ocenianiu. Zaawansowane samouczki RAGFlow pokazują również, jak dodawać zabezpieczenia i uprzęże oceny, aby zmniejszyć halucynacje i określić ilościowo ugruntowanie.
P3: Które osadzanie najlepiej współpracuje z RAGFlow dla dokumentów korporacyjnych?
Wypróbuj silne modele ogólne, takie jak text-embedding-3-large, E5 lub BGE, a następnie zmierz metryki pobierania na swoich danych. Najlepsze samouczki RAGFlow zalecają testy A/B na różnych modelach i magazynach wektorowych, aby wybrać zwycięzcę.
P4: Czy RAGFlow może obsługiwać dane ustrukturyzowane, takie jak SQL, wraz z dokumentami?
Tak. Samouczki hybrydowego pobierania dla RAGFlow pokazują, jak kierować zapytania ilościowe do SQL za pośrednictwem wywoływania funkcji, jednocześnie używając pobierania semantycznego dla nieustrukturyzowanych dokumentów, a następnie łączyć wyniki w czasie generowania.
P5: Jak ocenić potok RAGFlow przed uruchomieniem?
Postępuj zgodnie z samouczkami RAGFlow skoncentrowanymi na ocenie: utwórz złoty zestaw pytań i odpowiedzi ze źródłami, uruchamiaj automatyczne testy po zmianach i śledź ugruntowanie, pokrycie cytatami, opóźnienia i przydatność. Wdrażaj tylko wtedy, gdy metryki się ustabilizują.