Sider.ai
  • Sembang
  • Wisebase
  • Alatan
  • Sambungan
  • Pelanggan
  • penetapan harga
Muat turun sekarang
Log masuk

Belajar lebih pantas, fikir lebih mendalam, dan berkembang lebih bijak dengan Sider.

Produk
Aplikasi
  • Sambungan
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Alat
  • Pencipta WebNew
  • AI SlidesNew
  • Penulis Esei AI
  • Nano Banana Pro
  • Nano Banana Infographic
  • Penjana Imej AI
  • Generator Otak Itali
  • Penghilang Latar Belakang
  • Penukar Latar Belakang
  • Pemadam Foto
  • Penghilang Teks
  • Inpaint
  • Peningkat Resolusi Imej
  • Buat
  • Penterjemah AI
  • Penterjemah Imej
  • Penterjemah PDF
Sider
  • Hubungi Kami
  • Pusat Bantuan
  • Muat Turun
  • Harga
  • Pelan Pendidikan
  • Apa Yang Baru
  • Blog
  • Komuniti
  • Rakan Kongsi
  • Afiliasi
  • Jemput
©2026 Hak Cipta Terpelihara
Syarat Penggunaan
Dasar Privasi
  • Halaman Utama
  • Blog
  • Alat AI
  • 10 Tutorial RAGFlow Terbaik untuk Menguasai Retrieval-Augmented Generation

10 Tutorial RAGFlow Terbaik untuk Menguasai Retrieval-Augmented Generation

Dikemas kini pada 19 Sep 2025

10 min


10 Tutorial RAGFlow Terbaik untuk Menguasai Generasi Tambahan Pengambilan (Retrieval-Augmented Generation)

Jika anda pernah cuba mendapatkan model bahasa yang besar untuk menjawab soalan khusus domain dan melihatnya berhalusinasi dengan yakin, anda telah merasakan kesakitan yang RAGFlow selesaikan. Generasi Tambahan Pengambilan (RAG) menggandingkan lapisan carian dengan penjanaan supaya model anda memetik fakta daripada data anda sendiri. RAGFlow ialah cara yang terbuka, visual dan dipacu oleh saluran paip untuk membina sistem itu dari hujung ke hujung—daripada pengambilan dokumen kepada pemecahan (chunking), pembenaman (embedding), carian vektor dan respons berasaskan.
Dalam panduan ini, kami mengumpulkan tutorial RAGFlow terbaik yang boleh anda ikuti hari ini, cara memilih yang sesuai untuk susunan (stack) anda dan pelan tindakan praktikal untuk beralih daripada “hello world” kepada pengeluaran. Kami akan mengekalkannya secara pragmatik, dengan contoh, perangkap dan beberapa petua hebat yang tidak akan anda temui dalam panduan asas.
Kami mengambil pendekatan Praktikal & Berorientasikan Penyelesaian: penjelasan ringkas, langkah yang jelas dan coretan yang boleh disalin-tampal. Mari kita hasilkan aplikasi RAGFlow yang benar-benar menjawab dengan betul.

Apakah yang Menjadikan “Tutorial RAGFlow Terbaik”?

Tidak semua tutorial adalah sama. Tutorial RAGFlow terbaik berkongsi beberapa ciri:
  • Aliran hujung ke hujung: Pengambilan → pemecahan → pembenaman → pengindeksan → pengambilan → penjanaan, semuanya dalam satu laluan.
  • Dokumen realistik: PDF, HTML, dek slaid atau log yang bersepah—bukan sekadar markdown mainan.
  • Penilaian terbina dalam: Mereka mengajar cara mengukur asas, kependaman dan kualiti jawapan.
  • Kebimbangan pengeluaran: Pengekalan缓存 (caching), percubaan semula, kebolehtelapan dan rel pengawal.
  • Boleh diperluaskan: Tunjukkan tempat untuk menukar model, strategi pemecahan atau stor vektor.
Ingat kriteria ini semasa anda memilih laluan pembelajaran anda.

10 Tutorial RAGFlow Terbaik Sekarang

Di bawah ialah senarai yang disusun merangkumi peringkat pemula hingga lanjutan. Setiap entri menyertakan sebab ia berguna, perkara yang akan anda bina dan untuk siapa ia sesuai.

1) RAGFlow Mula Pantas: Saluran Paip Hujung ke Hujung Pertama Anda

  • Mengapa ia hebat: Cara terpantas untuk memahami bahagian yang bergerak—sesuai untuk tidak tersekat.
  • Anda akan membina: Saluran paip minimum: muat naik PDF, pecah automatik, benamkan, indeks dan pertanyaan dengan petikan.
  • Langkah utama:
  1. Hidupkan RAGFlow dan buka pembina saluran paip.
  1. Tambahkan nod pengambil fail dan halakan ke PDF.
  1. Masukkan pemecah (contohnya, rekursif + tajuk) dan nod model pembenaman.
  1. Sambung ke stor vektor, kemudian tambahkan nod pengambilan dan penjanaan LLM.
  1. Uji dengan beberapa pertanyaan dan periksa sumber.
  • Sesuai untuk: Pemula mutlak; pasukan yang mengesahkan aliran asas RAGFlow.

2) RAGFlow + Berbilang Sumber Data: PDF, Halaman Web dan Notion

  • Mengapa ia hebat: Kebanyakan projek sebenar menggabungkan sumber yang bersepah; tutorial ini menunjukkan caranya.
  • Anda akan membina: Saluran paip yang mengambil PDF, merangkak URL dan menyegerakkan halaman Notion mengikut jadual.
  • Langkah utama:
  • Gunakan nod pengambil yang berasingan bagi setiap sumber.
  • Normalkan metadata (tajuk, URL, pengarang, bahagian).
  • Tandakan pecahan mengikut sumber untuk penapisan yang lebih baik pada masa pengambilan.
  • Sesuai untuk: Pangkalan pengetahuan, wiki dan portal dalaman.

3) Kelas Induk Pemecahan (Chunking): Daripada Pembahagian Naif kepada Tetingkap Semantik

  • Mengapa ia hebat: Pemecahan ialah tempat kebanyakan kualiti RAG dimenangi atau hilang.
  • Anda akan membina: Penilaian bersebelahan bagi strategi pemecahan dengan metrik asas.
  • Langkah utama:
  • Bandingkan saiz tetap, tajuk rekursif dan pemecahan semantik.
  • Gunakan tetingkap pertindihan untuk jadual dan blok kod.
  • Nilaikan ketepatan/ingatan pecahan yang diambil.
  • Petua: Pastikan pecahan cukup kecil untuk perkaitan, tetapi cukup besar untuk konteks (selalunya 300–700 token dengan pertindihan 10–20%).

4) Pembenaman pada Skala: Menukar Model dan Stor Vektor

  • Mengapa ia hebat: Pilihan model secara senyap menentukan siling pengambilan anda.
  • Anda akan membina: Varian saluran paip yang menukar pembenaman (contohnya, text-embedding-3-large, BGE, E5) dan stor vektor (FAISS, Milvus, PGVector).
  • Langkah utama:
  • Jalankan ujian pengambilan A/B dengan pertanyaan yang konsisten.
  • Jejaki kadar hit dan Pangkat Timbal Balik Min.
  • Pilih kosinus berbanding persamaan hasil darab titik mengikut panduan model.
  • Sesuai untuk: Pasukan yang bersedia untuk pertumbuhan atau penalaan prestasi kos.

5) Rel Pengawal dan Pengurangan Halusinasi dalam RAGFlow

  • Mengapa ia hebat: Keselamatan bukanlah pilihan dalam pengeluaran.
  • Anda akan membina: Saluran paip tambahan pengambilan dengan kekangan jawapan, dasar penolakan dan semakan petikan.
  • Langkah utama:
  • Tambahkan nod pengesah jawapan untuk memastikan setiap jawapan memetik sekurang-kurangnya N sumber.
  • Gunakan templat arahan yang melarang tekaan dan memerlukan “Saya tidak tahu” apabila bukti tiada.
  • Tambahkan semakan fakta pasca penjanaan terhadap pecahan yang diambil.

6) RAGFlow untuk Data Berstruktur: Pengambilan Hibrid SQL + Teks

  • Mengapa ia hebat: Banyak soalan mencampurkan dokumen dan pangkalan data.
  • Anda akan membina: Saluran paip pengambil dwi: pengambilan semantik untuk dokumen dan panggilan alat untuk SQL.
  • Langkah utama:
  • Halakan soalan kuantitatif ke SQL melalui panggilan fungsi.
  • Sertakan jadual hasil SQL sebagai artifak konteks kepada LLM.
  • Gabungkan dengan coretan dokumen untuk penjelasan naratif.

7) Menilai Kualiti RAG dengan Set Emas dan Semakan Manusia

  • Mengapa ia hebat: Tanpa penilaian, anda terbang buta.
  • Anda akan membina: Abah-abah penilaian yang mengukur asas, liputan petikan dan bantuan.
  • Langkah utama:
  • Sediakan 50–200 pasangan S&J emas dengan sumber.
  • Sediakan larian automatik selepas setiap perubahan saluran paip.
  • Gunakan pemarkahan perjanjian antara jawapan model dan rujukan emas.

8) RAGFlow dalam Pengeluaran: Pengekalan缓存 (Caching), Tamat Masa dan Kebolehtelapan

  • Mengapa ia hebat: Pengeluaran memperkenalkan kependaman, had kadar dan kekangan kos.
  • Anda akan membina: Saluran paip yang teguh dengan pengekalan缓存 permintaan, percubaan semula dan papan pemuka kesan.
  • Langkah utama:
  • Tambahkan缓存 vektor dan penjanaan yang dikunci oleh pertanyaan yang dinormalkan.
  • Laksanakan undur untuk cegukan pembekal.
  • Keluarkan rentang/metrik untuk kependaman pengambilan dan penggunaan token.

9) Buku Permainan Khusus Domain: Undang-undang, Penjagaan Kesihatan dan Sokongan

  • Mengapa ia hebat: Kekangan domain mengubah segala-galanya.
  • Anda akan membina: Templat yang menghormati pematuhan, perbendaharaan kata dan corak penaakulan setiap domain.
  • Langkah utama:
  • Undang-undang: utamakan bahagian, petikan dengan ID perenggan.
  • Penjagaan Kesihatan: nyahkenal pasti PHI, kekang nasihat kepada garis panduan.
  • Sokongan: integrasikan sejarah tiket; beratkan dokumen terkini lebih tinggi.

10) RAGFlow + Panggilan Fungsi: Tindakan, Bukan Sekadar Jawapan

  • Mengapa ia hebat: Sistem RAG yang paling berkuasa boleh membaca, menaakul dan bertindak.
  • Anda akan membina: Saluran paip tempat LLM mengambil dokumen, kemudian memanggil alat—menghantar e-mel, membuka tiket atau menjadualkan kerja.
  • Langkah utama:
  • Tentukan skema JSON untuk alat.
  • Tambahkan penghala keputusan untuk memisahkan pertanyaan “jawab” lwn. “bertindak”.
  • Log setiap panggilan alat dengan rel pengawal dan kelulusan.

Pelan Tindakan Praktikal: Daripada Tutorial kepada Pengeluaran dalam 30 Hari

Gunakan tutorial di atas dalam pelan 4 peringkat ini. Anggap ini sebagai “kem latihan RAGFlow” anda.

Minggu 1: Asas dan Kemenangan Pertama

  • Lengkapkan Tutorial 1 (Mula Pantas) dan Tutorial 3 (Kelas Induk Pemecahan).
  • Hasilkan bukti konsep yang menjawab 20–30 soalan ujian daripada dokumen anda.
  • Tambahkan templat jawapan asas untuk menguatkuasakan petikan dan penolakan.

Minggu 2: Kedalaman Data dan Kebolehpercayaan

  • Tambahkan pengambilan berbilang sumber (Tutorial 2) dan jadualkan pengindeksan semula.
  • Tukar pembenaman dan stor vektor (Tutorial 4); pilih pemenang kos/kualiti.
  • Perkenalkan pengekalan缓存 (caching) dan tamat masa (Tutorial 8) untuk memastikan kependaman konsisten.

Minggu 3: Penilaian, Rel Pengawal dan Kesesuaian Domain

  • Bina set emas dan penilaian automatik (Tutorial 7).
  • Tambahkan semakan fakta pasca penjanaan dan dasar penolakan (Tutorial 5).
  • Gunakan buku permainan domain (Tutorial 9) dengan gesaan tersuai.

Minggu 4: Pengambilan Hibrid dan Keboleh Tindakan

  • Sambungkan panggilan SQL/alat (Tutorial 6) untuk pertanyaan campuran.
  • Tambahkan panggilan fungsi dan kelulusan (Tutorial 10) supaya aplikasi RAGFlow anda boleh mengambil tindakan.
  • Instrumenkan papan pemuka kebolehtelapan; tetapkan SLO untuk ketepatan dan kependaman.

Konsep RAGFlow yang Mesti Anda Tahu

Malah tutorial RAGFlow terbaik menganggap beberapa idea teras. Berikut ialah penyegar ingatan pantas.
  • Generasi Tambahan Pengambilan (RAG): Tambahkan konteks LLM dengan pecahan yang diambil daripada pangkalan pengetahuan anda supaya jawapan berasaskan bukti.
  • Pemecahan (Chunking): Memisahkan dokumen kepada unit yang boleh diambil. Pertindihan mengekalkan konteks; tajuk mencipta sempadan; kaedah semantik menggunakan pembenaman untuk mencari titik putus semula jadi.
  • Pembenaman (Embedding): Perwakilan vektor bagi pecahan dan pertanyaan. Pembenaman yang lebih baik meningkatkan perkaitan pengambilan dan mengurangkan halusinasi.
  • Stor Vektor: Pangkalan data untuk vektor dengan carian persamaan. Pilihan mempengaruhi kelajuan, ingatan dan skala.
  • Penyusunan Semula: Pemarkah peringkat kedua pilihan untuk menyusun semula pecahan yang diambil mengikut perkaitan.
  • Kejuruteraan Gesaan: Arahan yang jelas untuk memerlukan petikan, melarang tekaan dan memformat output.
  • Penilaian: Pengukuran sistematik menggunakan set emas, semakan manusia dan metrik automatik.

Pemula Salin-Tampal: Templat Gesaan RAG Garis Dasar

Gunakan templat ini dalam nod penjanaan anda untuk mengurangkan halusinasi dan menguatkuasakan petikan.
Anda ialah pembantu yang berhati-hati yang menjawab HANYA dengan maklumat yang terdapat dalam konteks yang diambil.
Peraturan:
- Petik bukti dengan [source_name:page_or_section] selepas setiap dakwaan.
- Jika jawapan tidak ada dalam konteks, katakan "Saya tidak tahu berdasarkan sumber yang diberikan."
- Utamakan petikan langsung untuk definisi; ringkaskan untuk prosedur.
Konteks:
{{retrieved_context}}
Soalan:
{{user_query}}
Jawapan:

Contoh: Menukar Pembenaman dan Mengukur Kesan

# Pseudokod yang menggambarkan logik eksperimen yang akan anda lihat dalam tutorial lanjutan
from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness
pipelines = []
for model in ["text-embedding-3-large", "bge-large", "e5-large"]:
emb = EmbeddingNode(model=model)
vs = VectorStoreNode(kind="milvus", metric="cosine")
pl = Pipeline.add_nodes([
"ingest", "chunk", emb, vs, "retrieve", "generate"
<a10>])</a11>
h = EvalHarness(goldset="gold_qa.jsonl")
results = {}
for model, pl in pipelines:
results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"])
print(results)
Lembaran menipu tafsiran:
  • Jika asas melonjak selepas pertukaran model, kekalkannya—walaupun token berharga sedikit lebih mahal.
  • Jika kependaman meningkat, tambahkan pengekalan缓存 (caching) atau kurangkan pecahan maksimum yang diambil daripada 8 → 5.
  • Jika liputan petikan menurun, tweak saiz pecahan atau tambahkan penyusunan semula.

Perangkap Biasa yang Tutorial Ini Bantu Anda Elakkan

  • Pemecahan berlebihan: Pecahan yang terlalu kecil menyebabkan kehilangan konteks dan jawapan yang bising.
  • Pemecahan kurang: Pecahan yang besar mencemari tetingkap konteks dengan teks yang tidak berkaitan.
  • Pembenaman yang sesuai untuk semua: Bahasa domain (undang-undang, klinikal) mungkin memerlukan model yang ditala domain.
  • Tiada penilaian: Menukar apa-apa sahaja tanpa garis dasar mencipta regresi hantu.
  • Mengabaikan kesegaran: Indeks yang lapuk membawa kepada jawapan yang betul tetapi usang.
  • Melangkau rel pengawal: Tanpa peraturan penolakan, model anda meneka.

Memilih Tutorial yang Tepat untuk Kes Penggunaan Anda

  • Bot sokongan syarikat permulaan: Tutorial 1, 2, 5, 8, 9.
  • Pembantu penyelidikan dalaman: Tutorial 1, 3, 4, 7.
  • Kopilot analisis data: Tutorial 6, 10.
  • Industri terkawal: Tutorial 5 dan 9 dahulu, kemudian 7.

Dengan Cara Ini: Prototaip Lebih Pantas Dengan Sider.AI

Apabila anda melakukan lelaran pada gesaan RAG, menguji pertanyaan dan membandingkan respons, penukaran konteks adalah mahal. Perlu diingatkan: Sider.AI (https://sider.ai/) membolehkan anda bersembang dengan berbilang model bersebelahan, menyematkan gesaan dan menyimpan ruang kerja pengetahuan yang berterusan. Ia berguna untuk:
  • Membandingkan jawapan daripada tetapan pengambilan dan gesaan yang berbeza.
  • Menjalankan ujian "bagaimana jika" pantas sebelum anda membakar perubahan ke dalam RAGFlow.
  • Menyusun coretan, petikan dan S&J emas untuk abah-abah penilaian anda.
Gunakan ia sebagai buku catatan anda semasa anda mengikuti tutorial RAGFlow; kemudian kodkan pemenang dalam saluran paip anda.

Panduan Penyelesaian Masalah: Pembaikan Pantas Apabila Perkara Rosak

  • Gejala: Jawapan adalah generik dan kekurangan petikan.
  • Betulkan: Kuatkuasakan keperluan petikan dalam gesaan dan tambahkan nod pengesah.
  • Gejala: Pecahan yang tidak berkaitan diambil.
  • Betulkan: Tingkatkan pertindihan pecahan, bertukar kepada model pembenaman yang lebih baik atau tambahkan penyusunan semula.
  • Gejala: Kependaman > 3 saat.
  • Betulkan: 缓存kan hasil vektor, hadkan pecahan yang diambil dan gunakan token penstriman.
  • Gejala: Jawapan bercanggah merentas pertanyaan.
  • Betulkan: Normalkan metadata, nyahduplikasi pecahan yang hampir sama, beratkan dokumen yang lebih baharu.
  • Gejala: Model terlalu kerap menolak dengan “Saya tidak tahu.”
  • Betulkan: Longgarkan ambang penolakan, kembangkan kedalaman pengambilan atau haluskan sempadan pecahan.

Perkara Utama

  • Tutorial RAGFlow terbaik mengajar sistem hujung ke hujung dengan data dan penilaian yang realistik.
  • Pemecahan dan pembenaman mempunyai impak terbesar terhadap kualiti jawapan.
  • Kejayaan pengeluaran memerlukan pengekalan缓存 (caching), kebolehtelapan, rel pengawal dan set emas.
  • Gunakan buku permainan domain dan panggilan fungsi untuk melangkaui S&J ke dalam aliran kerja sebenar.
  • Manfaatkan alatan seperti Sider.AI semasa percubaan untuk membandingkan gesaan dan hasil dengan cepat.

Perkara yang Perlu Dilakukan Seterusnya

  1. Pilih dua tutorial yang sepadan dengan keperluan segera anda (contohnya, Mula Pantas + Kelas Induk Pemecahan).
  1. Kumpulkan set S&J emas daripada dokumen anda sendiri (mulakan dengan 50 soalan).
  1. Jalankan satu perubahan pada satu masa; ukur asas dan kependaman selepas setiap satu.
  1. Beralih kepada templat pengeluaran dengan pengekalan缓存 (caching) dan rel pengawal apabila penilaian anda stabil.
  1. Lapisan dalam panggilan fungsi dan dasar domain sebaik sahaja garis dasar anda boleh dipercayai.

Soalan Lazim

S1:Apakah tutorial RAGFlow terbaik untuk pemula mutlak? Mulakan dengan tutorial mula pantas RAGFlow yang meliputi pengambilan PDF, pemecahan, pembenaman, pengindeksan, pengambilan dan penjanaan dengan petikan. Ia memberi anda rasa hujung ke hujung dengan cepat dan menyediakan anda untuk tutorial RAGFlow yang lebih mendalam.
S2:Bagaimanakah cara saya meningkatkan ketepatan dalam RAGFlow melangkaui tutorial asas? Tumpukan pada strategi pemecahan, kualiti pembenaman dan penyusunan semula. Tutorial RAGFlow lanjutan juga menunjukkan cara menambah rel pengawal dan abah-abah penilaian untuk mengurangkan halusinasi dan mengukur asas secara kuantitatif.
S3:Pembenaman manakah yang berfungsi paling baik dengan RAGFlow untuk dokumen perusahaan? Cuba model umum yang kukuh seperti text-embedding-3-large, E5 atau BGE, kemudian ukur metrik pengambilan pada data anda. Tutorial RAGFlow terbaik mengesyorkan ujian A/B merentas model dan stor vektor untuk memilih pemenang.
S4:Bolehkah RAGFlow mengendalikan data berstruktur seperti SQL bersama-sama dengan dokumen? Ya. Tutorial pengambilan hibrid untuk RAGFlow menunjukkan cara menghalakan pertanyaan kuantitatif ke SQL melalui panggilan fungsi sambil masih menggunakan pengambilan semantik untuk dokumen tidak berstruktur, kemudian menggabungkan hasil pada masa penjanaan.
S5:Bagaimanakah cara saya menilai saluran paip RAGFlow sebelum digunakan secara langsung? Ikuti tutorial RAGFlow yang berfokuskan penilaian: cipta set S&J emas dengan sumber, jalankan ujian automatik selepas perubahan dan jejak asas, liputan petikan, kependaman dan bantuan. Hanya gunakan apabila metrik stabil.

Artikel Terkini
Cara Menguasai ChatPDF: Mendapatkan Maklumat dengan Lebih Pantas dari Dokumen Padat

Cara Menguasai ChatPDF: Mendapatkan Maklumat dengan Lebih Pantas dari Dokumen Padat

Alternatif Terbaik X Auto-Translation untuk Dokumen Cepat dan Tepat

Alternatif Terbaik X Auto-Translation untuk Dokumen Cepat dan Tepat

Terjemahan AI Samsung Tidak Tersedia di Iran? Penyelesaian Praktikal

Terjemahan AI Samsung Tidak Tersedia di Iran? Penyelesaian Praktikal

Alat Terjemahan Parsi: Panduan Praktikal untuk Kerja Lebih Cepat dan Tepat

Alat Terjemahan Parsi: Panduan Praktikal untuk Kerja Lebih Cepat dan Tepat

Alternatif Terbaik Grok untuk Penyelidikan Mendalam dan Berpautan

Alternatif Terbaik Grok untuk Penyelidikan Mendalam dan Berpautan

15 Ciri Utama Penjana Imej AI yang Anda Akan Guna

15 Ciri Utama Penjana Imej AI yang Anda Akan Guna