What is the best RAGFlow tutorial for absolute beginners?

Start with a RAGFlow quickstart tutorial that covers ingesting a PDF, chunking, embedding, indexing, retrieving, and generating with citations. It gives you an end-to-end feel fast and sets you up for deeper RAGFlow tutorials.

How do I improve accuracy in RAGFlow beyond basic tutorials?

Focus on chunking strategy, embeddings quality, and reranking. Advanced RAGFlow tutorials also show how to add guardrails and evaluation harnesses to reduce hallucinations and quantify groundedness.

Which embeddings work best with RAGFlow for enterprise docs?

Try strong general models like text-embedding-3-large, E5, or BGE, then measure retrieval metrics on your data. The best RAGFlow tutorials recommend A/B tests across models and vector stores to pick the winner.

Can RAGFlow handle structured data like SQL along with documents?

Yes. Hybrid retrieval tutorials for RAGFlow show how to route quantitative queries to SQL via function calling while still using semantic retrieval for unstructured docs, then merge results at generation time.

How do I evaluate a RAGFlow pipeline before going live?

Follow evaluation-focused RAGFlow tutorials: create a golden Q&A set with sources, run automated tests after changes, and track groundedness, citation coverage, latency, and helpfulness. Only deploy when metrics stabilize.

10 สุดยอดบทเรียน RAGFlow เพื่อเชี่ยวชาญการสร้างเสริมการดึงข้อมูล (Retrieval-Augmented Generation)

หากคุณเคยพยายามให้โมเดลภาษาขนาดใหญ่ตอบคำถามเฉพาะทางและเห็นมันสร้างข้อมูลเท็จออกมาอย่างมั่นใจ คุณคงเคยรู้สึกถึงความเจ็บปวดที่ RAGFlow เข้ามาแก้ไข การสร้างเสริมการดึงข้อมูล (RAG) จับคู่เลเยอร์การค้นหากับการสร้าง เพื่อให้โมเดลของคุณอ้างอิงข้อเท็จจริงจากข้อมูลของคุณเอง RAGFlow เป็นวิธีที่เปิดกว้าง มองเห็นได้ และขับเคลื่อนด้วยไปป์ไลน์ในการสร้างระบบนั้นตั้งแต่ต้นจนจบ ตั้งแต่การนำเข้าเอกสาร การแบ่งส่วน การฝัง การค้นหาเวกเตอร์ และการตอบสนองที่มีหลักฐานอ้างอิง

ในคู่มือนี้ เราได้รวบรวมบทเรียน RAGFlow ที่ดีที่สุดที่คุณสามารถทำตามได้ในวันนี้ วิธีการเลือกบทเรียนที่เหมาะสมกับ stack ของคุณ และแผนงานที่เป็นประโยชน์เพื่อก้าวจาก “hello world” ไปสู่ production เราจะเน้นที่การใช้งานจริง โดยมีตัวอย่าง ข้อผิดพลาดที่ควรหลีกเลี่ยง และเคล็ดลับที่คุณจะไม่พบในบทแนะนำพื้นฐาน

เรากำลังใช้วิธีการที่เน้นการปฏิบัติและการแก้ปัญหา: คำอธิบายสั้นๆ ขั้นตอนที่ชัดเจน และ snippets ที่สามารถคัดลอกและวางได้ ช่วยให้คุณสามารถสร้างแอป RAGFlow ที่ตอบคำถามได้อย่างถูกต้อง

อะไรคือสิ่งที่ทำให้ “บทเรียน RAGFlow ที่ดีที่สุด”?

ไม่ใช่ทุกบทเรียนที่จะเหมือนกัน บทเรียน RAGFlow ที่ดีที่สุดมีลักษณะร่วมกันดังนี้:

โฟลว์แบบ end-to-end: นำเข้า → แบ่งส่วน → ฝัง → ทำดัชนี → ดึงข้อมูล → สร้าง ทั้งหมดในเส้นทางเดียว

เอกสารที่สมจริง: ไฟล์ PDF, HTML, สไลด์ หรือ logs ที่ยุ่งเหยิง ไม่ใช่แค่ markdown ที่เป็นของเล่น

การประเมินผลในตัว: สอนวิธีการวัดความถูกต้องตามความเป็นจริง เวลาแฝง และคุณภาพของคำตอบ

ข้อกังวลด้าน Production: Caching, การลองใหม่, การตรวจสอบ และ guardrails

ขยายได้: แสดงจุดที่จะสลับโมเดล กลยุทธ์การแบ่งส่วน หรือ vector stores

โปรดคำนึงถึงเกณฑ์เหล่านี้เมื่อคุณเลือกเส้นทางการเรียนรู้ของคุณ

10 สุดยอดบทเรียน RAGFlow ในขณะนี้

ด้านล่างนี้คือรายการที่คัดสรรมาซึ่งครอบคลุมตั้งแต่ระดับเริ่มต้นจนถึงระดับสูง แต่ละรายการประกอบด้วยเหตุผลว่าทำไมจึงมีประโยชน์ สิ่งที่คุณจะได้สร้าง และเหมาะสำหรับใคร

1) RAGFlow Quickstart: ไปป์ไลน์ End-to-End แรกของคุณ

เหตุผลที่ยอดเยี่ยม: วิธีที่เร็วที่สุดในการทำความเข้าใจส่วนประกอบต่างๆ เหมาะอย่างยิ่งสำหรับการปลดล็อกตัวเอง

สิ่งที่คุณจะได้สร้าง: ไปป์ไลน์ขั้นต่ำ: อัปโหลด PDF, แบ่งส่วนอัตโนมัติ, ฝัง, ทำดัชนี และ query พร้อม citations

ขั้นตอนสำคัญ:

เปิด RAGFlow และเปิดตัวสร้างไปป์ไลน์

เพิ่ม node สำหรับนำเข้าไฟล์และชี้ไปที่ PDF

แทรก chunker (เช่น recursive + headings) และ node โมเดลการฝัง

เชื่อมต่อกับ vector store จากนั้นเพิ่ม nodes สำหรับการดึงข้อมูลและการสร้าง LLM

ทดสอบด้วย queries สองสามรายการและตรวจสอบ sources

เหมาะสำหรับ: ผู้เริ่มต้น, ทีมที่ตรวจสอบโฟลว์พื้นฐานของ RAGFlow

2) RAGFlow + แหล่งข้อมูลหลายแห่ง: PDF, Web Pages และ Notion

เหตุผลที่ยอดเยี่ยม: โปรเจ็กต์ส่วนใหญ่ในโลกจริงรวมแหล่งข้อมูลที่ยุ่งเหยิง บทเรียนนี้แสดงวิธีการ

สิ่งที่คุณจะได้สร้าง: ไปป์ไลน์ที่นำเข้า PDF, crawls URLs และ syncs หน้า Notion ตามกำหนดเวลา

ขั้นตอนสำคัญ:

ใช้ nodes สำหรับนำเข้าแยกกันต่อแหล่งข้อมูล

ทำให้ metadata เป็นมาตรฐาน (title, URL, author, section)

Tag chunks ตามแหล่งที่มาเพื่อการกรองที่ดีขึ้นในเวลาที่ดึงข้อมูล

เหมาะสำหรับ: ฐานความรู้, wikis และ portals ภายใน

3) Chunking Masterclass: จาก Naive Splits สู่ Semantic Windows

เหตุผลที่ยอดเยี่ยม: Chunking คือจุดที่คุณภาพของ RAG ส่วนใหญ่จะดีหรือไม่ดี

สิ่งที่คุณจะได้สร้าง: การประเมินกลยุทธ์ chunking แบบ side-by-side พร้อม metrics การ grounding

ขั้นตอนสำคัญ:

เปรียบเทียบ fixed-size, recursive-heading และ semantic-chunking

ใช้ overlap windows สำหรับ tables และ code blocks

ประเมิน precision/recall ของ chunks ที่ดึงมา

เคล็ดลับ: ทำให้ chunks มีขนาดเล็กพอที่จะมีความเกี่ยวข้อง แต่ใหญ่พอสำหรับ context (โดยทั่วไปคือ 300–700 tokens โดยมี overlap 10–20%)

4) Embeddings at Scale: การสลับโมเดลและ Vector Stores

เหตุผลที่ยอดเยี่ยม: การเลือกโมเดลจะตัดสินใจเพดานการดึงข้อมูลของคุณอย่างเงียบๆ

สิ่งที่คุณจะได้สร้าง: ตัวแปรไปป์ไลน์ที่สลับ embeddings (เช่น text-embedding-3-large, BGE, E5) และ vector stores (FAISS, Milvus, PGVector)

ขั้นตอนสำคัญ:

รันการทดสอบการดึงข้อมูล A/B ด้วย queries ที่สอดคล้องกัน

ติดตาม hit rates และ Mean Reciprocal Rank

เลือกระหว่าง cosine กับ dot-product similarity ตามคำแนะนำของโมเดล

เหมาะสำหรับ: ทีมที่เตรียมพร้อมสำหรับการเติบโตหรือการปรับแต่งต้นทุนและประสิทธิภาพ

5) Guardrails และ Hallucination Mitigation ใน RAGFlow

เหตุผลที่ยอดเยี่ยม: ความปลอดภัยไม่ใช่ทางเลือกใน production

สิ่งที่คุณจะได้สร้าง: ไปป์ไลน์ที่เสริมการดึงข้อมูลด้วยข้อจำกัดของคำตอบ นโยบายการปฏิเสธ และการตรวจสอบ citation

ขั้นตอนสำคัญ:

เพิ่ม node สำหรับตรวจสอบความถูกต้องของคำตอบเพื่อให้แน่ใจว่าทุกคำตอบอ้างอิงอย่างน้อย N sources

ใช้ instruction template ที่ห้ามการคาดเดาและกำหนดให้ใช้คำว่า “I don’t know” เมื่อไม่มีหลักฐาน

เพิ่มการตรวจสอบข้อเท็จจริงหลังการสร้างเทียบกับ chunks ที่ดึงมา

6) RAGFlow สำหรับ Structured Data: SQL + Text Hybrid Retrieval

เหตุผลที่ยอดเยี่ยม: คำถามมากมายผสมผสานเอกสารและ databases

สิ่งที่คุณจะได้สร้าง: ไปป์ไลน์ dual-retriever: การดึงข้อมูลเชิงความหมายสำหรับ docs และ tool-calling สำหรับ SQL

ขั้นตอนสำคัญ:

Route คำถามเชิงปริมาณไปยัง SQL ผ่าน function calling

รวม SQL result table เป็น context artifact ไปยัง LLM

รวมกับ document snippets สำหรับคำอธิบายที่เป็น narrative

7) การประเมินคุณภาพ RAG ด้วย Golden Sets และ Human Review

เหตุผลที่ยอดเยี่ยม: หากไม่มี evals คุณกำลังบินแบบไม่เห็นอะไรเลย

สิ่งที่คุณจะได้สร้าง: evaluation harness ที่วัดความถูกต้องตามความเป็นจริง, citation coverage และ helpfulness

ขั้นตอนสำคัญ:

เตรียม 50–200 gold Q&A pairs พร้อม sources

ตั้งค่า automatic runs หลังจากการเปลี่ยนแปลงไปป์ไลน์แต่ละครั้ง

ใช้ agreement scoring ระหว่าง model answers และ gold references

8) RAGFlow ใน Production: Caching, Timeouts และ Observability

เหตุผลที่ยอดเยี่ยม: Production แนะนำ latency, rate limits และ cost constraints

สิ่งที่คุณจะได้สร้าง: ไปป์ไลน์ที่แข็งแกร่งพร้อม request caching, retries และ trace dashboards

ขั้นตอนสำคัญ:

เพิ่ม vector และ generation caches โดย keyed ตาม normalized queries

ใช้ backoff สำหรับ provider hiccups

Emit spans/metrics สำหรับ retrieval latency และ token usage

9) Domain-Specific Playbooks: Legal, Healthcare และ Support

เหตุผลที่ยอดเยี่ยม: ข้อจำกัดของโดเมนเปลี่ยนแปลงทุกสิ่ง

สิ่งที่คุณจะได้สร้าง: Templates ที่เคารพ compliance, vocabulary และ reasoning patterns ต่อโดเมน

ขั้นตอนสำคัญ:

Legal: จัดลำดับความสำคัญของ sections, citations พร้อม paragraph IDs

Healthcare: de-identify PHI, จำกัดคำแนะนำให้อยู่ใน guidelines

Support: รวม ticket history; ให้ความสำคัญกับ recent docs มากขึ้น

10) RAGFlow + Function Calling: Actions, Not Just Answers

เหตุผลที่ยอดเยี่ยม: ระบบ RAG ที่ทรงพลังที่สุดสามารถอ่าน ให้เหตุผล และดำเนินการได้

สิ่งที่คุณจะได้สร้าง: ไปป์ไลน์ที่ LLM ดึงข้อมูล docs จากนั้นเรียกใช้ tools เช่น การส่งอีเมล การเปิด tickets หรือการ scheduling jobs

ขั้นตอนสำคัญ:

กำหนด JSON schemas สำหรับ tools

เพิ่ม decision router เพื่อแยก queries “answer” กับ “act”

Log ทุก tool call พร้อม guardrails และ approvals

แผนงานที่เป็นประโยชน์: จากบทเรียนสู่ Production ใน 30 วัน

ใช้บทเรียนข้างต้นในแผน 4 ขั้นตอนนี้ ถือว่านี่เป็น “RAGFlow bootcamp” ของคุณ

สัปดาห์ที่ 1: Foundations และ First Wins

ทำบทเรียนที่ 1 (Quickstart) และบทเรียนที่ 3 (Chunking Masterclass) ให้เสร็จ

สร้าง proof of concept ที่ตอบคำถามทดสอบ 20–30 ข้อจาก docs ของคุณ

เพิ่ม basic answer templates เพื่อบังคับใช้ citations และ refusals

สัปดาห์ที่ 2: Data Depth และ Reliability

เพิ่ม multi-source ingestion (บทเรียนที่ 2) และ schedule re-indexing

สลับ embeddings และ vector store (บทเรียนที่ 4); เลือกผู้ชนะด้านต้นทุน/คุณภาพ

แนะนำ caching และ timeouts (บทเรียนที่ 8) เพื่อรักษา latency ให้สม่ำเสมอ

สัปดาห์ที่ 3: Evals, Guardrails และ Domain Fit

สร้าง golden set และ automatic evals (บทเรียนที่ 7)

เพิ่ม post-generation fact-checks และ refusal policy (บทเรียนที่ 5)

ใช้ domain playbook (บทเรียนที่ 9) พร้อม custom prompts

สัปดาห์ที่ 4: Hybrid Retrieval และ Actionability

Wire up SQL/tool calling (บทเรียนที่ 6) สำหรับ mixed queries

เพิ่ม function calling และ approvals (บทเรียนที่ 10) เพื่อให้แอป RAGFlow ของคุณสามารถดำเนินการได้

Instrument observability dashboards; ตั้งค่า SLOs สำหรับ accuracy และ latency

แนวคิด RAGFlow ที่คุณต้องรู้

แม้แต่บทเรียน RAGFlow ที่ดีที่สุดก็ยังถือว่ามีแนวคิดหลักสองสามข้อ ต่อไปนี้เป็นการทบทวนอย่างรวดเร็ว

Retrieval Augmented Generation (RAG): เสริม context ของ LLM ด้วย chunks ที่ดึงมาจากฐานความรู้ของคุณ เพื่อให้คำตอบมีหลักฐานอ้างอิง

Chunking: การแบ่งเอกสารออกเป็นหน่วยที่สามารถดึงข้อมูลได้ Overlaps รักษา context; headings สร้าง boundaries; semantic methods ใช้ embeddings เพื่อค้นหา breakpoints ตามธรรมชาติ

Embeddings: Vector representations ของ chunks และ queries Embeddings ที่ดีกว่าช่วยปรับปรุง retrieval relevance และลด hallucinations

Vector Store: Database สำหรับ vectors พร้อม similarity search ตัวเลือกต่างๆ ส่งผลต่อความเร็ว, recall และ scale

Reranking: Optional second-stage scorer เพื่อเรียงลำดับ chunks ที่ดึงมาใหม่ตาม relevance

Prompt Engineering: คำแนะนำที่ชัดเจนเพื่อกำหนดให้มีการอ้างอิง, ห้ามการคาดเดา และจัดรูปแบบ output

Evals: การวัดผลอย่างเป็นระบบโดยใช้ golden sets, human review และ automatic metrics

Copy-Paste Starter: Baseline RAG Prompt Template

ใช้ template นี้ใน generation node ของคุณเพื่อลด hallucinations และบังคับใช้ citations

คุณคือผู้ช่วยที่รอบคอบซึ่งตอบคำถามโดยใช้ข้อมูลที่พบใน retrieved context เท่านั้น
กฎ:
- อ้างอิงหลักฐานด้วย [source_name:page_or_section] หลังจากการกล่าวอ้างแต่ละครั้ง
- หากคำตอบไม่อยู่ใน context ให้พูดว่า "I don't know based on the provided sources."
- ชอบการอ้างอิงโดยตรงสำหรับ definitions; สรุปสำหรับ procedures
Context:
{{retrieved_context}}
คำถาม:
{{user_query}}
คำตอบ:

ตัวอย่าง: การสลับ Embeddings และการวัดผลกระทบ

# Pseudocode ที่แสดงตรรกะการทดลองที่คุณจะเห็นในบทเรียนขั้นสูง
from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness
pipelines = []
for model in ["text-embedding-3-large", "bge-large", "e5-large"]:
emb = EmbeddingNode(model=model)
vs = VectorStoreNode(kind="milvus", metric="cosine")
pl = Pipeline.add_nodes([
"ingest", "chunk", emb, vs, "retrieve", "generate"
])
pipelines.append((model, pl))
h = EvalHarness(goldset="gold_qa.jsonl")
results = {}
for model, pl in pipelines:
results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"])
print(results)

Interpretation cheat sheet:

หาก groundedness เพิ่มขึ้นหลังจากการสลับโมเดล ให้เก็บไว้ แม้ว่า tokens จะมีราคาสูงกว่าเล็กน้อย

หาก latency สูงขึ้น ให้เพิ่ม caching หรือลดจำนวน chunks ที่ดึงมาสูงสุดจาก 8 → 5

หาก citation coverage ลดลง ให้ปรับขนาด chunk หรือเพิ่ม reranking

ข้อผิดพลาดทั่วไปที่บทเรียนเหล่านี้ช่วยคุณหลีกเลี่ยง

Over-chunking: Chunks ที่เล็กเกินไปนำไปสู่ context ที่ขาดหายไปและคำตอบที่ไม่ชัดเจน

Under-chunking: Chunks ขนาดใหญ่มลพิษ windows context ด้วยข้อความที่ไม่เกี่ยวข้อง

One-size-fits-all embeddings: Domain-language (legal, clinical) อาจต้องใช้ domain-tuned models

ไม่มี evals: การเปลี่ยนแปลงสิ่งใดๆ โดยไม่มี baseline จะสร้าง phantom regressions

Ignoring freshness: Indexes ที่ล้าสมัยนำไปสู่คำตอบที่ถูกต้องแต่ล้าสมัย

Skipping guardrails: หากไม่มี refusal rules โมเดลของคุณจะคาดเดา

การเลือกบทเรียนที่เหมาะสมสำหรับ Use Case ของคุณ

Startup support bot: บทเรียนที่ 1, 2, 5, 8, 9

Internal research assistant: บทเรียนที่ 1, 3, 4, 7

Data analytics copilot: บทเรียนที่ 6, 10

Regulated industries: บทเรียนที่ 5 และ 9 ก่อน จากนั้น 7

By the Way: Prototype เร็วขึ้นด้วย Sider.AI

เมื่อคุณกำลัง iterate บน RAG prompts, testing queries และเปรียบเทียบ responses การสลับ context มีค่าใช้จ่ายสูง สิ่งที่ควรทราบ: Sider.AI (https://sider.ai/) ช่วยให้คุณสามารถแชทกับโมเดลต่างๆ แบบ side by side, ปักหมุด prompts และรักษาสภาพแวดล้อมการทำงานของความรู้ที่กำลังดำเนินอยู่ มีประโยชน์สำหรับ:

การเปรียบเทียบคำตอบจาก retrieval settings และ prompts ที่แตกต่างกัน

การรัน what-if tests อย่างรวดเร็วก่อนที่คุณจะ bake changes ลงใน RAGFlow

การจัดระเบียบ snippets, citations และ gold Q&A สำหรับ eval harness ของคุณ

ใช้เป็น scratchpad ของคุณในขณะที่คุณทำตามบทเรียน RAGFlow จากนั้น codify ผู้ชนะในไปป์ไลน์ของคุณ

Troubleshooting Guide: Fast Fixes เมื่อมีสิ่งผิดปกติ

อาการ: คำตอบเป็นแบบทั่วไปและไม่มี citations

แก้ไข: บังคับใช้ข้อกำหนด citation ใน prompt และเพิ่ม validator node

อาการ: ดึง chunks ที่ไม่เกี่ยวข้อง

แก้ไข: เพิ่ม chunk overlap, สลับไปใช้ embedding model ที่ดีกว่า หรือเพิ่ม reranking

อาการ: Latency > 3 วินาที

แก้ไข: Cache vector results, cap retrieved chunks และใช้ streaming tokens

อาการ: คำตอบที่ขัดแย้งกันใน queries

แก้ไข: ทำให้ metadata เป็นมาตรฐาน, de-duplicate near-identical chunks, ให้ความสำคัญกับ newer docs

อาการ: โมเดลปฏิเสธบ่อยเกินไปด้วยคำว่า “I don’t know”

แก้ไข: คลาย refusal threshold, ขยาย retrieval depth หรือปรับ chunk boundaries

Key Takeaways

บทเรียน RAGFlow ที่ดีที่สุดสอนระบบ end-to-end ด้วยข้อมูลและการ evals ที่สมจริง

Chunking และ embeddings มีผลกระทบมากที่สุดต่อคุณภาพของคำตอบ

ความสำเร็จในการ production ต้องใช้ caching, observability, guardrails และ golden set

ใช้ domain playbooks และ function calling เพื่อก้าวข้าม Q&A ไปสู่ workflows ที่แท้จริง

ใช้ประโยชน์จาก tools เช่น Sider.AI ในระหว่างการทดลองเพื่อเปรียบเทียบ prompts และ results อย่างรวดเร็ว

What to Do Next

เลือกสองบทเรียนที่ตรงกับความต้องการเร่งด่วนของคุณ (เช่น Quickstart + Chunking Masterclass)

ประกอบ golden Q&A set จาก docs ของคุณเอง (เริ่มต้นด้วย 50 คำถาม)

รันการเปลี่ยนแปลงทีละครั้ง; วัด groundedness และ latency หลังจากการเปลี่ยนแปลงแต่ละครั้ง

ย้ายไปยัง production templates ด้วย caching และ guardrails เมื่อ evals ของคุณคงที่

Layer ใน function calling และ domain policies เมื่อ baseline ของคุณเชื่อถือได้

FAQ

Q1: บทเรียน RAGFlow ที่ดีที่สุดสำหรับผู้เริ่มต้นคืออะไร? เริ่มต้นด้วยบทเรียน RAGFlow quickstart ที่ครอบคลุมการนำเข้า PDF, การแบ่งส่วน, การฝัง, การทำดัชนี, การดึงข้อมูล และการสร้างด้วย citations ช่วยให้คุณรู้สึกถึง end-to-end ได้อย่างรวดเร็วและเตรียมคุณสำหรับบทเรียน RAGFlow ที่ลึกซึ้งยิ่งขึ้น

Q2: ฉันจะปรับปรุงความถูกต้องใน RAGFlow นอกเหนือจากบทเรียนพื้นฐานได้อย่างไร? มุ่งเน้นไปที่กลยุทธ์การแบ่งส่วน, คุณภาพของ embeddings และการ reranking บทเรียน RAGFlow ขั้นสูงยังแสดงวิธีการเพิ่ม guardrails และ evaluation harnesses เพื่อลด hallucinations และวัดความถูกต้องตามความเป็นจริง

Q3: Embeddings ใดที่ทำงานได้ดีที่สุดกับ RAGFlow สำหรับ enterprise docs? ลองใช้ models ทั่วไปที่แข็งแกร่งเช่น text-embedding-3-large, E5 หรือ BGE จากนั้นวัด retrieval metrics บนข้อมูลของคุณ บทเรียน RAGFlow ที่ดีที่สุดแนะนำการทดสอบ A/B ข้าม models และ vector stores เพื่อเลือกผู้ชนะ

Q4: RAGFlow สามารถจัดการกับ structured data เช่น SQL พร้อมกับเอกสารได้หรือไม่? ใช่ บทเรียนการดึงข้อมูลแบบ hybrid สำหรับ RAGFlow แสดงวิธีการ route queries เชิงปริมาณไปยัง SQL ผ่าน function calling ในขณะที่ยังคงใช้การดึงข้อมูลเชิงความหมายสำหรับ unstructured docs จากนั้นรวม results ในเวลาที่สร้าง

Q5: ฉันจะประเมิน RAGFlow pipeline ก่อนที่จะเปิดใช้งานได้อย่างไร? ทำตามบทเรียน RAGFlow ที่เน้นการประเมิน: สร้าง golden Q&A set พร้อม sources, รัน automated tests หลังจากการเปลี่ยนแปลง และติดตาม groundedness, citation coverage, latency และ helpfulness เฉพาะเมื่อ metrics คงที่เท่านั้น