What is the best RAGFlow tutorial for absolute beginners?

Start with a RAGFlow quickstart tutorial that covers ingesting a PDF, chunking, embedding, indexing, retrieving, and generating with citations. It gives you an end-to-end feel fast and sets you up for deeper RAGFlow tutorials.

How do I improve accuracy in RAGFlow beyond basic tutorials?

Focus on chunking strategy, embeddings quality, and reranking. Advanced RAGFlow tutorials also show how to add guardrails and evaluation harnesses to reduce hallucinations and quantify groundedness.

Which embeddings work best with RAGFlow for enterprise docs?

Try strong general models like text-embedding-3-large, E5, or BGE, then measure retrieval metrics on your data. The best RAGFlow tutorials recommend A/B tests across models and vector stores to pick the winner.

Can RAGFlow handle structured data like SQL along with documents?

Yes. Hybrid retrieval tutorials for RAGFlow show how to route quantitative queries to SQL via function calling while still using semantic retrieval for unstructured docs, then merge results at generation time.

How do I evaluate a RAGFlow pipeline before going live?

Follow evaluation-focused RAGFlow tutorials: create a golden Q&A set with sources, run automated tests after changes, and track groundedness, citation coverage, latency, and helpfulness. Only deploy when metrics stabilize.

10 лучших руководств по RAGFlow для освоения Retrieval-Augmented Generation

Если вы когда-либо пытались заставить большую языковую модель отвечать на вопросы, специфичные для предметной области, и наблюдали, как она уверенно галлюцинирует, вы почувствовали ту боль, которую решает RAGFlow. Retrieval-Augmented Generation (RAG) объединяет поисковый уровень с генерацией, чтобы ваша модель цитировала факты из ваших собственных данных. RAGFlow - это открытый, визуальный и управляемый конвейером способ построить эту систему от начала до конца - от приема документов до разбиения на фрагменты, встраивания, векторного поиска и обоснованных ответов.

В этом руководстве мы собрали лучшие руководства по RAGFlow, которым вы можете следовать сегодня, как выбрать подходящее для вашего стека, и практическую дорожную карту для перехода от "hello world" к производству. Мы будем придерживаться прагматичного подхода с примерами, ловушками и несколькими полезными советами, которые вы не найдете в базовых инструкциях.

Мы придерживаемся практического и ориентированного на решение подхода: короткие объяснения, четкие шаги и фрагменты, которые можно скопировать и вставить. Давайте поможем вам создать приложение RAGFlow, которое действительно отвечает правильно.

Что делает "лучшее руководство по RAGFlow"?

Не все руководства одинаковы. Лучшие руководства по RAGFlow обладают несколькими общими чертами:

Сквозной поток: Ingest → chunk → embed → index → retrieve → generate, все в одном пути.

Реалистичные документы: PDF, HTML, слайды или беспорядочные журналы - а не просто игрушечная разметка.

Встроенная оценка: Они учат, как измерять обоснованность, задержку и качество ответов.

Производственные вопросы: Кэширование, повторные попытки, наблюдаемость и ограждения.

Расширяемость: Покажите, где менять модели, стратегии разбиения на фрагменты или векторные хранилища.

Имейте в виду эти критерии при выборе своего пути обучения.

10 лучших руководств по RAGFlow прямо сейчас

Ниже приведен курируемый список, охватывающий уровни от начинающего до продвинутого. Каждая запись включает в себя, почему она полезна, что вы будете строить и для кого она предназначена.

1) RAGFlow Quickstart: Ваш первый сквозной конвейер

Почему это здорово: Самый быстрый способ понять движущиеся части - идеально подходит для того, чтобы разблокироваться.

Вы построите: Минимальный конвейер: загрузите PDF, автоматическое разбиение на фрагменты, встраивание, индексация и запрос с цитатами.

Ключевые шаги:

Запустите RAGFlow и откройте конструктор конвейеров.

Добавьте узел приема файлов и укажите на PDF.

Вставьте модуль разбиения на фрагменты (например, рекурсивный + заголовки) и узел модели встраивания.

Подключитесь к векторному хранилищу, затем добавьте узлы извлечения и генерации LLM.

Протестируйте с помощью нескольких запросов и проверьте источники.

Подходит для: Абсолютных новичков; команд, проверяющих базовый поток RAGFlow.

2) RAGFlow + несколько источников данных: PDF-файлы, веб-страницы и Notion

Почему это здорово: Большинство реальных проектов объединяют беспорядочные источники; этот учебник показывает, как это сделать.

Вы построите: Конвейер, который принимает PDF-файлы, сканирует URL-адреса и синхронизирует страницы Notion по расписанию.

Ключевые шаги:

Используйте отдельные узлы приема для каждого источника.

Нормализуйте метаданные (заголовок, URL, автор, раздел).

Пометьте фрагменты по источнику для лучшей фильтрации во время извлечения.

Подходит для: Баз знаний, вики и внутренних порталов.

3) Masterclass по разделению на фрагменты: от наивных разделений до семантических окон

Почему это здорово: Разделение на фрагменты - это то, где выигрывается или проигрывается большая часть качества RAG.

Вы построите: Параллельная оценка стратегий разбиения на фрагменты с метриками обоснования.

Ключевые шаги:

Сравните фиксированный размер, рекурсивный заголовок и семантическое разделение на фрагменты.

Используйте перекрывающиеся окна для таблиц и блоков кода.

Оцените точность/полноту извлеченных фрагментов.

Совет: Сохраняйте фрагменты достаточно маленькими для релевантности, но достаточно большими для контекста (часто 300–700 токенов с перекрытием 10–20%).

4) Встраивание в масштабе: Замена моделей и векторных хранилищ

Почему это здорово: Выбор модели молча решает ваш потолок извлечения.

Вы построите: Вариант конвейера, который заменяет встраивания (например, text-embedding-3-large, BGE, E5) и векторные хранилища (FAISS, Milvus, PGVector).

Ключевые шаги:

Запустите A/B-тесты извлечения с согласованными запросами.

Отслеживайте частоту попаданий и средний взаимный ранг.

Выберите косинусное сходство по сравнению со скалярным произведением в соответствии с руководством по модели.

Подходит для: Команд, готовящихся к росту или настройке затрат и производительности.

5) Ограждения и смягчение галлюцинаций в RAGFlow

Почему это здорово: Безопасность не является необязательной в производстве.

Вы построите: Конвейер дополненного извлечения с ограничениями ответов, политиками отказа и проверками цитирования.

Ключевые шаги:

Добавьте узел проверки ответов, чтобы убедиться, что каждый ответ цитирует как минимум N источников.

Используйте шаблон инструкций, который запрещает угадывание и требует "Я не знаю", когда доказательства отсутствуют.

Добавьте проверку фактов после генерации по отношению к извлеченным фрагментам.

6) RAGFlow для структурированных данных: гибридное извлечение SQL + текста

Почему это здорово: Многие вопросы смешивают документы и базы данных.

Вы построите: Конвейер с двумя извлекателями: семантическое извлечение для документов и вызов инструментов для SQL.

Ключевые шаги:

Перенаправляйте количественные вопросы в SQL с помощью вызова функций.

Включите таблицу результатов SQL в качестве контекстного артефакта для LLM.

Объедините со фрагментами документов для повествовательных объяснений.

7) Оценка качества RAG с помощью золотых наборов и проверки человеком

Почему это здорово: Без оценок вы летите вслепую.

Вы построите: Оценочную оснастку, которая измеряет обоснованность, охват цитированием и полезность.

Ключевые шаги:

Подготовьте 50–200 золотых пар вопросов и ответов с источниками.

Настройте автоматические запуски после каждого изменения конвейера.

Используйте оценку согласованности между ответами модели и золотыми ссылками.

8) RAGFlow в производстве: Кэширование, тайм-ауты и наблюдаемость

Почему это здорово: Производство вводит задержку, ограничения скорости и ограничения по затратам.

Вы построите: Надежный конвейер с кэшированием запросов, повторными попытками и панелями мониторинга трассировки.

Ключевые шаги:

Добавьте векторные и генерационные кэши, ключом которых являются нормализованные запросы.

Реализуйте откат для сбоев поставщика.

Выдавайте диапазоны/метрики для задержки извлечения и использования токенов.

9) Плейбуки для конкретных областей: Юридическая, здравоохранение и поддержка

Почему это здорово: Ограничения области меняют все.

Вы построите: Шаблоны, которые учитывают соответствие требованиям, словарный запас и шаблоны рассуждений для каждой области.

Ключевые шаги:

Юридическая: расставьте приоритеты для разделов, цитат с идентификаторами абзацев.

Здравоохранение: обезличьте PHI, ограничьте советы рекомендациями.

Поддержка: интегрируйте историю тикетов; взвешивайте недавние документы выше.

10) RAGFlow + Вызов функций: Действия, а не только ответы

Почему это здорово: Самые мощные системы RAG могут читать, рассуждать и действовать.

Вы построите: Конвейер, в котором LLM извлекает документы, затем вызывает инструменты - отправляет электронные письма, открывает тикеты или планирует задания.

Ключевые шаги:

Определите схемы JSON для инструментов.

Добавьте маршрутизатор принятия решений, чтобы отделить запросы "ответ" от запросов "действие".

Регистрируйте каждый вызов инструмента с помощью ограждений и утверждений.

Практическая дорожная карта: от учебника до производства за 30 дней

Используйте приведенные выше учебники в этом 4-этапном плане. Рассматривайте это как свой "учебный лагерь RAGFlow".

Неделя 1: Основы и первые победы

Завершите учебник 1 (Quickstart) и учебник 3 (Masterclass по разделению на фрагменты).

Разработайте концепцию, отвечающую на 20–30 тестовых вопросов из ваших документов.

Добавьте базовые шаблоны ответов, чтобы обеспечить цитирование и отказ.

Неделя 2: Глубина данных и надежность

Добавьте прием из нескольких источников (учебник 2) и запланируйте повторное индексирование.

Замените встраивания и векторное хранилище (учебник 4); выберите победителя по стоимости/качеству.

Внедрите кэширование и тайм-ауты (учебник 8), чтобы обеспечить постоянную задержку.

Неделя 3: Оценки, ограждения и соответствие домену

Создайте золотой набор и автоматические оценки (учебник 7).

Добавьте проверки фактов после создания и политику отказа (учебник 5).

Примените плейбук домена (учебник 9) с пользовательскими подсказками.

Неделя 4: Гибридное извлечение и возможность действий

Подключите вызов SQL/инструментов (учебник 6) для смешанных запросов.

Добавьте вызов функций и утверждения (учебник 10), чтобы ваше приложение RAGFlow могло выполнять действия.

Инструментируйте панели мониторинга наблюдаемости; установите SLO для точности и задержки.

Концепции RAGFlow, которые вы должны знать

Даже лучшие учебники по RAGFlow предполагают несколько основных идей. Вот краткое напоминание.

Retrieval Augmented Generation (RAG): Дополните контекст LLM извлеченными фрагментами из вашей базы знаний, чтобы ответы были основаны на доказательствах.

Разбиение на фрагменты: Разделение документов на извлекаемые единицы. Перекрытия сохраняют контекст; заголовки создают границы; семантические методы используют встраивания для поиска естественных точек останова.

Встраивания: Векторные представления фрагментов и запросов. Более качественные встраивания улучшают релевантность извлечения и уменьшают галлюцинации.

Векторное хранилище: База данных для векторов с поиском по сходству. Выбор влияет на скорость, полноту и масштаб.

Переранжирование: Дополнительный оценщик второго этапа для переупорядочивания извлеченных фрагментов по релевантности.

Инженерия подсказок: Четкие инструкции для запроса цитат, запрета догадок и форматирования вывода.

Оценки: Систематическое измерение с использованием золотых наборов, проверки человеком и автоматических метрик.

Стартовый пакет для копирования и вставки: Базовый шаблон подсказки RAG

Используйте этот шаблон в своем узле генерации, чтобы уменьшить галлюцинации и обеспечить цитирование.

Вы - внимательный помощник, который отвечает ТОЛЬКО информацией, найденной в извлеченном контексте.
Правила:
- Ссылайтесь на доказательства с помощью [source_name:page_or_section] после каждого утверждения.
- Если ответа нет в контексте, скажите: "Я не знаю, основываясь на предоставленных источниках".
- Предпочитайте прямые цитаты для определений; обобщайте для процедур.
Контекст:
{{retrieved_context}}
Вопрос:
{{user_query}}
Ответ:

Пример: Замена встраиваний и измерение воздействия

# Псевдокод, иллюстрирующий логику эксперимента, которую вы увидите в продвинутых учебниках
from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness
pipelines = []
for model in ["text-embedding-3-large", "bge-large", "e5-large"]:
emb = EmbeddingNode(model=model)
vs = VectorStoreNode(kind="milvus", metric="cosine")
pl = Pipeline.add_nodes([
"ingest", "chunk", emb, vs, "retrieve", "generate"
<a10>])</a11>
h = EvalHarness(goldset="gold_qa.jsonl")
results = {}
for model, pl in pipelines:
results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"])
print(results)

Шпаргалка по интерпретации:

Если обоснованность подскочит после замены модели, сохраните ее - даже если токены стоят немного дороже.

Если задержка увеличивается, добавьте кэширование или уменьшите максимальное количество извлеченных фрагментов с 8 → 5.

Если охват цитированием падает, измените размер фрагмента или добавьте переранжирование.

Общие ошибки, которых эти учебники помогут вам избежать

Переразбиение на фрагменты: Слишком маленькие фрагменты приводят к отсутствию контекста и шумным ответам.

Недоразбиение на фрагменты: Огромные фрагменты загрязняют контекстные окна нерелевантным текстом.

Встраивания одного размера для всех: Для языка домена (юридического, клинического) могут потребоваться модели, настроенные для домена.

Нет оценок: Изменение чего-либо без базового уровня создает фантомные регрессии.

Игнорирование свежести: Устаревшие индексы приводят к правильным, но устаревшим ответам.

Пропуск ограждений: Без правил отказа ваша модель угадывает.

Выбор подходящего учебника для вашего варианта использования

Бот поддержки стартапа: Учебники 1, 2, 5, 8, 9.

Внутренний помощник по исследованиям: Учебники 1, 3, 4, 7.

Второй пилот по анализу данных: Учебники 6, 10.

Регулируемые отрасли: Сначала учебники 5 и 9, затем 7.

Кстати: Прототипируйте быстрее с помощью Sider.AI

Когда вы итерируете подсказки RAG, тестируете запросы и сравниваете ответы, переключение контекста обходится дорого. Стоит отметить: Sider.AI (https://sider.ai/) позволяет вам общаться с несколькими моделями бок о бок, закреплять подсказки и поддерживать рабочее пространство знаний. Это удобно для:

Сравнение ответов из разных настроек извлечения и подсказок.

Запуск быстрых тестов "что, если" перед внесением изменений в RAGFlow.

Организация фрагментов, цитат и золотых вопросов и ответов для вашей оценочной оснастки.

Используйте его в качестве черновика, пока вы следуете учебникам RAGFlow; затем кодифицируйте победителя в своем конвейере.

Руководство по устранению неполадок: Быстрые исправления, когда все ломается

Симптом: Ответы общие и не содержат цитат.

Исправление: Обеспечьте требование цитирования в подсказке и добавьте узел проверки.

Симптом: Извлечены нерелевантные фрагменты.

Исправление: Увеличьте перекрытие фрагментов, переключитесь на лучшую модель встраивания или добавьте переранжирование.

Симптом: Задержка > 3 секунд.

Исправление: Кэшируйте векторные результаты, ограничьте извлеченные фрагменты и используйте потоковую передачу токенов.

Симптом: Противоречивые ответы на запросы.

Исправление: Нормализуйте метаданные, удалите почти идентичные фрагменты, взвесьте более новые документы.

Симптом: Модель слишком часто отказывается с ответом "Я не знаю".

Исправление: Ослабьте порог отказа, увеличьте глубину извлечения или уточните границы фрагментов.

Ключевые выводы

Лучшие учебники по RAGFlow обучают сквозным системам с реалистичными данными и оценками.

Разбиение на фрагменты и встраивания оказывают наибольшее влияние на качество ответов.

Успех в производстве требует кэширования, наблюдаемости, ограждений и золотого набора.

Используйте плейбуки домена и вызов функций, чтобы выйти за рамки вопросов и ответов и перейти к реальным рабочим процессам.

Используйте такие инструменты, как Sider.AI во время экспериментов, чтобы быстро сравнивать подсказки и результаты.

Что делать дальше

Выберите два учебника, которые соответствуют вашей непосредственной потребности (например, Quickstart + Masterclass по разделению на фрагменты).

Соберите золотой набор вопросов и ответов из собственных документов (начните с 50 вопросов).

Вносите одно изменение за раз; измеряйте обоснованность и задержку после каждого.

Перейдите к производственным шаблонам с кэшированием и ограждениями, когда ваши оценки стабилизируются.

Добавьте вызов функций и политики домена, как только ваш базовый уровень станет надежным.

FAQ

Q1:Какой учебник по RAGFlow лучше всего подходит для абсолютных новичков? Начните с краткого руководства по RAGFlow, которое охватывает прием PDF, разбиение на фрагменты, встраивание, индексацию, извлечение и генерацию с цитатами. Это быстро дает вам сквозное ощущение и подготовит вас к более глубоким учебникам по RAGFlow.

Q2:Как улучшить точность в RAGFlow за пределами базовых учебников? Сосредоточьтесь на стратегии разбиения на фрагменты, качестве встраиваний и переранжировании. Продвинутые учебники по RAGFlow также показывают, как добавлять ограждения и оценочные оснастки, чтобы уменьшить галлюцинации и количественно оценить обоснованность.

Q3:Какие встраивания лучше всего работают с RAGFlow для корпоративных документов? Попробуйте мощные общие модели, такие как text-embedding-3-large, E5 или BGE, затем измерьте метрики извлечения на ваших данных. Лучшие учебники по RAGFlow рекомендуют A/B-тесты по моделям и векторным хранилищам, чтобы выбрать победителя.

Q4:Может ли RAGFlow обрабатывать структурированные данные, такие как SQL, вместе с документами? Да. Учебники по гибридному извлечению для RAGFlow показывают, как направлять количественные запросы в SQL с помощью вызова функций, при этом используя семантическое извлечение для неструктурированных документов, а затем объединять результаты во время генерации.

Q5:Как оценить конвейер RAGFlow перед запуском? Следуйте учебникам по RAGFlow, ориентированным на оценку: создайте золотой набор вопросов и ответов с источниками, запускайте автоматические тесты после изменений и отслеживайте обоснованность, охват цитированием, задержку и полезность. Развертывайте только тогда, когда метрики стабилизируются.