10 лучших руководств по RAGFlow для освоения Retrieval-Augmented Generation
Если вы когда-либо пытались заставить большую языковую модель отвечать на вопросы, специфичные для предметной области, и наблюдали, как она уверенно галлюцинирует, вы почувствовали ту боль, которую решает RAGFlow. Retrieval-Augmented Generation (RAG) объединяет поисковый уровень с генерацией, чтобы ваша модель цитировала факты из ваших собственных данных. RAGFlow - это открытый, визуальный и управляемый конвейером способ построить эту систему от начала до конца - от приема документов до разбиения на фрагменты, встраивания, векторного поиска и обоснованных ответов.
В этом руководстве мы собрали лучшие руководства по RAGFlow, которым вы можете следовать сегодня, как выбрать подходящее для вашего стека, и практическую дорожную карту для перехода от "hello world" к производству. Мы будем придерживаться прагматичного подхода с примерами, ловушками и несколькими полезными советами, которые вы не найдете в базовых инструкциях.
Мы придерживаемся практического и ориентированного на решение подхода: короткие объяснения, четкие шаги и фрагменты, которые можно скопировать и вставить. Давайте поможем вам создать приложение RAGFlow, которое действительно отвечает правильно.
Что делает "лучшее руководство по RAGFlow"?
Не все руководства одинаковы. Лучшие руководства по RAGFlow обладают несколькими общими чертами:
- Сквозной поток: Ingest → chunk → embed → index → retrieve → generate, все в одном пути.
- Реалистичные документы: PDF, HTML, слайды или беспорядочные журналы - а не просто игрушечная разметка.
- Встроенная оценка: Они учат, как измерять обоснованность, задержку и качество ответов.
- Производственные вопросы: Кэширование, повторные попытки, наблюдаемость и ограждения.
- Расширяемость: Покажите, где менять модели, стратегии разбиения на фрагменты или векторные хранилища.
Имейте в виду эти критерии при выборе своего пути обучения.
10 лучших руководств по RAGFlow прямо сейчас
Ниже приведен курируемый список, охватывающий уровни от начинающего до продвинутого. Каждая запись включает в себя, почему она полезна, что вы будете строить и для кого она предназначена.
1) RAGFlow Quickstart: Ваш первый сквозной конвейер
- Почему это здорово: Самый быстрый способ понять движущиеся части - идеально подходит для того, чтобы разблокироваться.
- Вы построите: Минимальный конвейер: загрузите PDF, автоматическое разбиение на фрагменты, встраивание, индексация и запрос с цитатами.
- Запустите RAGFlow и откройте конструктор конвейеров.
- Добавьте узел приема файлов и укажите на PDF.
- Вставьте модуль разбиения на фрагменты (например, рекурсивный + заголовки) и узел модели встраивания.
- Подключитесь к векторному хранилищу, затем добавьте узлы извлечения и генерации LLM.
- Протестируйте с помощью нескольких запросов и проверьте источники.
- Подходит для: Абсолютных новичков; команд, проверяющих базовый поток RAGFlow.
2) RAGFlow + несколько источников данных: PDF-файлы, веб-страницы и Notion
- Почему это здорово: Большинство реальных проектов объединяют беспорядочные источники; этот учебник показывает, как это сделать.
- Вы построите: Конвейер, который принимает PDF-файлы, сканирует URL-адреса и синхронизирует страницы Notion по расписанию.
- Используйте отдельные узлы приема для каждого источника.
- Нормализуйте метаданные (заголовок, URL, автор, раздел).
- Пометьте фрагменты по источнику для лучшей фильтрации во время извлечения.
- Подходит для: Баз знаний, вики и внутренних порталов.
3) Masterclass по разделению на фрагменты: от наивных разделений до семантических окон
- Почему это здорово: Разделение на фрагменты - это то, где выигрывается или проигрывается большая часть качества RAG.
- Вы построите: Параллельная оценка стратегий разбиения на фрагменты с метриками обоснования.
- Сравните фиксированный размер, рекурсивный заголовок и семантическое разделение на фрагменты.
- Используйте перекрывающиеся окна для таблиц и блоков кода.
- Оцените точность/полноту извлеченных фрагментов.
- Совет: Сохраняйте фрагменты достаточно маленькими для релевантности, но достаточно большими для контекста (часто 300–700 токенов с перекрытием 10–20%).
4) Встраивание в масштабе: Замена моделей и векторных хранилищ
- Почему это здорово: Выбор модели молча решает ваш потолок извлечения.
- Вы построите: Вариант конвейера, который заменяет встраивания (например,
text-embedding-3-large, BGE, E5) и векторные хранилища (FAISS, Milvus, PGVector).
- Запустите A/B-тесты извлечения с согласованными запросами.
- Отслеживайте частоту попаданий и средний взаимный ранг.
- Выберите косинусное сходство по сравнению со скалярным произведением в соответствии с руководством по модели.
- Подходит для: Команд, готовящихся к росту или настройке затрат и производительности.
5) Ограждения и смягчение галлюцинаций в RAGFlow
- Почему это здорово: Безопасность не является необязательной в производстве.
- Вы построите: Конвейер дополненного извлечения с ограничениями ответов, политиками отказа и проверками цитирования.
- Добавьте узел проверки ответов, чтобы убедиться, что каждый ответ цитирует как минимум N источников.
- Используйте шаблон инструкций, который запрещает угадывание и требует "Я не знаю", когда доказательства отсутствуют.
- Добавьте проверку фактов после генерации по отношению к извлеченным фрагментам.
6) RAGFlow для структурированных данных: гибридное извлечение SQL + текста
- Почему это здорово: Многие вопросы смешивают документы и базы данных.
- Вы построите: Конвейер с двумя извлекателями: семантическое извлечение для документов и вызов инструментов для SQL.
- Перенаправляйте количественные вопросы в SQL с помощью вызова функций.
- Включите таблицу результатов SQL в качестве контекстного артефакта для LLM.
- Объедините со фрагментами документов для повествовательных объяснений.
7) Оценка качества RAG с помощью золотых наборов и проверки человеком
- Почему это здорово: Без оценок вы летите вслепую.
- Вы построите: Оценочную оснастку, которая измеряет обоснованность, охват цитированием и полезность.
- Подготовьте 50–200 золотых пар вопросов и ответов с источниками.
- Настройте автоматические запуски после каждого изменения конвейера.
- Используйте оценку согласованности между ответами модели и золотыми ссылками.
8) RAGFlow в производстве: Кэширование, тайм-ауты и наблюдаемость
- Почему это здорово: Производство вводит задержку, ограничения скорости и ограничения по затратам.
- Вы построите: Надежный конвейер с кэшированием запросов, повторными попытками и панелями мониторинга трассировки.
- Добавьте векторные и генерационные кэши, ключом которых являются нормализованные запросы.
- Реализуйте откат для сбоев поставщика.
- Выдавайте диапазоны/метрики для задержки извлечения и использования токенов.
9) Плейбуки для конкретных областей: Юридическая, здравоохранение и поддержка
- Почему это здорово: Ограничения области меняют все.
- Вы построите: Шаблоны, которые учитывают соответствие требованиям, словарный запас и шаблоны рассуждений для каждой области.
- Юридическая: расставьте приоритеты для разделов, цитат с идентификаторами абзацев.
- Здравоохранение: обезличьте PHI, ограничьте советы рекомендациями.
- Поддержка: интегрируйте историю тикетов; взвешивайте недавние документы выше.
10) RAGFlow + Вызов функций: Действия, а не только ответы
- Почему это здорово: Самые мощные системы RAG могут читать, рассуждать и действовать.
- Вы построите: Конвейер, в котором LLM извлекает документы, затем вызывает инструменты - отправляет электронные письма, открывает тикеты или планирует задания.
- Определите схемы JSON для инструментов.
- Добавьте маршрутизатор принятия решений, чтобы отделить запросы "ответ" от запросов "действие".
- Регистрируйте каждый вызов инструмента с помощью ограждений и утверждений.
Практическая дорожная карта: от учебника до производства за 30 дней
Используйте приведенные выше учебники в этом 4-этапном плане. Рассматривайте это как свой "учебный лагерь RAGFlow".
Неделя 1: Основы и первые победы
- Завершите учебник 1 (Quickstart) и учебник 3 (Masterclass по разделению на фрагменты).
- Разработайте концепцию, отвечающую на 20–30 тестовых вопросов из ваших документов.
- Добавьте базовые шаблоны ответов, чтобы обеспечить цитирование и отказ.
Неделя 2: Глубина данных и надежность
- Добавьте прием из нескольких источников (учебник 2) и запланируйте повторное индексирование.
- Замените встраивания и векторное хранилище (учебник 4); выберите победителя по стоимости/качеству.
- Внедрите кэширование и тайм-ауты (учебник 8), чтобы обеспечить постоянную задержку.
Неделя 3: Оценки, ограждения и соответствие домену
- Создайте золотой набор и автоматические оценки (учебник 7).
- Добавьте проверки фактов после создания и политику отказа (учебник 5).
- Примените плейбук домена (учебник 9) с пользовательскими подсказками.
Неделя 4: Гибридное извлечение и возможность действий
- Подключите вызов SQL/инструментов (учебник 6) для смешанных запросов.
- Добавьте вызов функций и утверждения (учебник 10), чтобы ваше приложение RAGFlow могло выполнять действия.
- Инструментируйте панели мониторинга наблюдаемости; установите SLO для точности и задержки.
Концепции RAGFlow, которые вы должны знать
Даже лучшие учебники по RAGFlow предполагают несколько основных идей. Вот краткое напоминание.
- Retrieval Augmented Generation (RAG): Дополните контекст LLM извлеченными фрагментами из вашей базы знаний, чтобы ответы были основаны на доказательствах.
- Разбиение на фрагменты: Разделение документов на извлекаемые единицы. Перекрытия сохраняют контекст; заголовки создают границы; семантические методы используют встраивания для поиска естественных точек останова.
- Встраивания: Векторные представления фрагментов и запросов. Более качественные встраивания улучшают релевантность извлечения и уменьшают галлюцинации.
- Векторное хранилище: База данных для векторов с поиском по сходству. Выбор влияет на скорость, полноту и масштаб.
- Переранжирование: Дополнительный оценщик второго этапа для переупорядочивания извлеченных фрагментов по релевантности.
- Инженерия подсказок: Четкие инструкции для запроса цитат, запрета догадок и форматирования вывода.
- Оценки: Систематическое измерение с использованием золотых наборов, проверки человеком и автоматических метрик.
Стартовый пакет для копирования и вставки: Базовый шаблон подсказки RAG
Используйте этот шаблон в своем узле генерации, чтобы уменьшить галлюцинации и обеспечить цитирование.
Вы - внимательный помощник, который отвечает ТОЛЬКО информацией, найденной в извлеченном контексте.
Правила:
- Ссылайтесь на доказательства с помощью [source_name:page_or_section] после каждого утверждения.
- Если ответа нет в контексте, скажите: "Я не знаю, основываясь на предоставленных источниках".
- Предпочитайте прямые цитаты для определений; обобщайте для процедур.
Контекст:
{{retrieved_context}}
Вопрос:
{{user_query}}
Ответ:
Пример: Замена встраиваний и измерение воздействия
# Псевдокод, иллюстрирующий логику эксперимента, которую вы увидите в продвинутых учебниках
from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness
pipelines = []
for model in ["text-embedding-3-large", "bge-large", "e5-large"]:
emb = EmbeddingNode(model=model)
vs = VectorStoreNode(kind="milvus", metric="cosine")
pl = Pipeline.add_nodes([
"ingest", "chunk", emb, vs, "retrieve", "generate"
<a10>])</a11>h = EvalHarness(goldset="gold_qa.jsonl")
results = {}
for model, pl in pipelines:
results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"])
print(results)
Шпаргалка по интерпретации:
- Если обоснованность подскочит после замены модели, сохраните ее - даже если токены стоят немного дороже.
- Если задержка увеличивается, добавьте кэширование или уменьшите максимальное количество извлеченных фрагментов с 8 → 5.
- Если охват цитированием падает, измените размер фрагмента или добавьте переранжирование.
Общие ошибки, которых эти учебники помогут вам избежать
- Переразбиение на фрагменты: Слишком маленькие фрагменты приводят к отсутствию контекста и шумным ответам.
- Недоразбиение на фрагменты: Огромные фрагменты загрязняют контекстные окна нерелевантным текстом.
- Встраивания одного размера для всех: Для языка домена (юридического, клинического) могут потребоваться модели, настроенные для домена.
- Нет оценок: Изменение чего-либо без базового уровня создает фантомные регрессии.
- Игнорирование свежести: Устаревшие индексы приводят к правильным, но устаревшим ответам.
- Пропуск ограждений: Без правил отказа ваша модель угадывает.
Выбор подходящего учебника для вашего варианта использования
- Бот поддержки стартапа: Учебники 1, 2, 5, 8, 9.
- Внутренний помощник по исследованиям: Учебники 1, 3, 4, 7.
- Второй пилот по анализу данных: Учебники 6, 10.
- Регулируемые отрасли: Сначала учебники 5 и 9, затем 7.
Кстати: Прототипируйте быстрее с помощью Sider.AI
Когда вы итерируете подсказки RAG, тестируете запросы и сравниваете ответы, переключение контекста обходится дорого. Стоит отметить: Sider.AI (https://sider.ai/) позволяет вам общаться с несколькими моделями бок о бок, закреплять подсказки и поддерживать рабочее пространство знаний. Это удобно для: - Сравнение ответов из разных настроек извлечения и подсказок.
- Запуск быстрых тестов "что, если" перед внесением изменений в RAGFlow.
- Организация фрагментов, цитат и золотых вопросов и ответов для вашей оценочной оснастки.
Используйте его в качестве черновика, пока вы следуете учебникам RAGFlow; затем кодифицируйте победителя в своем конвейере.
Руководство по устранению неполадок: Быстрые исправления, когда все ломается
- Симптом: Ответы общие и не содержат цитат.
- Исправление: Обеспечьте требование цитирования в подсказке и добавьте узел проверки.
- Симптом: Извлечены нерелевантные фрагменты.
- Исправление: Увеличьте перекрытие фрагментов, переключитесь на лучшую модель встраивания или добавьте переранжирование.
- Симптом: Задержка > 3 секунд.
- Исправление: Кэшируйте векторные результаты, ограничьте извлеченные фрагменты и используйте потоковую передачу токенов.
- Симптом: Противоречивые ответы на запросы.
- Исправление: Нормализуйте метаданные, удалите почти идентичные фрагменты, взвесьте более новые документы.
- Симптом: Модель слишком часто отказывается с ответом "Я не знаю".
- Исправление: Ослабьте порог отказа, увеличьте глубину извлечения или уточните границы фрагментов.
Ключевые выводы
- Лучшие учебники по RAGFlow обучают сквозным системам с реалистичными данными и оценками.
- Разбиение на фрагменты и встраивания оказывают наибольшее влияние на качество ответов.
- Успех в производстве требует кэширования, наблюдаемости, ограждений и золотого набора.
- Используйте плейбуки домена и вызов функций, чтобы выйти за рамки вопросов и ответов и перейти к реальным рабочим процессам.
- Используйте такие инструменты, как Sider.AI во время экспериментов, чтобы быстро сравнивать подсказки и результаты.
Что делать дальше
- Выберите два учебника, которые соответствуют вашей непосредственной потребности (например, Quickstart + Masterclass по разделению на фрагменты).
- Соберите золотой набор вопросов и ответов из собственных документов (начните с 50 вопросов).
- Вносите одно изменение за раз; измеряйте обоснованность и задержку после каждого.
- Перейдите к производственным шаблонам с кэшированием и ограждениями, когда ваши оценки стабилизируются.
- Добавьте вызов функций и политики домена, как только ваш базовый уровень станет надежным.
FAQ
Q1:Какой учебник по RAGFlow лучше всего подходит для абсолютных новичков?
Начните с краткого руководства по RAGFlow, которое охватывает прием PDF, разбиение на фрагменты, встраивание, индексацию, извлечение и генерацию с цитатами. Это быстро дает вам сквозное ощущение и подготовит вас к более глубоким учебникам по RAGFlow.
Q2:Как улучшить точность в RAGFlow за пределами базовых учебников?
Сосредоточьтесь на стратегии разбиения на фрагменты, качестве встраиваний и переранжировании. Продвинутые учебники по RAGFlow также показывают, как добавлять ограждения и оценочные оснастки, чтобы уменьшить галлюцинации и количественно оценить обоснованность.
Q3:Какие встраивания лучше всего работают с RAGFlow для корпоративных документов?
Попробуйте мощные общие модели, такие как text-embedding-3-large, E5 или BGE, затем измерьте метрики извлечения на ваших данных. Лучшие учебники по RAGFlow рекомендуют A/B-тесты по моделям и векторным хранилищам, чтобы выбрать победителя.
Q4:Может ли RAGFlow обрабатывать структурированные данные, такие как SQL, вместе с документами?
Да. Учебники по гибридному извлечению для RAGFlow показывают, как направлять количественные запросы в SQL с помощью вызова функций, при этом используя семантическое извлечение для неструктурированных документов, а затем объединять результаты во время генерации.
Q5:Как оценить конвейер RAGFlow перед запуском?
Следуйте учебникам по RAGFlow, ориентированным на оценку: создайте золотой набор вопросов и ответов с источниками, запускайте автоматические тесты после изменений и отслеживайте обоснованность, охват цитированием, задержку и полезность. Развертывайте только тогда, когда метрики стабилизируются.