10 Най-добри LlamaIndex уроци за овладяване на RAG през 2025 г.
Ако сте чували, че Retrieval-Augmented Generation (RAG) може да направи вашите LLM приложения по-интелигентни, прави сте. Най-бързият начин да създадете надежден AI асистент, подобен на търсачка, днес е да научите добре LlamaIndex – и най-добрите LlamaIndex уроци могат да съкратят кривата ви на обучение от месеци до дни.
В това ръководство подбираме най-добрите LlamaIndex уроци за всяко ниво – от бързи стартове с копиране и поставяне до производствени конвейери. Ще намерите видео инструкции, практически тетрадки и разширени рецепти за данни за много клиенти, структурирано извличане, агенти и оценка.
Също така ще съпоставим всеки урок с умението или резултата, който ви интересува: изграждане на чат върху вашите документи, мащабиране на вграждания, добавяне на инструменти, поточно предаване на отговори или проверка на резултатите.
До края ще знаете с кой LlamaIndex урок да започнете, кои да следвате след това и как да ги комбинирате в реален продукт.
Защо LlamaIndex уроците са важни в момента
- RAG е сегашното време на AI приложенията. LLM халюцинират; RAG обосновава отговорите във вашите данни.
- LlamaIndex е най-свързаният RAG стек. Той обхваща индексиране, извличане, планиране на заявки, наблюдаемост и оценка в композируеми модули, които работят добре с LangChain, OpenAI, Anthropic и LLM с отворен код.
- Уроците са вашият бърз път. Най-добрите LlamaIndex уроци демонстрират не само код, но и архитектурни решения: разделяне на части, преподреждане, кеширане и предпазни мерки.
Ако вашата цел е: „Чат с моите документи и не халюцинирай“, този списък ще ви отведе до там.
Как избрахме най-добрите LlamaIndex уроци
- Ориентирани към резултатите: Трябва да създадете нещо полезно след всеки урок.
- Актуализирани за 2025 г.: Отразяват текущите LlamaIndex API (напр.
VectorStoreIndex, Settings, QueryPipeline, ReActAgent).
- Производствено-ориентирани: Показват оценка, проследяване и итерация – отвъд hello world.
- Ширина + дълбочина: От бързи стартове до агенти, мултимодални и структурирано извличане.
10-те най-добри LlamaIndex урока (подбрани)
По-долу е подбран път. Започнете от вашето ниво; прескачайте, където е необходимо.
1) 15-минутният бърз старт: Чат върху вашите PDF файлове
- Най-добър за: Абсолютни начинаещи и продуктови мениджъри
- Какво ще изградите: Качване на PDF файлове, индексиране, задаване на въпроси, получаване на цитати
- Ключови концепции:
SimpleDirectoryReader, VectorStoreIndex, Settings, вграждания
- Защо е страхотен: Минимален код, максимален момент на прозрение
Примерна структура:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
Settings.llm = OpenAI(model="gpt-4o-mini")
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
docs = SimpleDirectoryReader("./docs").load_data
index = VectorStoreIndex.from_documents(docs)
query_engine = index.as_query_engine(similarity_top_k=3)
response = query_engine.query("What are the key findings in the Q3 report?")
print(response)
- Какво ще научите след това: Размер на частта, top‑k и защо преподреждането е важно.
2) RAG основи с разделяне на части, метаданни и преподреждане
- Най-добър за: Начинаещи → средно ниво
- Какво ще изградите: По-интелигентно извличане с по-добро качество на контекста
- Ключови концепции:
SentenceSplitter, филтри за метаданни, rerank компоненти
- Защо е страхотен: Показва как няколко копчета драстично намаляват халюцинациите
Опитайте:
from llama_index.core.node_parser import SentenceSplitter
from llama_index.postprocessor.flag_embedding_reranker import FlagEmbeddingReranker
splitter = SentenceSplitter(chunk_size=512, chunk_overlap=100)
# attach metadata like source, page, section during ingest
reranker = FlagEmbeddingReranker(top_n=5)
query_engine = index.as_query_engine(
similarity_top_k=15,
node_postprocessors=[reranker]
)
- Резултат: По-висококачествени контекстни прозорци за дълги документи.
3) LlamaIndex + OpenAI Function Calling (Използване на инструменти и структуриран изход)
- Най-добър за: Създатели, автоматизиращи работни процеси
- Какво ще изградите: Агент, който извиква инструменти и връща JSON схеми
- Ключови концепции:
QueryPipeline, спецификация на инструмента, Pydantic схеми, извикване на функции
- Защо е страхотен: Свързва Q&A с реални действия (търсене, CRUD, API)
from pydantic import BaseModel
from llama_index.core.tools import FunctionTool
class Ticket(BaseModel):
title: str
severity: str
def create_ticket(title: str, severity: str) -> str:
# write to your system
return f"Ticket created: {title} ({severity})"
tool = FunctionTool.from_defaults(fn=create_ticket)
agent = index.as_chat_engine(tools=[tool], chat_mode="react")
print(agent.chat("Create a P1 ticket for database latency spikes."))
- Резултат: Готови за производство модели за структурирано извличане и действие.
4) Изграждане на производствен вектор магазин (Postgres, Pinecone, Weaviate)
- Най-добър за: Екипи, планиращи да мащабират
- Какво ще изградите: Устойчиво векторно съхранение с филтри и хибридно търсене
- Ключови концепции:
VectorStoreIndex адаптери, хибридни BM25+вграждания, метаданни
- Защо е страхотен: Учи на устойчивост, миграции и контрол на разходите
Съвети:
- Използвайте Postgres/pgvector за прости, достъпни разполагания.
- Pinecone/Weaviate за управлявано мащабиране; настройте
ef_construction, ef_search.
- Добавете хибридно извличане, за да обработвате редки термини и акроними.
5) Планиране на заявки и многостъпково разсъждение с агенти
- Най-добър за: Сложни въпроси и търсене в множество набори от данни
- Какво ще изградите: Планировчик, който разделя заявка на подзаявки
- Ключови концепции:
ReActAgent, SubQuestionQueryEngine, маршрутизиране
- Защо е страхотен: Преминава отвъд „извличане, след това отговор“ към „мислене, след това търсене“.
Модел:
from llama_index.core.query_engine import SubQuestionQueryEngine
from llama_index.core.tools import QueryEngineTool, ToolMetadata
# suppose you have multiple indices
engine_a = index_a.as_query_engine
engine_b = index_b.as_query_engine
sqe = SubQuestionQueryEngine.from_defaults(
query_engine_tools=[
QueryEngineTool(engine=engine_a, metadata=ToolMetadata(name="finance")),
QueryEngineTool(engine=engine_b, metadata=ToolMetadata(name="product")),
]
)
print(sqe.query("How did product churn affect Q4 revenue?"))
6) Наблюдаемост и оценка: Проследяване, обоснованост и бенчмаркове
- Най-добър за: Всеки, който предлага реални приложения
- Какво ще изградите: Цикли на обратна връзка за откриване на регресии и халюцинации
- Ключови концепции: LlamaIndex evals, оценено QA, проверки на цитати, проследяване
- Защо е страхотен: Учи ви да измервате това, което има значение, преди да мащабирате
Контролен списък:
- Регистрирайте всички подкани/отговори с проследявания.
- Използвайте оценени QA набори от данни за регресионно тестване.
- Проследявайте обосноваността и покритието на цитатите.
7) RAG за мултимодални данни (изображения, таблици, Markdown)
- Най-добър за: Документи с диаграми, екранни снимки и таблици
- Какво ще изградите: Конвейери, които извличат текст от изображения и разсъждават върху таблици
- Ключови концепции: OCR + анализ на оформлението, разделяне на таблици, мултимодални модели
- Защо е страхотен: Реалните документи са разхвърляни; този урок ви показва как да ги укротите.
8) Многоклиентска и изолация на извличане
- Най-добър за: SaaS разработчици
- Какво ще изградите: RAG услуга, където данните на всеки клиент са изолирани
- Ключови концепции: Пространства на имена, защити на метаданни, индекси за всеки клиент, RBAC
- Защо е страхотен: Сигурност и поверителност по дизайн; чисти пътища за надграждане.
9) Структурирано извличане в мащаб (фактури, логове, договори)
- Най-добър за: Операции, финанси, правни работни процеси
- Какво ще изградите: Детерминирани JSON изходи с валидиране на схемата
- Ключови концепции: Pydantic схеми, повторни опити, валидиране, подсилено с инструменти
- Защо е страхотен: Намалява ръчната проверка и прави LLM изхода надежден.
10) Производствен модел от край до край: От тетрадки до CI/CD
- Най-добър за: Екипи, преминаващи към производство
- Какво ще изградите: Пълен конвейер с поглъщане на данни, задачи за индексиране, оценка и врати за освобождаване
- Ключови концепции: Фонови работници, планирано повторно индексиране, флагове за функции
- Защо е страхотен: Показва как да се доставя непрекъснато с увереност.
Избор на правилния LlamaIndex урок за вашата цел
Използвайте този бърз рутер, за да изберете следващата си стъпка:
- „Нуждая се от резултати днес.“ Започнете с бързия старт (Урок №1), след това добавете преподреждане (Урок №2).
- „Искам действия, а не само отговори.“ Преминете към извикване на функции и агенти (Урок №3 и №5).
- „Имаме нужди от мащаб и съответствие.“ Модели за съхранение + много клиенти (Урок №4 и №8).
- „Как да се доверим на отговорите?“ Evals и проследяване (Урок №6).
- „Нашите документи са с много визуализации.“ Мултимодален RAG (Урок №7).
- „Нуждаем се от структурирани данни.“ Използвайте схеми и валидатори (Урок №9).
Задълбочено гмуркане: Най-добри практики, които ще видите в най-добрите LlamaIndex уроци
1) Разделянето на части е продуктово решение
- Компромис: По-големи части = повече контекст, но по-висока цена на токен; по-малки части = по-високо извикване, но фрагментирано значение.
- Добри стойности по подразбиране: 512–1024 токена с ~10–20% припокриване.
- Метаданните имат значение: Запазете източника, страницата, секцията, заглавията.
2) Качеството на извличане превъзхожда размера на модела
- Преподреждане: Добавете кръстосан кодиращ или вграждащ преподреждащ за по-добър MRR.
- Хибридно търсене: Комбинирайте BM25 за редки термини с вграждания за семантика.
- Филтри: Стеснете по тип документ, дата или клиент, за да подобрите прецизността.
3) Оценявайте рано, оценявайте винаги
- Оценено QA: Изградете малък набор от двойки въпрос–отговор с цитати.
- Метрики: Правилност на отговора, обоснованост, латентност и цена на заявка.
- A/B безопасно: Разгърнете в сянка ново разделяне на части или извличащи преди прекъсване.
4) Направете действията от първи клас
- Структуриран изход: Използвайте схеми за задачи за извличане.
- Инструменти: Обвийте API (търсене, календар, DB) като функции за извикване на агенти.
- Предпазни мерки: Валидирайте изходите, внедрете повторни опити, регистрирайте грешки на инструменти.
5) Хигиена на разходите и латентността
- Кеширане на вграждания: Премахнете дублирането на текст и използвайте повторно вектори в различните конструкции.
- Пакетни операции: Индексирайте на едро; предавайте поточно отговори, за да подобрите UX.
- По-интелигентен контекст: Не прекалявайте с подканата – top‑k + преподреждане вместо това.
7-дневен план за обучение с помощта на най-добрите LlamaIndex уроци
- Ден 1: Бърз старт (Урок №1). Изградете чат върху PDF файл от 20 страници. Доставете CLI.
- Ден 2: Подобрете извличането (Урок №2). Добавете преподреждащ + хибридно търсене.
- Ден 3: Добавете извикване на функции (Урок №3). Създайте инструмент за често задавани въпроси във вашия API.
- Ден 4: Преминете към реален вектор магазин (Урок №4). Използвайте pgvector локално.
- Ден 5: Въведете планировчик (Урок №5). Маршрутизирайте въпроси през два индекса.
- Ден 6: Добавете оценка (Урок №6). Създайте тестов набор от 30 въпроса и базова линия.
- Ден 7: Производствен пропуск (Урок №10). Фонови задачи, наблюдаемост, CI.
Примерен проект: „Документен консиерж“ с LlamaIndex
- Цел: Защитен вътрешен асистент, който отговаря на въпроси относно документи за процеси и отваря билети.
- Стек: LlamaIndex, Postgres/pgvector, OpenAI/Anthropic, FastAPI, S3.
- Поглъщане на Confluence експорти и PDF файлове (запазете метаданни + ACL).
- Разделете на части при 768 токена; индексирайте към pgvector.
- Добавете хибридно извличане и преподреждащ.
- Създайте инструменти:
create_jira_ticket, lookup_oncall, fetch_policy.
- Добавете оценка с 50 подбрани въпроса; измерете обосноваността.
- Разгърнете с поточно UI и визуализации на цитати.
- Резултат: Бързи, цитирани отговори; автоматизация на задачи с едно щракване; измерима точност.
Чести грешки, които тези уроци ви помагат да избегнете
- Пропускане на оценката: Ако не тествате, ще доставите регресии.
- Игнориране на метаданните: Ще загубите приписването на източника и силата на маршрутизиране.
- Прекалено големи части: Надуването на токени увеличава разходите без по-добри отговори.
- Недостатъчно специфициране на инструменти: Агентите се нуждаят от ясни входове и детерминирани изходи.
- Без изолация: Многоклиентският RAG трябва да предотврати изтичане между клиенти.
Инструменти, които допълват LlamaIndex уроците
- Векторни магазини: pgvector, Pinecone, Weaviate, Qdrant
- Преподреждащи: Cohere Rerank, FlagEmbedding, Voyage rerank
- Разделители на части: Семантични разделители, разделители, които разпознават таблици
- Evals: Ragas-style QA, LlamaIndex evals, персонализирани оценители на рубрики
- UI: Streamlit, Next.js, FastAPI websockets за поточно предаване на токени
Между другото, ако обичате да учите, като работите в браузъра си, струва си да отбележите, че Sider.ai ви позволява да чатите с код, документи и уеб страници един до друг. Можете да поставяте фрагменти от LlamaIndex уроци, да изпълнявате подкани и да итерирате по-бързо – удобно за тестване на RAG подкани и извличане на структурирани изходи, докато следвате. Какво да търсите: Намиране на актуални LlamaIndex уроци
- „най-добрите LlamaIndex уроци 2025“
- „LlamaIndex quickstart RAG pdf“
- „LlamaIndex SubQuestionQueryEngine пример“
- „LlamaIndex evaluation groundedness tutorial“
- „LlamaIndex pgvector Pinecone guide“
- „LlamaIndex agents function calling example“
Търсете скорошен код, използващ Settings.llm, Settings.embed_model, VectorStoreIndex и as_query_engine – това са текущите идиоми.
Ключови изводи
- Най-добрите LlamaIndex уроци ви помагат да доставяте резултати, а не само фрагменти от код.
- Започнете с чат върху документи, след това добавете качество на извличане, инструменти и оценка.
- Използвайте реален вектор магазин, добавете планировчици за сложни въпроси и тествайте безмилостно.
- Малките архитектурни избори – разделяне на части, преподреждане, филтри – променят резултатите повече от смяната на модели.
- Обучението се ускорява, когато следвате структуриран план и изграждате нещо реално.
Какво следва
- Изберете един урок от първите три и изградете минимално приложение днес.
- Добавете оценка, преди да мащабирате потребителите.
- Планирайте вашата производствена миграция: съхранение, удостоверяване, наблюдаемост и CI.
- Прегледайте разширените уроци (агенти, мултимодални, многоклиентски), когато обхватът ви нараства.
ЧЗВ
Q1:Кои са най-добрите LlamaIndex уроци за начинаещи?
Започнете с бърз старт, който изгражда чат върху вашите PDF файлове, използвайки VectorStoreIndex и SimpleDirectoryReader. След това добавете урок за разделяне на части, метаданни и преподреждане, за да увеличите качеството на извличане.
Q2:Как да изградя производствено RAG приложение с LlamaIndex?
Следвайте уроци, които обхващат векторни магазини (pgvector, Pinecone), хибридно извличане и оценка с оценено QA. Добавете проследяване, структурирани изходи и CI/CD, за да преминете от тетрадки към производство.
Q3:Кой LlamaIndex урок учи на агенти и използване на инструменти?
Търсете ръководства, използващи агенти в стил ReAct, QueryPipeline и извикване на функции с Pydantic схеми. Тези уроци показват как да маршрутизирате заявки, да извиквате API и да връщате структуриран JSON.
Q4:Как мога да оценя точността на LlamaIndex RAG?
Използвайте уроци за оценка, които въвеждат проверки за обоснованост, покритие на цитати и оценени QA набори от данни. Проследявайте правилността, латентността и цената, за да уловите регресии, преди да разгърнете.
Q5:Има ли LlamaIndex уроци за мултимодални документи?
Да, търсете уроци, които комбинират OCR и анализ на оформлението за изображения и таблици, след това индексирайте извлечения текст с метаданни. Те показват как да обработвате диаграми, екранни снимки и сложни PDF файлове в RAG.