ರಿಟ್ರೀವಲ್-ಆಗ್ಮೆಂಟೆಡ್ ಜನರೇಷನ್ನಲ್ಲಿ ನಿಪುಣರಾಗಲು 10 ಅತ್ಯುತ್ತಮ RAGFlow ಪಾಠಗಳು
ನೀವು ಯಾವುದೇ ದೊಡ್ಡ ಭಾಷಾ ಮಾದರಿಯನ್ನು ಡೊಮೈನ್-ನಿರ್ದಿಷ್ಟ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸಲು ಪ್ರಯತ್ನಿಸಿ, ಅದು ದೃಢತೆಯಿಂದ ಹಾಳಾಗಿ ಮಹತ್ವಹೀನ ಮಾಹಿತಿ ನೀಡಿದ ಸಂದರ್ಭದಲ್ಲಿ, RAGFlow ಪರಿಹರಿಸುವ ನೋವನ್ನು ಅನುಭವಿಸಿದ್ದೀರಾ. ರಿಟ್ರೀವಲ್-ಆಗ್ಮೆಂಟೆಡ್ ಜನರೇಷನ್ (RAG) ಒಂದು ಹುಡುಕಾಟ ಪದರವನ್ನು ಜನರೇಷನ್ ಜೊತೆಗೆ ಜೋಡಿಸಿ, ನಿಮ್ಮ ಮಾದರಿ ನಿಮ್ಮದೇ ಡೇಟಾದಿಂದ ನಿಜವಾದ ವಿಚಾರಗಳನ್ನು ಉಲ್ಲೇಖಿಸುವಂತೆ ಮಾಡುತ್ತದೆ. RAGFlow ಒಂದು ತೆರವು ಇದ್ದ, ದೃಶ್ಯ ಮಾದರಿ ಮತ್ತು ಪೈಪ್ಲೈನ್ ಚಾಲಿತ ವಿಧಾನವಾಗಿದ್ದು, ಸಂಪೂರ್ಣ ವ್ಯವಸ್ಥೆಯನ್ನು ನಿರ್ಮಿಸಲು—from ಡಾಕ್ಯುಮೆಂಟ್ ಇಂಜೆಸ್ಟನ್, ಚಂಕಿಂಗ್, ಎम्बೆಡ್ಡಿಂಗ್, ವೆಕ್ಟರ್ ಸಂಶೋಧನೆ ಮತ್ತು ನೆಲಬದ್ಧ ಪ್ರತಿಕ್ರಿಯೆಗಳವರೆಗೂ.
ಈ ಮಾರ್ಗಸೂಚಿಯಲ್ಲಿ, ನೀವು ಇಂದು ಅನುಸರಿಸಬಹುದಾದ ಅತ್ಯುತ್ತಮ RAGFlow ಪಾಠಗಳನ್ನು ಸಮ್ಮಿಳಿಸಿ, ನಿಮ್ಮ ಸ್ಟ್ಯಾಕ್ಗೆ ಯೋಗ್ಯವಾದವುಗಳನ್ನು ಆಯ್ಕೆಮಾಡುವುದನ್ನು ಮತ್ತು “ಹೆಲೋ ವರ್ಲ್ಡ್” ನಿಂದ ಉತ್ಪಾದನೆಗೆ ಹೋಗಲು ಒಂದು പ്രಾಯോഗಿಕ ಯೋಜನೆಯನ್ನು ನೀಡುತ್ತೇವೆ. ನಾವು ವ್ಯವಹಾರೋದ್ಯಮಭರಿತವಾಗಿರಿಸಿ, ಉದಾಹರಣೆಗಳು, ತಪ್ಪುಗಳು ಮತ್ತು ಕೆಲವು ಶಕ್ತಿಶಾಲಿ ಸಲಹೆಗಳನ್ನು ನೀಡುತ್ತೇವೆ.
ನಾವು ಪ್ರಾಯೋಜನಾತ್ಮಕ ಮತ್ತು ಪರಿಹಾರ-ಕೇದ್ರಿತ ವಿಧಾನವನ್ನು ಅನುಸರಿಸುತ್ತಿದ್ದೇವೆ: ಸರಳ ವಿವರಣೆಗಳು, ಸ್ಪಷ್ಟ ಹಂತಗಳು ಮತ್ತು ನಕಲಿಸಿ-ಇಂಟು ಆರೋಗ್ಯಕ್ಕಾಗಿ ಕ್ರಮಗಳು. ನಿಮ್ಮ RAGFlow ಅಪ್ಲಿಕೇಶನ್ ಸರಿಯಾಗಿ ಉತ್ತರ ನೀಡುವಂತೆ ನೀವು ರವಾನಿಸುವಂತೆ ಮಾಡೋಣ.
“ಅತ್ಯುತ್ತಮ RAGFlow ಪಾಠ” ಎಂದರೆ ಏನು?
ಎಲ್ಲಾ ಪಾಠಗಳು ಸಮಾನವಲ್ಲ. ಅತ್ಯುತ್ತಮ RAGFlow ಪಾಠಗಳಲ್ಲಿ ಕೆಲವು ಲಕ್ಷಣಗಳಿರುತ್ತವೆ:
- ಕೊನೆಯಿಂದ ಕೊನೆಗೆ ಹರಿವು: ಇಂಜೆಸ್ಟ್ → ಚಂಕ್ → ಎम्बೆಡ್ → ಸೂಚ್ಯಂಕ → ರಿಟ್ರೀವ್ → ಜನರೇಟ್, ಎಲ್ಲಾ ಒಂದೇ ಮಾರ್ಗದಲ್ಲಿ.
- ವಾಸ್ತವಿಕ ಡಾಕ್ಯುಮೆಂಟುಗಳು: PDF ಗಳು, HTML, ಸ್ಲೈಡ್ ಡೆಕ್ಕ್ಗಳು ಅಥವಾ ಅಲಂಕೃತ ಲಾಗ್ಗಳು—ಕೇವಲ ಸರಳ ಮಾರ್ಕ್ಡೌन ಅಲ್ಲ.
- ಮೌಲ್ಯಮಾಪನ ಒಳಗೊಂಡದ್ದು: ನೆಲದೌಂಬಿಕೆ, ದೈರ್ಘ್ಯ ಮತ್ತು ಉತ್ತರ ಗುಣಮಟ್ಟದ ಅಳತೆಮಾಡುವುದು ಕಲಿಸುತ್ತವೆ.
- ಉತ್ಪಾದನಾ ಕಾಳಜಿ: ಕ್ಯಾಶಿಂಗ್, ಮರುಪ್ರಯತ್ನಗಳು, ತಪಾಸಣಾ ಹಾಗೂ ರಕ್ಷಾ ಮಾರ್ಗಗಳು.
- ಪ್ರಸರಣೀಯ: ಮಾದರಿಗಳು, ಚಂಕಿಂಗ್ ತಂತ್ರಗಳು ಅಥವಾ ವೆಕ್ಟರ್ ಸ್ಟೋರ್ ಬದಲಾಯಿಸುವುದನ್ನು ತೋರಿಸು.
ನೀವು ಕಲಿಕೆಗೆ ತೊಡಗುವಾಗ ಈ ಮಾನದಂಡಗಳನ್ನು ಮನಗಾಣಿಸಿ.
ಈ ಹೊತ್ತಿಗೆ 10 ಅತ್ಯುತ್ತಮ RAGFlow ಪಾಠಗಳು
ಕೆಳಗಿನವು ಪ್ರಾರಂಭಿಕರಿಂದ ತಜ್ಞರ ಮಟ್ಟದವರೆಗೆ ಆಯ್ಕೆ ಮಾಡಿದ ಪಟ್ಟಿ. ಪ್ರತಿ ಪಾಠದಲ್ಲಿ ಅದರ ಉಪಯೋಗ, ನೀವು ನಿರ್ಮಿಸುವುದು, ಮತ್ತು ಯಾರಿಗೆ ಉಪಯುಕ್ತ ಎಂಬುದನ್ನು ವಿವರಿಸಲಾಗಿದೆ.
1) RAGFlow ತ್ವರಿತ ಪ್ರಾರಂಭ: ನಿಮ್ಮ ಮೊದಲ ಕೊನೆಯಿಂದ ಕೊನೆಗೆ ಪೈಪ್ಲೈನ್
- ಶ್ರೇಷ್ಠತೆ: ಚಲಿಸುವ ಭಾಗಗಳನ್ನು ವೇಗವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಅತ್ಯಂತ ವೇಗದ ಮಾರ್ಗ—ನಿಮಗೆ ಅಡ್ಡ ತಡೆಯಿಲ್ಲದಂತೆ.
- ನೀವು ನಿರ್ಮಿಸುವುದು: ಕನಿಷ್ಠ ಪೈಪ್ಲೈನ್: PDF ಅನ್ನು ಅಪ್ಲೋಡ್ ಮಾಡಿ, ಸ್ವಯಂ ಚಂಕ್ ಮಾಡಿ, ಎम्बೆಡ್ ಮಾಡಿ, ಸೂಚ್ಯಂಕ ನಿರ್ಮಿಸಿ ಮತ್ತು ಉಲ್ಲೇಖಗಳೊಂದಿಗೆ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಿ.
- RAGFlow ಅನ್ನು ಪ್ರಾರಂಭಿಸಿ ಮತ್ತು ಪೈಪ್ಲೈನ್ ಬಿಲ್ಡರ್ ತೆರೆಯಿರಿ.
- ಫೈಲ್ ಇಂಜೆಸ್ಟರ್ ನೋಡ್ ಸೇರಿಸಿ ಮತ್ತು PDF ದಿಕ್ಕು ಸೂಚಿಸಿ.
- ಚಂಕರ್ (ಉದಾ: recursive + ಶೀರ್ಷಿಕೆಗಳು) ಮತ್ತು ಎम्बೆಡ್ಡಿಂಗ್ ಮಾದರಿ ನೋಡ್ ಸೇರಿಸಿ.
- ವೆಕ್ಟರ್ ಸ್ಟೋರ್ ಜೋಡಿಸಿ, ನಂತರ ರಿಟ್ರೀವಲ್ ಮತ್ತು LLM ಜನರೇಷನ್ ನೋಡ್ಗಳನ್ನು ಸೇರಿಸಿ.
- ಒಷ್ಟು ಪ್ರಶ್ನೆಗಳಿಂದ ಪರೀಕ್ಷಿಸಿ ಮತ್ತು ಮೂಲಗಳನ್ನು ಪರಿಶೀಲಿಸಿ.
- ಉಪಯುಕ್ತ: ಪೂರ್ಣ ಪ್ರಾರಂಭಿಕರು; RAGFlow ಮೂಲ ಹರಿವನ್ನು ಪರಿಶೀಲಿಸುವ ತಂಡಗಳು.
2) RAGFlow + ಬಹು ಮೂಲ ಡೇಟಾ: PDFs, ವೆಬ್ ಪುಟಗಳು ಮತ್ತು Notion
- ಶ್ರೇಷ್ಠತೆ: ಬಹುತೇಕ ನಿಜವಾದ ಯೋಜನೆಗಳು ವಿಚಿತ್ರ ಮೂಲಗಳನ್ನು ಸೇರಿಸುತ್ತವೆ; ಈ ಪಾಠ ಇದನ್ನು ತೋರಿಸುತ್ತದೆ.
- ನೀವು ನಿರ್ಮಿಸುವುದು: PDFs ಇಂಜೆಸ್ಟ್ ಮಾಡುವ, URLಗಳನ್ನು ಕ್ರಾಲ್ ಮಾಡುವ ಮತ್ತು ನಿಯಮಿತವಾಗಿ Notion ಪುಟಗಳನ್ನು ಸಂಯೋಜಿಸುವ ಪೈಪ್ಲೈನ್.
- ಪ್ರತಿ ಮೂಲಕ್ಕೆ ಬೇರೆಯಾದ ಇಂಜೆಸ್ಟರ್ ನೋಡ್ಗಳನ್ನು ಬಳಸಿ.
- ಮೆಟಾಡೇಟಾವನ್ನು ಸಾಮಾನ್ಯೀಕರಿಸಿ (ಶೀರ್ಷಿಕೆ, URL, ರಚಯಿತೃ, ವಿಭಾಗ).
- ರಿಟ್ರೀವಲ್ ಸಮಯದಲ್ಲಿ ಉತ್ತಮ ಶೋಧನೆಗೆ ಮೂಲದಿಂದಾಗಿ ಚಂಕ್ಗಳನ್ನು ಟ್ಯಾಗ್ ಮಾಡಿ.
- ಉಪಯುಕ್ತ: ಜ್ಞಾನ ಶೇಖರಣೆ, ವಿಕಿ, ಮತ್ತು ಆಂತರಿಕ ಪೋರ್ಟಲ್ಗಳಿಗೆ.
3) ಚಂಕಿಂಗ್ ಮಾಸ್ಟರ್ ಕ್ಲಾಸ್: ನೈವೇದ್ಯ ತಿರುಗಾಟದಿಂದ ಸೆಮ್ಯಾಂಟಿಕ್ ವಿಂಡೋಗಳವರೆಗೆ
- ಶ್ರೇಷ್ಠತೆ: RAG ಗುಣಮಟ್ಟದಲ್ಲಿ ಹೆಚ್ಚಿನ ಭಾಗವು ಚಂಕಿಂಗ್ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದೆ.
- ನೀವು ನಿರ್ಮಿಸುವುದು: ನೆಲದ ಮೌಲ್ಯಮಾಪನ ಅಳೆಯುವ ನಿಟ್ಟಿನಲ್ಲಿ ಚಂಕಿಂಗ್ ತಂತ್ರಗಳ ಪಕ್ಕ ಪಕ್ಕ ವಿಮರ್ಶೆ.
- ನಿಗದಿ ಗಾತ್ರದ, recursive-heading ಮತ್ತು semantic-chunking ಅನ್ನು ಹೋಲಿಸಿ.
- ಪಟ್ಟಿಗಳು ಮತ್ತು ಕೋಡ್ ಬ್ಲಾಕ್ಗಳಿಗೆ ಓವರ್ಲ್ಯಾಪ್ ವಿಂಡೋಗಳನ್ನು ಬಳಸಿ.
- ರಿಟ್ರೀವ್ ಮಾಡಿದ ಚಂಕ್ಗಳ ನಿಖರತೆ ಮತ್ತು ಸ್ಮರಣಶಕ್ತಿ ಅಳೆಯಿರಿ.
- ಸಲಹೆ: ಸಂಬಂಧಿತತೆಯಿಗಾಗಿ ಚಂಕ್ಗಳನ್ನು ಸರಿದೂಗಿಸಲು nhỏ ಗಾತ್ರದಲ್ಲಿ ಇರಿಸಿ, ಆದರೆ ಸ೦ದರ್ಭಕ್ಕೆ ಸಾಕಷ್ಟು ದೊಡ್ಡದಾಗಿರಲಿ (ಅವಕಾಶವಿಲ್ಲದಂತೆ 300–700 ಟೋಕೆನ್ಸ್ 10–20% ಓವರ್ಲ್ಯಾಪ್ಗಳು).
4) ವಿಸ್ತೀರ್ಣದಲ್ಲಿ ಎಂಬೆಡ್ಡಿಂಗ್ಗಳು: ಮಾದರಿಗಳು ಮತ್ತು ವೆಕ್ಟರ್ ಸ್ಟೋರ್ಗಳನ್ನು ಬದಲಾಯಿಸುವುದು
- ಶ್ರೇಷ್ಠತೆ: ಮಾದರಿಯ ಆಯ್ಕೆ ನಿಮ್ಮ ರಿಟ್ರೀವಲ್ ಮಿತಿಯನ್ನು ನಿಶ್ಚಲವಾಗಿ ನಿರ್ಧರಿಸುತ್ತದೆ.
- ನೀವು ನಿರ್ಮಿಸುವುದು: ಎಂಬೆಡ್ಡಿಂಗ್ (ಉದಾ:
text-embedding-3-large, BGE, E5) ಮತ್ತು ವೆಕ್ಟರ್ ಸ್ಟೋರ್ಗಳು (FAISS, Milvus, PGVector) ಬದಲಾಯಿಸುವ ಪೈಪ್ಲೈನ್ ರೂಪ.
- ಸ್ಥಿರ ಪ್ರಶ್ನೆಗಳಿಗಾಗಿ A/B ರಿಟ್ರೀವಲ್ ಪರೀಕ್ಷೆಗಳನ್ನು ನಡೆಸಿ.
- ಹಿಟ್ ದರ ಮತ್ತು ಸರಾಸರಿ ಪ್ರತ್ಯಯ ರ್ಯಾಂಕ್ ಅನ್ನು ಅನುಸರಿಸಿ.
- ಮಾದರಿ ಮಾರ್ಗದರ್ಶನದಂತೆ ಕೋಸೈನ್ ಅಥವಾ ಡಾಟ್-ಪ್ರಾಡಕ್ಟ್ ಸಾದೃಶ್ಯತೆಯನ್ನು ಆಯ್ಕೆಮಾಡಿ.
- ಉಪಯುಕ್ತ: ಬೆಳವಣಿಗೆಗೆ ಸಜ್ಜಾಗುತ್ತಿರುವ ಅಥವಾ ವೆಚ್ಚ-ಕಾರ್ಯಕ್ಷಮತೆ ತುಣುಕಾಟ ಮಾಡುವ ತಂಡಗಳಿಗೆ.
5) RAGFlow ನಲ್ಲಿ ರಕ್ಷಾ ಮಾರ್ಗಗಳು ಮತ್ತು ಭ್ರಮೆ ನಿವಾರಣೆ
- ಶ್ರೇಷ್ಠತೆ: ಉತ್ಪಾದನೆಯಲ್ಲಿ ಭದ್ರತೆ ಬದ್ಧವಲ್ಲ.
- ನೀವು ನಿರ್ಮಿಸುವುದು: ಉತ್ತರ ನಿರ್ಬಂಧಗಳು, ನಿರಾಕರಣೆ ನೀತಿಗಳು ಮತ್ತು ಉಲ್ಲೇಖ ಪರಿಶೀಲನೆಗಳೊಂದಿಗೆ ರಿಟ್ರೀವಲ್-ಆಗ್ಮೆಂಟೆಡ್ ಪೈಪ್ಲೈನ್.
- ಪ್ರತಿ ಉತ್ತರ ಕನಿಷ್ಠ N ಮೂಲಗಳನ್ನು ಉಲ್ಲೇಖಿಸುವಂತೆ ಖಚಿತಪಡಿಸುವನ್ನು ಉತ್ತರ ಪರಿಶೀಲಕ ನೋಡ್ ಸೇರಿಸಿ.
- ಹುಚ್ಚು ನಿರೀಕ್ಷೆಯನ್ನಿಲ್ಲ, ಸಾಕ್ಷ್ಯವಿಲ್ಲದಾಗ “ನನಗೆ ಗೊತ್ತಿಲ್ಲ” ಎಂದು_REQUIRE ಮಾಡಿಕೊಳ್ಳುವ ಸೂಚನಾ ಟೆಂಪ್ಲೇಟ್ನ್ನು ಬಳಸಿ.
- ರಿಟ್ರೀವ್ ಮಾಡಿದ ಚಂಕ್ಗಳ ವಿರುದ್ಧ ಜನರೇಷನ್ ನಂತರದ ವಿಷಯ ಪರಿಶೀಲನೆ ಸೇರಿಸಿ.
6) ಸಂರಚಿತ ಡೇಟಾಗೆ RAGFlow: SQL + ಪಠ್ಯ ಸಂಯೋಜಿತ ರಿಟ್ರೀವಲ್
- ಶ್ರೇಷ್ಠತೆ: ಹಲವಾರು ಪ್ರಶ್ನೆಗಳು ಡಾಕ್ಯುಮೆಂಟ್ಗಳು ಮತ್ತು ಡೇಟಾಬೇಸ್ಗಳನ್ನು ಮಿಶ್ರಣಗೊಳಿಸುತ್ತವೆ.
- ನೀವು ನಿರ್ಮಿಸುವುದು: ಡಾಕ್ಯುಮೆಂಟ್ಗಳಿಗೆ ಸೆಮ್ಯಾಂಟಿಕ್ ರಿಟ್ರೀವಲ್ ಮತ್ತು SQLಗಾಗಿ ಉಪಕರಣ ಕರೆಗೆಳ್ಳುವ ದ್ವಂದ್ವ-ರಿಟ್ರೀವರ್ ಪೈಪ್ಲೈನ್.
- ರೇಖಾಚಿತ್ರ ಪ್ರಶ್ನೆಗಳನ್ನು ಉಪಕರಣ ಕರೆ ಮೂಲಕ SQL ಗೆ ಮಾರ್ಗನಿರ್ದೇಶಿಸಿ.
- SQL ಫಲಿತಾಂಶ ಟೇಬಲ್ನ್ನು LLM ಗೆ ಸ೦ದರ್ಭ ವಸ್ತುವಾಗಿ ಸೇರಿಸಿ.
- ನರೇಟಿವ್ ವಿವರಣೆಗಾಗಿ ಡಾಕ್ಯುಮೆಂಟ್ ಉಲ್ಲೇಖಗಳೊಂದಿಗೆ ಒಂದಾಗಿಸಿ.
7) RAG ಗುಣಮಟ್ಟವನ್ನು ಗೋಲ್ಡ್ ಸೆಟ್ ಮತ್ತು ಮಾನವ ಪರಿಷ್ಕರಣೆಯಿಂದ ಮೌಲ್ಯಮಾಪನ
- ಶ್ರೇಷ್ಠತೆ: ಮೌಲ್ಯಮಾಪನವಿಲ್ಲದೆ ನೀವು ಕಪ್ಪುಗಾಬಿದಂತೆ ಇದ್ದೀರಿ.
- ನೀವು ನಿರ್ಮಿಸುವುದು: ನೆಲಬದ್ಧತೆ, ಉಲ್ಲೇಖ ವ್ಯಾಪ್ತಿಯನ್ನು ಮತ್ತು ಸಹಾಯಕರತೆಯನ್ನು ಅಳೆಯುವ ಮೌಲ್ಯಮಾಪನ ವ್ಯವಸ್ಥೆ.
- ಮೂಲಗಳೊಂದಿಗೆ 50–200 ಗೋಲ್ಡ್ ಪ್ರಶ್ನೋತ್ತರ ಜೋಡಿಗಳನ್ನು ಸಿದ್ಧಪಡಿಸಿ.
- ಪ್ರತಿ ಪೈಪ್ಲೈನ್ ಬದಲಾವಣೆಯ ನಂತರ ಸ್ವಯಂಚಾಲಿತ ಚಾಲನೆಗಳನ್ನು ಹೊಂದಿಸಿ.
- ಮಾದರಿ ಉತ್ತರಗಳು ಮತ್ತು ಗೋಲ್ಡ್ ಉಲ್ಲೇಖಗಳ ನಡುವಿನ ಒಪ್ಪಂದ ಅಂಕಗಳನ್ನು ಬಳಸಿ.
8) RAGFlow ಉತ್ಪಾದನೆಯಲ್ಲಿ: ಕ್ಯಾಶಿಂಗ್, ಟೈಮೌಟ್ ಮತ್ತು ತಪಾಸಣಾ ಸಾಮರ್ಥ್ಯ
- ಶ್ರೇಷ್ಠತೆ: ಉತ್ಪಾದನೆಯು ದೈರ್ಘ್ಯ, ದರ ಮಿತಿಗಳು ಮತ್ತು ವೆಚ್ಚ ಮಿತಿಗಳನ್ನು ಪರಿಚಯಿಸುತ್ತದೆ.
- ನೀವು ನಿರ್ಮಿಸುವುದು: ವಿನಂತಿಗೆ ಕ್ಯಾಶ್, ಮರುಪ್ರಯತ್ನಗಳು ಮತ್ತು ಟ್ರೇಸ್ ಡ್ಯಾಶ್ಬೋರ್ಡ್ಗಳೊಂದಿಗೆ ಬಲವಾದ ಪೈಪ್ಲೈನ್.
- ನ್ಯಾಮೃತ ಪ್ರಶ್ನೆಗಳ ಮೇರೆಗೆ ವ್ಯಕ್ಟರ್ ಮತ್ತು ಜನರೇಷನ್ ಕ್ಯಾಶ್ ಸೇರಿಸಿ.
- ಪೂರಕ ಸಾಪೋರ್ಟ್ ಸಮಸ್ಯೆಗಳಿಗೆ ಬ್ಯಾಕ್ಆಫ್ ಅನುಷ್ಠಾನ ಮಾಡಿರಿ.
- ರಿಟ್ರೀವಲ್ ದೈರ್ಘ್ಯ ಮತ್ತು ಟೋಕೆನ್ ಬಳಕೆಯ ಸ್ಪ್ಯಾನ್/ಮೆಟ್ರಿಕ್ಸ್ ಬಿಡುಗಡೆಯಿರಿ.
9) ಡೊಮೇನ್-ನಿರ್ದಿಷ್ಟ ಪ್ಲೇಬುಕ್ಗಳು: ಕಾನೂನು, ಆರೋಗ್ಯ, ಮತ್ತು ಬೆಂಬಲ
- ಶ್ರೇಷ್ಠತೆ: ಡೊಮೇನ್ ನಿಯಮಾವಳಿಗಳು ಎಲ್ಲವನ್ನೂ ಬದಲಿಸುತ್ತವೆ.
- ನೀವು ನಿರ್ಮಿಸುವುದು: ಪ್ರತಿ ಡೊಮೇನ್ಗೆ ಅನುಕೂಲವಾಗುವ ಅನುಸೂಚನೆಗಳು—ಅನುಸರಣಾ, ಶಬ್ದಕೋಶ ಮತ್ತು ವಿತರಣಾ ಮಾದರಿಗಳು.
- ಕಾನೂನು: ವಿಭಾಗಗಳನ್ನು ಪ್ರಾಧಾನ್ಯತೆ ನೀಡಿ, ಪ್ಯಾರಾಗ್ರಾಫ್ ID ಗಳುಯಿಂದ ಉಲ್ಲೇಖಿಸಿ.
- ಆರೋಗ್ಯ: ವೈಯಕ್ತಿಕರಹಿತ PHI, ಮಾರ್ಗಸೂಚಿಗಳ ಪ್ರಕಾರ ಸಲಹೆಗಳನ್ನು ಮಿತಿಗೊಳಿಸಿ.
- ಬೆಂಬಲ: ಟಿಕೆಟ್ ಇತಿಹಾಸ ಸೇರಿಸಿ; ಇತ್ತೀಚಿನ ಡಾಕ್ಯುಮೆಂಟ್ಗಳಿಗೆ ಹೆಚ್ಚಿನ ತೂಕ ನೀಡಿ.
10) RAGFlow + ಫಂಕ್ಷನ್ ಕರೆ: ಉತ್ತರ ಮಾತ್ರವಲ್ಲ, ಕ್ರಿಯೆಗಳೂ
- ಶ್ರೇಷ್ಠತೆ: ಅತ್ಯಂತ ಶಕ್ತಿಶಾಲಿ RAG ವ್ಯವಸ್ಥೆಗಳು ಓದಿ, ಯೋಚಿಸಿ ಮತ್ತು ನಡೆದುಕೊಳ್ಳಲು ಸಾಧ್ಯ.
- ನೀವು ನಿರ್ಮಿಸುವುದು: LLM ಡಾಕ್ಯುಮೆಂಟುಗಳನ್ನು ರಿಟ್ರೀವ್ ಮಾಡಿ, ಮುಂದಿನ ಉಪಕರಣಗಳನ್ನು ಕರೆ ಮಾಡುತ್ತದೆ—ಇಮೇಲ್ ಕಳುಹಿಸುವುದು, ಟಿಕೆಟ್ ತೆರೆಯುವುದು ಅಥವಾ ಕಾರ್ಯನಿರ್ವಹಣೆಯನ್ನು ವೇಳಾಪಟ್ಟಿ ಮಾಡುವುದು.
- ಉಪಕರಣಗಳಿಗೆ JSON_schemaಗಳನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಿ.
- “ಉತ್ತರ” ಮತ್ತು “ಕ್ರಿಯೆ” ಪ್ರಶ್ನೆಗಳನ್ನು ವಿಭಜಿಸಲು ನಿರ್ಣಯ ರೌಟರ್ ಸೇರಿಸಿ.
- ಪ್ರತಿ ಉಪಕರಣ ಕರೆಗಳಿಗೆ ರಕ್ಷಾ ಮಾರ್ಗಗಳು ಮತ್ತು ಅನುಮೋದನೆಗಳನ್ನು ಲಾಗ್ ಮಾಡಿ.
ಪ್ರಾಯೋಜನಾತ್ಮಕ ಯೋಜನೆ: 30 ದಿನಗಳಲ್ಲಿ ಪಾಠದಿಂದ ಉತ್ಪಾದನೆಗೆ
ಈ ಮೇಲೆ ನೀಡಿರುವ ಪಾಠಗಳನ್ನು ನಾಲ್ಕು ಹಂತಗಳಲ್ಲಿ ಬಳಸಿ. ಇದನ್ನು ನಿಮ್ಮ “RAGFlow ಬೂಟ್ಕ್ಯಾಂಪ್” ಎಂದು ಪರಿಗಣಿಸಿ.
ವಾರ 1: ನೆಲೆಗಳು ಮತ್ತು ಮೊದಲ ಜಯಗಳು
- ಪಾಠ 1 (ಕ್ವಿಕ್ಸ್ಟಾರ್ಟ್) ಮತ್ತು ಪಾಠ 3 (ಚಂಕಿಂಗ್ ಮಾಸ್ಟರ್ ಕ್ಲಾಸ್) ಪೂರ್ಣಗೊಳಿಸಿ.
- ನಿಮ್ಮ ಡಾಕ್ಯುಮೆಂಟ್ಗಳಿಂದ 20–30 ಪರೀಕ್ಷೆಯ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸುವ ದೃಢೀಕರಣವನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿ.
- ಉಲ್ಲೇಖಗಳು ಮತ್ತು ನಿರಾಕರಣೆಗಳ ਲਈ ಮೂಲ ಉತ್ತರ ಟೆಂಪ್ಲೇಟುಗಳನ್ನು ಸೇರಿಸಿ.
ವಾರ 2: ಡೇಟಾ ಆಳ ಮತ್ತು ವಿಶ್ವಾಸಾರ್ಹತೆ
- ಬಹು-ಮೂಲ ಇಂಜೆಸ್ಟನ್ (ಪಾಠ 2) ಮತ್ತು ವಿಧಿ ತಾಳೋಗ್ಯವನ್ನು ಸೇರಿಸಿ.
- ಎಂಬೆಡ್ಡಿಂಗ್ಗಳು ಮತ್ತು ವೆಕ್ಟರ್ ಸ್ಟೋರ್ ಬದಲಾಯಿಸಿ (ಪಾಠ 4); ವೆಚ್ಚ/ಗುಣಮಟ್ಟ ವಿಜೇತರನ್ನು ಆಯ್ಕೆಮಾಡಿ.
- ಟೈಮೌಟ್ ಮತ್ತು ಕ್ಯಾಶಿಂಗ್ ಪರಿಚಯಿಸಿ (ಪಾಠ 8) ದೈರ್ಘ್ಯವನ್ನು ಸ್ಥಿರವಾಗಿಡಲು.
ವಾರ 3: ಮೌಲ್ಯಮಾಪನಗಳು, ರಕ್ಷಾ ಮಾರ್ಗಗಳು, ಮತ್ತು ಡೊಮೇನ್ ಹೊಂದಾಣಿಕೆ
- ಗೋಲ್ಡ್ ಸೆಟ್ ಮತ್ತು ಸ್ವಯಂಚಾಲಿತ ಮೌಲ್ಯಮಾಪನಗಳನ್ನು ನಿರ್ಮಿಸಿ (ಪಾಠ 7).
- ಜನರೇಷನ್ ನಂತರದ ವಿಷಯ ಪರಿಶೀಲನೆಗಳು ಮತ್ತು ನಿರಾಕರಣೆ ನೀತಿಗಳನ್ನು ಸೇರಿಸಿ (ಪಾಠ 5).
- ಕಸ್ಟಮ್ ಪ್ರಾಂಪ್ಟ್ಗಳೊಂದಿಗೆ ಡೊಮೇನ್ ಪ್ಲೇಬುಕ್ ಅನ್ವಯಿಸಿ (ಪಾಠ 9).
ವಾರ 4: ಸಂಯೋಜಿತ ರಿಟ್ರೀವಲ್ ಮತ್ತು ಕಾರ್ಯಕ್ಷಮತೆ
- ಮಿಶ್ರಿತ ಪ್ರಶ್ನೆಗಳಿಗೆ SQL/ಉಪಕರಣ ಕರೆಗಳನ್ನು ವಯರ್ನಲ್ಲಿ ಜೋಡಿಸಿ (ಪಾಠ 6).
- ಫಂಕ್ಷನ್ ಕರೆ ಮತ್ತು ಅನುಮೋದನೆಗಳನ್ನು ಸೇರಿಸಿ (ಪಾಠ 10) ಹೀಗಾಗಿ ನಿಮ್ಮ RAGFlow ಅಪ್ಲಿಕೇಶನ್ ಕ್ರಿಯೆಗಳನ್ನು ಕೈಗೊಳ್ಳಬಹುದು.
- ತಪಾಸಣಾ ಡ್ಯಾಶ್ಬೋರ್ಡ್ಗಳನ್ನು ಸಾಧಿಸಿ; ಸರಿಯಾದಿಕೆ ಮತ್ತು ದೈರ್ಘ್ಯಕ್ಕಾಗಿ SLOಗಳನ್ನು ಸ್ಥಾಪಿಸಿ.
ನಿಮಗೆ ತಿಳಿಯಬೇಕಾದ RAGFlow ಸಂಪ್ರದಾಯಗಳು
ಅತ್ಯುತ್ತಮ RAGFlow ಪಾಠಗಳು ಕೆಲವು ಮೂಲಭೂತ ಕಲ್ಪನೆಗಳನ್ನು ಆಧರಿಸುತ್ತವೆ. ಇದು ಒಂದು ದ್ರುತ ಪಠ್ಯಸಾರಾಂಶ.
- Retrieval Augmented Generation (RAG): ನಿಮ್ಮ ಜ್ಞಾನ ಆಧಾರದಿಂದ ರಿಟ್ರೀವ್ ಮಾಡಿದ ಚಂಕ್ಗಳೊಂದಿಗೆ LLM ಸ೦ದರ್ಭವನ್ನು ವೃದ್ಧಿಸಿ, ಆದರಿಂದ ಉತ್ತರಗಳು ಸಾಕ್ಷ್ಯದಲ್ಲಿ ನೆಲಬದ್ಧವಾಗಿರುತ್ತವೆ.
- ಚಂಕಿಂಗ್: ಡಾಕ್ಯುಮೆಂಟುಗಳನ್ನು ರಿಟ್ರೀವ್ ಮಾಡಬಹುದಾದ ಘಟಕಗಳಾಗಿ ವಿಭಜಿಸುವುದು. ಓವರ್ಲ್ಯಾಪ್ಗಳು ಸ೦ದರ್ಭವನ್ನು ಉಳಿಸು ತುತ್ತವೆ; ಶೀರ್ಷಿಕೆಗಳು ಗಡಿಗಳನ್ನು ರಚಿಸುತ್ತವೆ; ಸೆಮಾಂಟಿಕ್ ವಿಧಾನಗಳು ನೈಸರ್ಗಿಕ ವಿಶ್ರಾಂತಿ ಬಿಂದುಗಳನ್ನು ಹುಡುಕಲು ಎಂಬೆಡ್ಡಿಂಗ್ಗಳನ್ನು ಉಪಯೋಗಿಸುತ್ತವೆ.
- ಎಂಬೆಡ್ಡಿಂಗ್ಗಳು: ಚಂಕ್ಗಳು ಮತ್ತು ಪ್ರಶ್ನೆಗಳ ವೆಕ್ಟರ್ ಸೂಚ್ಯಂಕಗಳು. ಉತ್ತಮ ಎಂಬೆಡ್ಡಿಂಗ್ಗಳು ರಿಟ್ರೀವಲ್ ಪ್ರಸ್ತುತತೆಯನ್ನು ಸುಧಾರಿಸಿ ಮತ್ತು ಭ್ರಮೆಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತವೆ.
- ವೆಕ್ಟರ್ ಸ್ಟೋರ್: ಸಾದೃಶ್ಯ ಹುಡುಕಾಟದೊಂದಿಗೆ ವೆಕ್ಟರ್ಗಳ ಡೇಟಾಬೇಸ್. ಆಯ್ಕೆಗಳು ವೇಗ, ಸ್ಮರಣಶಕ್ತಿ ಮತ್ತು ವಿಸ್ತರಣೆ ಮೇಲೆ ಪ್ರಭಾವ ಬೀರುತ್ತವೆ.
- ರೀರ್ಯಾಂಕಿಂಗ್: ಐಚ್ಛಿಕ ಎರಡನೇ ಹಂತದ ಅಂಕಲಿಕೆ, ರಿಟ್ರೀವ್ ಮಾಡಿದ ಚಂಕ್ಗಳನ್ನು ಸಂಬಂಧಿತತೆಯ ಆಧಾರದ ಮೇಲೆ ಮರುತಪ್ಪಲು.
- ಪ್ರಾಂಪ್ಟ್ ಎಂಜಿನಿಯರಿಂಗ್: ಉಲ್ಲೇಖಗಳನ್ನು ಅಗತ್ಯವಿರುವಂತೆ, ಊಹಿಸುವಿಕೆಯನ್ನು ನಿಷೇಧಿಸುವಂತೆ ಮತ್ತು ಔಟ್ಪುಟ್ ಸ್ವರೂಪಗೊಳಿಸುವಂತೆ ಸ್ಪಷ್ಟ ಸೂಚನೆಗಳು.
- ಮೌಲ್ಯಮಾಪನಗಳು: ಗೋಲ್ಡ್ ಸೆಟ್ಗಳು, ಮಾನವರ ವಿಮರ್ಶೆ ಮತ್ತು ಸ್ವಯಂಚಾಲಿತ ಮೆಟ್ರಿಕ್ಗಳನ್ನು ಉಪಯೋಗಿಸಿ ಕ್ರಮಬದ್ಧ ಅಳತೆ.
ನಕಲಿ ಪ್ರಾರಂಭ: ಮೂಲ RAG ಪ್ರಾಂಪ್ಟ್ ಟೆಂಪ್ಲೇಟ್
ಭ್ರಮೆಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುವುದು ಮತ್ತು ಉಲ್ಲೇಖಗಳನ್ನು ಜಾರಿಗೆ ತರಲು ನಿಮ್ಮ ಜನರೇಷನ್ ನೋಡ್ನಲ್ಲಿ ಈ ಟೆಂಪ್ಲೇಟನ್ನು ಉಪಯೋಗಿಸಿ.
ನೀವು ನಿಖರವಾದ ಸಹಾಯಕ—ರಿಟ್ರೀವ್ ಆದ ಸ೦ದರ್ಭದಲ್ಲಿ ದೊರಕಿದ ಮಾಹಿತಿಯಿಂದ ಮಾತ್ರ ಉತ್ತರಿಸುತ್ತೀರಿ.
ನಿಯಮಗಳು:
- ಪ್ರತಿ ವಾದದ ನಂತರ [source_name:page_or_section] ಉತ್ತಮೇಶೂ ಉಲ್ಲೇಖ ಮಾಡಿ.
- ಉತ್ತರ ಸ೦ದರ್ಭದಲ್ಲಿಲ್ಲದಿದ್ದರೆ "ನನಗೆ ಪೂರಾಯಿತ ಮೂಲಗಳ ಮೇರೆಗೆ ತಿಳಿದುಕೊಳ್ಳಲಿಲ್ಲ" ಎಂದು ಹೇಳಿರಿ.
- ವ್ಯಾಖ್ಯಾನಗಳಿಗೆ ನೇರ ಉಲ್ಲೇಖಗಳನ್ನು ಆದ್ಯತೆ ನೀಡಿ; ಪ್ರಕ್ರಿಯೆಗಳಿಗಾಗಿ ಸಾರಾಂಶವನು ನೀಡಿರಿ.
ಸ೦ದರ್ಭ:
{{retrieved_context}}
ಪ್ರಶ್ನೆ:
{{user_query}}
ಉತ್ತರ:
ಉದಾಹರಣೆ: ಎಂಬೆಡ್ಡಿಂಗ್ ಬದಲಾವಣೆ ಮತ್ತು ಪ್ರಭಾವ ಮಾಪನ
# ಹೆಚ್ಚಿನ ಮಟ್ಟದ ಪಾಠಗಳಲ್ಲಿ ಕಾಣುವ ಪ್ರಾಯೋಗಿಕ ತರ್ಕ ತೋರಿಸುವ ನಕಲಿ ಕೋಡ್
from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness
pipelines = []
for model in ["text-embedding-3-large", "bge-large", "e5-large"]:
emb = EmbeddingNode(model=model)
vs = VectorStoreNode(kind="milvus", metric="cosine")
pl = Pipeline.add_nodes([
"ingest", "chunk", emb, vs, "retrieve", "generate"
])
pipelines.append((model, pl))
h = EvalHarness(goldset="gold_qa.jsonl")
results = {}
for model, pl in pipelines:
results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"])
print(results)
ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಮಾರ್ಗದರ್ಶಿ:
- ಮಾಡೆಲ್ ಬದಲಾವಣೆಯ ನಂತರ ನೆಲಬದ್ಧತೆಯಲ್ಲಿ ಏರಿಕೆ ಬಂದರೆ, ಅದನ್ನು ಕಾಯ್ದುಕೊಳ್ಳಿ—ಟೋಕೆನ್ ವೆಚ್ಚ ಸ್ವಲ್ಪ ಹೆಚ್ಚಾಗುತ್ತಿದ್ದರೂ ಸಹ.
- ದೈರ್ಘ್ಯ ಹೆಚ್ಚಾದರೆ, ಕ್ಯಾಶಿಂಗ್ ಸೇರಿಸಿ ಅಥವಾ ಮ್ಯಾಕ್ಸ್ ರಿಟ್ರೀವ್ ಮಾಡಿದ ಚಂಕ್ಗಳನ್ನು 8 ರಿಂದ 5 ಕ್ಕೆ ಕಡಿಮೆ ಮಾಡಿ.
- ಉಲ್ಲೇಖ ವ್ಯಾಪ್ತಿ ಕಡಿಮೆಯಾಗಿದ್ರೆ, ಚಂಕ್ ಗಾತ್ರ ತಿದ್ದಿ ಅಥವಾ ಮರುರ್ಯಾಂಕ್ ಮಾಡಿ.
ಈ ಪಾಠಗಳು ನಿಮ್ಮನ್ನು ತಪ್ಪುಗಳಿಂದ ರಕ್ಷಿಸುತ್ತವೆ
- ಹೆಚ್ಚು ಚಂಕ್ ಮಾಡುವುದು: ಚಿಕ್ಕ ಚಂಕ್ಗಳು ಸ೦ದರ್ಭ ಕಳೆಯುತ್ತವೆ ಮತ್ತು ಪ್ರತ್ಯುತ್ತರದಲ್ಲಿ ಶಬ್ದ ಹೆಚ್ಚಾಗುತ್ತದೆ.
- ಕಡಿಮೆ ಚಂಕ್ ಮಾಡುವುದು: ದೊಡ್ಡ ಚಂಕ್ಗಳು ನಿರ್ಮೂಲಕ ಸ೦ದರ್ಭಗಳನ್ನು ಕರಪತ್ರಗೊಳಿಸುತ್ತವೆ.
- ಒಂದು ಗಾತ್ರದ ಎಂಬೆಡ್ಡಿಂಗ್ಗಳು ಎಲ್ಲಿಗೆ ಹೊಂದಿಕೆಯಾಗದು: ಡೊಮೇನ್ ಭಾಷೆ (ಕಾನೂನು, ವೈದ್ಯಕೀಯ)ಗಳಿಗೆ ಡೊಮೇನ್-ಟ್ಯೂನ್ ಮಾಡಲಾದ ಮಾದರಿಗಳು ಬೇಕಾಗಬಹುದು.
- ಮೌಲ್ಯಮಾಪನ ಇಲ್ಲದಿರುವುದು: ಬೇಸಿಕ್ಕೆಲದ ಬದಲಾವಣೆಗಳು ಅಸ್ಪಷ್ಟ ಇಳಿಜಾರನ್ನು ಉಂಟುಮಾಡುತ್ತವೆ.
- ಹಳೆಯದಾಗಿರುವ ಸೂಚ್ಯಂಕಗಳ ನಿರ್ಲಕ್ಷ್ಯ: ಈರಿಂದ ಸರಿಯಾದ ಆದರೆ ಅನಾಥಾನವಾದ ಉತ್ತರ ಲಭ್ಯವಾಗುತ್ತದೆ.
- ರಕ್ಷಾ ಮಾರ್ಗಗಳನ್ನು ಬಿಟ್ಟುಕೊಡುವುದು: ಇಲ್ಲದೆ ನಿಮ್ಮ ಮಾದರಿ ಊಹಿಸುವಿಕೆ ಮಾಡುತ್ತದೆ.
ನಿಮ್ಮ ಉಪಯೋಗಕ್ಕೆ ಸೂಕ್ತ ಪಾಠ ಆಯ್ಕೆಮಾಡುವುದು
- ಸ್ಟಾರ್ಟ್ಅಪ್ ಬೆಂಬಲ ಬಾಟ್: ಪಾಠಗಳು 1, 2, 5, 8, 9.
- ಆಂತರಿಕ ಸಂಶೋಧನಾ ಸಹಾಯಕ: ಪಾಠಗಳು 1, 3, 4, 7.
- ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಸಹಚರ: ಪಾಠಗಳು 6, 10.
- ನಿಯಂತ್ರಿತ ಉದ್ಯಮಗಳು: ಮೊದಲು ಪಾಠ 5 ಮತ್ತು 9 ನಂತರ 7.
ಮತ್ತೊಂದು ವಿಷಯ: Sider.AI ಮೂಲಕ ತ್ವರಿತ ಪ್ರೋಟೋಟೈಪ್ ಮಾಡು
ನೀವು RAG ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ತಿರುವು ಮಾಡುತ್ತಿದ್ದಾಗ, ಪ್ರಶ್ನೆಗಳನ್ನು ಪರೀಕ್ಷಿಸುತ್ತಿದ್ದಾಗ ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಹೋಲಿಸುತ್ತಿದ್ದಾಗ, ಸ೦ದರ್ಭ ಬದಲಾಗಿಸುವುದು ದುರ್ಬਲ. ಗಮನಾರ್ಹ: Sider.AI (https://sider.ai/) ನಿಮ್ಮ ಬಳಕೆಗೂಡುವ ವಿವಿಧ ಮಾದರಿಗಳೊಂದಿಗೆ ಚಾಟ್ ಮಾಡಲು, ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಪಿನ್ ಮಾಡಲು ಮತ್ತು ಜ್ಞಾನ ಕಾರ್ಮಿಕ್ ಅನ್ನು ಕಾಯ್ದುಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಇದು ಉಪಯುಕ್ತವಾಗಿದೆ: - ಹೆರೆಗಿನ ವಿಭಿನ್ನ ರಿಟ್ರೀವಲ್ ಸೆಟ್ಟಿಂಗ್ಗಳು ಮತ್ತು ಪ್ರಾಂಪ್ಟ್ಗಳಿಂದ ಉತ್ತರಗಳನ್ನು ಹೋಲಿಸಲು.
- ಬದಲಾವಣೆಯನ್ನು RAGFlow ಗೆ ಅನ್ವಯಿಸುವ ಮೊದಲು ತ್ವರಿತ ಪರಿಶೀಲನೆಗಳಿಗಾಗಿ ಪರೀಕ್ಷಿಸುವುದಕ್ಕೆ.
- ನಕಲು ಟುಣಿಸುತ್ತಲೆ, ಉಲ್ಲೇಖ, ಮತ್ತು ಗೋಲ್ಡ್ ಪ್ರಶ್ನೋತ್ತರಗಳನ್ನು ನಿಮ್ಮ ಮೌಲ್ಯಮಾಪನ ಏರುವಿಗೆ ಜೋಡಿಸಲು.
RAGFlow ಪಾಠಗಳನ್ನು ಅನುಸರಿಸುವಾಗ ಅದನ್ನು ನಿಮ್ಮ ಕರಟೆಬುಕ್ ಆಗಿ ಬಳಸಿ; ನಂತರ ವಿಜೇತರನ್ನು ನಿಮ್ಮ ಪೈಪ್ಲೈನ್ನಲ್ಲಿ ನಿರupeಪಡಿಸಿ.
ತೊಂದರೆ ಪರಿಹಾರ ಮಾರ್ಗದರ್ಶಿ: ಸಮಸ್ಯೆಗಳು ಬಿಟ್ಟಾಗ ತ್ವರಿತ ಪರಿಹಾರಗಳು
- ಲಕ್ಷಣ: ಉತ್ತರಗಳು ಸಾಮಾನ್ಯವಾಗಿದ್ದು ಉಲ್ಲೇಖಗಳಿಲ್ಲ.
- ಪರಿಹಾರ: ಪ್ರಾಂಪ್ಟ್ನಲ್ಲಿ ಉಲ್ಲೇಖ ಅಗತ್ಯವನ್ನುವ್ಯವಹರಿಸಿ ಮತ್ತು ಪರಿಶೋಧಕ ನೋಡ್ ಸೇರಿಸಿ.
- ಲಕ್ಷಣ: ಸಂಬಂಧವಿಲ್ಲದ ಚಂಕ್ಗಳು ರಿಟ್ರೀವ್ ಆಗುತ್ತಿದ್ದವು.
- ಪರಿಹಾರ: ಚಂಕ್ ಓವರ್ಲ್ಯಾಪ್ ಹೆಚ್ಚಿಸಿ, ಉತ್ತಮ ಎಂಬೆಡ್ಡಿಂಗ್ ಮಾದರಿಯನ್ನು ಬದಲಿಸಿ ಅಥವಾ ಮರುರ್ಯಾಂಕಿಂಗ್ ಸೇರಿಸಿ.
- ಲಕ್ಷಣ: ದೈರ್ಘ್ಯ 3 ಸೆಕೆಂಡ್ಗಳಿಗಿಂತ ಹೆಚ್ಚು.
- ಪರಿಹಾರ: ವ್ಯಕ್ಟರ್ ಫಲಿತಾಂಶಗಕಾಶ್ ಮಾಡಿ, ರಿಟ್ರೀವ್ ಮಾಡಿದ ಚಂಕ್ಗಳನ್ನು ಮಿತಿ ಮಾಡಿ ಮತ್ತು ಸ್ಟ್ರೀಮಿಂಗ್ ಟೋಕನ್ಗಳನ್ನು ಉಪಯೋಗಿಸಿ.
- ಲಕ್ಷಣ: ಪ್ರಶ್ನೆಗಳಲ್ಲಿ ಪರಸ್ಪರ વિરોધಿ ಉತ್ತರಗಳು.
- ಪರಿಹಾರ: ಮೆಟಾಡೇಟಾವನ್ನು ಸಾಮಾನ್ಯೀಕರಿಸಿ, ಸಮೀಪದ ನಕಲಿ ಚಂಕ್ಗಳನ್ನು ನಿಷ್ಕೃತಗೊಳಿಸಿ, ಹೊಸ ಡಾಕ್ಯುಮೆಂಟ್ಗಳಿಗೆ ಹೆಚ್ಚುವರಿ ತೂಕ ನೀಡಿ.
- ಲಕ್ಷಣ: ಮಾದರಿ "ನನಗೆ ತಿಳಿದಿಲ್ಲ" ಅನ್ನು ಅಧಿಕ ಎನ್ನಿಸುತ್ತಿದೆ.
- ಪರಿಹಾರ: ನಿರಾಕರಣೆ ಗಡಿಯನ್ನು ಸಡಿಲಿಸಿ, ರಿಟ್ರೀವಲ್ ಆಳವನ್ನು ವಿಸ್ತರಿಸಿ ಅಥವಾ ಚಂಕ್ ಗಡಿಗಳನ್ನು ಸಧಾರಿಸಿ.
ಮುಖ್ಯ ಪಾಠಗಳು
- ಅತ್ಯುತ್ತಮ RAGFlow ಪಾಠಗಳು ವಾಸ್ತವಿಕ ಡೇಟಾ ಮತ್ತು ಮೌಲ್ಯಮಾಪನಗಳೊಂದಿಗೆ ಕೊನೆಯಿಂದ ಕೊನೆಗೆ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಕಲಿಸುತ್ತವೆ.
- ಚಂಕಿಂಗ್ ಮತ್ತು ಎಂಬೆಡ್ಡಿಂಗ್ಗಳು ಉತ್ತರ ಗುಣಮಟ್ಟದ ಮೇಲೆ ಅತ್ಯಂತ ಪರಿಣಾಮ ಬೀರುತ್ತವೆ.
- ಉತ್ಪಾದನಾ ಯಶಸ್ಸಿಗೆ ಕ್ಯಾಶಿಂಗ್, ತಪಾಸಣಾ ಸಾಮರ್ಥ್ಯ, ರಕ್ಷಾ ಮಾರ್ಗಗಳು ಮತ್ತು ಗೋಲ್ಡ್ ಸೆಟ್ ಅಗತ್ಯ.
- ಡೊಮೇನ್ ಪ್ಲೇಬುಕ್ಗಳು ಮತ್ತು ಫಂಕ್ಷನ್ ಕರೆಗೆ ಮಿತವಾಗದೆ ಬೇಟಿ ಮಾಡುವುದು ನಿಜವಾದ ಕಾರ್ಯಪ್ರವಾಹಗಳಿಗೆ ನೇರವಾಗಿಸುತ್ತದೆ.
- Sider.AI ಹಾಗು ಉಪಕರಣಗಳನ್ನು ಪ್ರಯೋಗ ಸಮಯದಲ್ಲಿ ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಹೋಲಿಸಲು ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ವೇಗವಾಗಿ ನೋಡಲು ಬಳಸಿರಿ.
ಮುಂದೆ ಏನು ಮಾಡಬೇಕು
- ತಕ್ಷಣ ಬೇಕಾಗಿರುವ ಎರಡು ಪಾಠಗಳನ್ನು ಆರಿಸಿ (ಉದಾ: ಕ್ವಿಕ್ಸ್ಟಾರ್ಟ್ + ಚಂಕಿಂಗ್ ಮಾಸ್ಟರ್ ಕ್ಲಾಸ್).
- ನಿಮ್ಮ ಡಾಕ್ಯುಮೆಂಟ್ಗಳಿಂದ 50 ಪ್ರಶ್ನೆಗಳ ಗೋಲ್ಡ್ ಪ್ರಶ್ನೋತ್ತರ ಸೆಟ್ ರಚಿಸಿ.
- ಒಂದು ಬದಲಾವಣೆಯನ್ನು ಸಂತರಣ ಮಾಡಿ; ಪ್ರತಿಯೊಂದು ನಂತರ ನೆಲಬದ್ಧತೆ ಮತ್ತು ದೈರ್ಘ್ಯವನ್ನು ಅಳೆಯಿರಿ.
- ನಿಮ್ಮ ಮೌಲ್ಯಮಾಪನ ಸ್ಥಿರಗೊಂಡ ನಂತರ ಕ್ಯಾಶಿಂಗ್ ಮತ್ತು ರಕ್ಷಾ ಮಾರ್ಗಗಳೊಂದಿಗೆ ಉತ್ಪಾದನಾ ಟೆಂಪ್ಲೇಟುಗಳಿಗೆ ಸ್ಥಳಾಂತರ ಮಾಡಿ.
- ನಿಮ್ಮ ಬಾಹ್ಯ ಸ್ಥಿತಿಗತಿಯಲ್ಲಿ ಫಂಕ್ಷನ್ ಕರೆ ಮತ್ತು ಡೊಮೇನ್ ನೀತಿಗಳನ್ನು ಲೇಯರ್ ಮಾಡಿ.
ಸಾಮಾನ್ಯ ಪ್ರಶ್ನೆಗಳು
Q1: ಸಂಪೂರ್ಣ ಪ್ರಾರಂಭಿಕರಿಗೆ ಅತ್ಯುತ್ತಮ RAGFlow ಪಾಠ ಯಾವದು?
PDF ಇಂಜೆಸ್ಟಿಂಗ್, ಚಂಕಿಂಗ್, ಎಂಬೆಡ್ಡಿಂಗ್, ಸೂಚ್ಯಂಕ, ರಿಟ್ರೀವಲ್ ಮತ್ತು ಉಲ್ಲೇಖಗಳೊಂದಿಗೆ ಜನರೇಷನ್ ಮುಂತಾದ ಎಲ್ಲವನ್ನೂ ಒಳಗೊಂಡಿರುವ RAGFlow ತ್ವರಿತ ಪ್ರಾರಂಭ ಪಾಠದಿಂದ ಪ್ರಾರಂಭಿಸಿ. ಇದು ನಿಮಗೆ ವೇಗವಾಗಿ ಕೊನೆಯಿಂದ ಕೊನೆಗೆ ಅನುಭವವನ್ನು ಒದಗಿಸುತ್ತದೆ ಮತ್ತು ಆನಂತರ ಆಳವಾದ ಪಾಠಗಳಿಗೆ ಪೂರ್ವಭೂಮಿ ಸಿದ್ಧಪಡಿಸುತ್ತದೆ.
Q2: ಮೂಲಪಾಠಗಳಿಗಿಂತ RAGFlow ನಲ್ಲಿ ಖಚಿತತೆಯನ್ನು ಹೇಗೆ ಸುಧಾರಿಸಬಹುದು?
ಚಂಕಿಂಗ್ ತಂತ್ರ, ಎಂಬೆಡ್ಡಿಂಗ್ ಗುಣಮಟ್ಟ ಮತ್ತು ಮರುರ್ಯಾಂಕಿಂಗ್ ಮೇಲೆ ಗಮನಹರಿಸಿ. ಆಧುನಿಕ RAGFlow ಪಾಠಗಳು ರಕ್ಷಾ ಮಾರ್ಗಗಳು ಮತ್ತು ಮೌಲ್ಯಮಾಪನ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಸೇರಿಸಿ ಭ್ರಮೆ ಕಡಿಮೆ ಮಾಡುವುದು ಮತ್ತು ನೆಲಬದ್ಧತೆಯನ್ನು ಅಳೆಯುವುದು ತೋರಿಸುತ್ತವೆ.
Q3: ಎಂಟರ್ಪ್ರೈಸ್ ಡಾಕ್ಯುಮೆಂಟುಗಳಿಗೆ ಯಾವ ಎಂಬೆಡ್ಡಿಂಗ್ಗಳು RAGFlow ಜೊತೆ ಉತ್ತಮ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ?
ತೀವ್ರ ಸಾಮಾನ್ಯ ಮಾದರಿಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ, ಉದಾ: text-embedding-3-large, E5, ಅಥವಾ BGE, ನಂತರ ನಿಮ್ಮ ಡೇಟಾವರ ಮೇಲೆ ರಿಟ್ರೀವಲ್ ಮೆಟ್ರಿಕ್ಗಳನ್ನು ಅಳವಡಿಸಿ. ಅತ್ಯುತ್ತಮ RAGFlow ಪಾಠಗಳು ಮಾದರಿಗಳು ಮತ್ತು ವೆಕ್ಟರ್ ಸ್ಟೋರ್ಗಳಿಗೆ A/B ಪರೀಕ್ಷೆಗಳನ್ನು ಶಿಫಾರಸು ಮಾಡುತ್ತವೆ.
Q4: RAGFlow ಸಂರಚಿತ ಡೇಟಾ SQL ಮತ್ತು ಡಾಕ್ಯುಮೆಂಟುಗಳ ಜೊತೆಗೆ ನಿರ್ವಹಿಸಬಹುದುವೇ?
ಹೌದು. RAGFlow ಸಂಯೋಜಿತ ರಿಟ್ರೀವಲ್ ಪಾಠಗಳು ಪ್ರಮಾಣಾತ್ಮಕ ಪ್ರಶ್ನೆಗಳನ್ನು ಫಂಕ್ಷನ್ ಕರೆ ಮೂಲಕ SQL ಗೆ ಮಾರ್ಗನಿರ್ದೇಶಿಸಿ, ಅಸ್ಥಿರ ಡಾಕ್ಯುಮೆಂಟುಗಳಿಗಾಗಿ ಸೆಮಾಂಟಿಕ್ ರಿಟ್ರೀವಲ್ ಬಳಕೆಮಾಡುವುದನ್ನು ತೋರಿಸುತ್ತವೆ; ನಂತರ ಜನರೇಷನ್ ಸಮಯದಲ್ಲಿ ಫಲಿತಾಂಶಗಳನ್ನು ಒಗ್ಗೂಡಿಸುತ್ತವೆ.
Q5: ಲೈವ್ ಪಡಿಸುವ ಮೊದಲು RAGFlow ಪೈಪ್ಲೈನ್ ಅನ್ನು ಹೇಗೆ ಮೌಲ್ಯಮಾಪನ ಮಾಡಬೇಕು?
ಮೌಲ್ಯಮಾಪನ ಕೇಂದ್ರೀಕೃತ RAGFlow ಪಾಠಗಳನ್ನು ಅನುಸರಿಸಿ: ಮೂಲಗಳೊಂದಿಗೆ ಗೋಲ್ಡ್ ಪ್ರಶ್ನೆ - ಉತ್ತರ ಸೆಟ್ ರಚಿಸಿ, ಬದಲಾವಣೆಗಳ ನಂತರ ಸ್ವಯಂಚಾಲಿತ ಪರೀಕ್ಷೆಗಳನ್ನು ನಡೆಸಿ ಮತ್ತು ನೆಲಬದ್ಧತೆ, ಉಲ್ಲೇಖ ವ್ಯಾಪ್ತಿ, ದೈರ್ಘ್ಯ ಮತ್ತು ಸಹಾಯಕತೆಯನ್ನು ಅನುಸರಿಸಿ. ಮೆಟ್ರಿಕ್ಗಳು ಸ್ಥಿರವಾಗುವ ತನಕ ನಿಯೋಜನೆ ಮಾಡಬೇಡಿ.