What is the difference between RAG and fine-tuning AI agents?

RAG retrieves fresh, external knowledge at runtime, while fine-tuning AI agents adjusts model weights to learn your style, rules, and domain. Many teams combine both: use RAG for up-to-date facts and fine-tuning for consistent behavior and formatting.

How much custom data do I need to fine-tune AI agents effectively?

Start with 3–20k high-quality examples—well-labeled, diverse, and balanced. Quality beats quantity; include edge cases, tool-use traces, and safety pairs for robust performance.

When should I fine-tune versus just using prompts?

Use prompting for quick prototypes and simple tasks. Fine-tuning AI agents is better when you need strict formatting, domain-specific language, repeatable workflows, and lower variance across users.

Will fine-tuning AI agents increase hallucinations?

It can if your custom data is noisy or contradictory. Clean datasets, retrieval grounding, and safety exemplars typically reduce hallucinations and improve trust.

What’s the cheapest way to fine-tune with custom data?

Use parameter-efficient fine-tuning (PEFT) like LoRA on a solid base model, combined with RAG and caching. This keeps training costs low while delivering strong domain adaptation.

AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡುವುದು: ಕಸ್ಟಮ್ ಡೇಟಾದೊಂದಿಗೆ ನಿಮ್ಮದನ್ನು ಹೇಗೆ ಸ್ಮಾರ್ಟ್ ಆಗಿ ಮಾಡುವುದು

ನುಸುಗುವ ಲಾಭ: ನಿಮ್ಮ ಡೇಟಾ ಬಳಸಿ AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಬಾರಿಗೆ ಟ್ಯೂನ್ ಮಾಡುವುದು ಏಕೆ ಗೆಲ್ಲುತ್ತದೆ

ಇದೋ ಒಂದು ವಾಂತಾರ: ವ್ಯಾಪಕತೆಯಲ್ಲಿ ಅದ್ಭುತ ಪ್ರದರ್ಶನ ನೀಡುವ ಸಾಮಾನ್ಯ AI ಮಾದರಿ, ನಿಮ್ಮ ವ್ಯವಹಾರದ ಪ್ರಮುಖ ವಿವರಗಳ ಮೇಲೆ (ನಿಮ್ಮ ಶೈಲಿ ಮಾರ್ಗದರ್ಶಿ, ಉತ್ಪನ್ನ ಸೂಚಿ, ಕೆಲಸದ ಹರಿವು, ಅನುಪಾಲನಾ ನಿಯಮಗಳು) ಕೆಲವೊಮ್ಮೆ ಅटकಿಕೊಳ್ಳುತ್ತದೆ. ಕಸ್ಟಮ್ ಡೇಟಾ ಮೂಲಕ AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಬಾರಿಗೆ ಟ್ಯೂನ್ ಮಾಡುವುದು ಆ ಕೊರತೆಯನ್ನು ತುಂಬುತ್ತದೆ. ಇದು ನಿಮ್ಮ ಸಂಸ್ಥೆಯ ಜ್ಞಾನವನ್ನು ಒಂದು ಮಾದರಿಯಲ್ಲಿ ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸುತ್ತದೆ, ಅದು ನಿಪುಣ ಅನಾಹುತವಲ್ಲದೇ ತರಬೇತುದಾರ ಸಹೋದ್ಯೋಗಿಯಂತೆ ಅನಿಸುತ್ತದೆ.

ಈ ಪ್ರಾಯೋಗಿಕ, ಪರಿಹಾರಮುಖಿ ಮಾರ್ಗದರ್ಶಿಯಲ್ಲಿ, ನಾವು AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಹೇಗೆ ಬಾರಿಗೆ ಟ್ಯೂನ್ ಮಾಡಬೇಕೆಂದು, ಯಾವಾಗ ಮಾಡಬೇಕು ಮತ್ತು ಯಾರಾಗರದ (ಮಾಡಬಾರದು), ಯಾವುದಾದ ಡೇಟಾವನ್ನು ತಯಾರಿಸಬೇಕು, ಪ್ರಾಮುಖ್ಯತೆಯ ಆರ್ಕಿಟೆಕ್ಟ್‌ಚರ್‌ಗಳು, ಹಾಗು ಉತ್ಪಾದನೆಯಲ್ಲಿನ ಮಾದರಿಗಳನ್ನು ಹೇಗೆ ಜಾರಿಗೆ ತಳ್ಳಿ, ಅವಲೋಕನ ಮಾಡಬೇಕೆಂದು ವಿವರಿಸುತ್ತೇವೆ. ನೀವು ಬೇಕಾದ ಅಂಶಗಳಿಗೆ ಸುಲಭವಾಗಿ ಹೋಗಲು ನಾವು ಪ್ರಶ್ನಾ ಆಧಾರಿತ ರಚನೆಯನ್ನು ಬಳಸುತ್ತೇವೆ.

ಇಲ್ಲಿ ಸಹಜವಾಗಿ ಕಾಣಿಸುವ ಕೀವರ್ಡ್‌ಗಳು: ಬಾರಿಗೆ ಟ್ಯೂನಿಂಗ್ AI ಏಜೆಂಟ್‌ಗಳು, ಕಸ್ಟಮ್ ಡೇಟಾ, ರಿಟ್ರೀವಲ್-ಆಗ್ಮೆಂಟೆಡ್ ಜನರೇಶನ್ (RAG), ಸೂಚನಾ ಟ್ಯೂನಿಂಗ್, ಪ್ಯಾರಾಮೀಟರ್-ಎಫಿಷಿಯಂಟ್ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ (PEFT), LoRA, ಅಪ್ರಮಾಣಿ ಮತ್ತು ಡಿಪ್ಲಾಯ್‌ಮೆಂಟ್. ಧ್ಯೇಯವೆಂದರೆ ನಿಮ್ಮ AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಕಸ್ಟಮ್ ಡೇಟಾ ಬಳಸಿ ಹೆಚ್ಚು ಬುದ್ಧಿವಂತಿಕೆಯಿಂದ, ಭರವಸೆಯುತ, ಸುರಕ್ಷಿತ ಮತ್ತು ವೆಚ್ಚ-ಕಾರ್ಯಕ್ಷಮವಾಗಿ ತಯಾರಿಸುವುದು.

AI ಏಜೆಂಟ್‌ಗಳಿಗಾಗಿ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಎಂದರೆ ಏನು?

AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಬಾರಿಗೆ ಟ್ಯೂನ್ ಮಾಡುವುದು ಎಂದರೆ, ನಿಮ್ಮ ಡೋಮೈನ್‌ಗೆ ಅನುಗುಣವಾಗಿ ನಿಮ್ಮ ಕಸ್ಟಮ್ ಡೇಟಾ (ಪ್ರಾಂಪ್ಟ್‌ಗಳು ಮತ್ತು ಆದರ್ಶ ಪ್ರತಿಕ್ರಿಯೆಗಳ ಉದಾಹರಣೆಗಳು, ಟೂಲ್ ಬಳಕೆ ಟ್ರೇಸ್‌ಗಳು, ಕೆಲಸದ ಹರಿವುಗಳು, ಅಥವಾ ನಿರ್ಣಯ ನಿಯಮಗಳು) ಬಳಸಿ ಮೂಲ ಮಾದರಿಯನ್ನು ರೂಪಾಂತರಿಸುವುದು. ಶೂನ್ಯದಿಂದ AI ಮಾದರಿ ನಿರ್ಮಿಸುವ ಬದಲು, ನೀವು ಬಲವಾದ ಹಿನ್ನೆಲೆ (ಉದಾಹರಣೆಗೆ LLM ಅಥವಾ ಬಹು ಏಜೆಂಟ್ ಫ್ರೇಮ್ವರ್ಕ್) ಒಳಗೊಂಡು, ಅದನ್ನು ನಿಮ್ಮ ಶೈಲಿ, ಸಮರ್ಥನೆ, ನೀತಿ ಮತ್ತು ಕಾರ್ಯಗಳನ್ನು ಕಲಿಯುವಂತೆ ವಿಶೇಷಗೊಳಿಸುತ್ತೀರಿ.

ಸೂಚನಾ ಟ್ಯೂನಿಂಗ್: ಏಜೆಂಟ್‌ಗೆ ನಿಮ್ಮ ಸೂಚನೆಗಳನ್ನು ಹೇಗೆ ಅನುಸರಿಸಬೇಕು ಮತ್ತು ಹೊರಹೊಮ್ಮುವ ನಮೂನೆಯನ್ನು ನಿಮ್ಮ ಸಂಸ್ಥೆಯ ಅಗತ್ಯದಂತೆ ನಿಯಮಿತವಾಗಿ ನೀಡಬೇಕು ಎನ್ನುವುದನ್ನು ಕಲಿಸುವುದು.

ಡೀಮೇನ್ ಅಡಾಪ್ಟೇಶನ್: ಶಬ್ದಕೋಶ, ಉತ್ಪನ್ನ ಜ್ಞಾನ ಮತ್ತು ಅನುಪಾಲನಾ ನಿಯಮಗಳನ್ನು ಒಳಗೊಂಡಾಗಿಸುವುದು.

ಹಕ್ಕಿನ ಅನುಗುಣತೆ: ಮಾದರಿಯನ್ನು ಸುರಕ್ಷಿತ ಮತ್ತು ಸಹಾಯಕ ಕಾರ್ಯಗಳಿಗೆ ಪ್ರೋತ್ಸಾಹಿಸುವುದು.

ಫലം: ಹೆಚ್ಚು ಸರಿಯಾದ ಉತ್ತರಗಳು, ಡೋಮೈನ್ ವಿಷಯ ಪ್ರಶ್ನೆಗಳಲ್ಲಿ ಕನಿಷ್ಠ ಹುಲಸುವಿಕೆ, ವೇಗದ ಕಾರ್ಯ ನಿರ್ವಹಣೆ ಮತ್ತು ಬಳಕೆದಾರರಿಂದ ಹೆಚ್ಚಿನ ನಂಬಿಕೆ.

ನೀವು ನಿಜವಾಗಿಯೂ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಅಗತ್ಯವಿದೆಯೇ ಅಥವಾ RAG ಸಾಕಾಗುತ್ತದೆಯೇ?

AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡುವ ಮುನ್ನ ತ್ವರಿತ ನಿರ್ಧಾರ ಮರವನ್ನು ಅನುಸರಿಸಿ:

ನಿಮ್ಮ ಜ್ಞಾನ తరచಾ ಬದಲಾಗುತ್ತಿದೆಯೇ (ಮೌಲ್ಯ ಅಮೂಲ್ಯ, ಇನ್ವೆಂಟರಿ, ನೀತಿಗಳು)? RAG ನಿಂದ ಪ್ರಾರಂಭಿಸಿ. ಡಾಕ್‌ಗಳನ್ನು ಸೂಚಿಕರಿಸಿ; ಏಜೆಂಟ್_runtime ನಲ್ಲಿ ಹೊಸ ವಿಷಯ ಪಡೆದುಕೊಳ್ಳುತ್ತದೆ.

ನಿಮ್ಮ ಹೊರಹೊಮ್ಮುವ ವಿವರಗಳು ಕಠಿಣ ಮಾದರಿಯಲ್ಲಿ ಅಥವಾ ಬಹುಹಂತದ ಕಾರ್ಯ ಸಂಚಲನಗಳನ್ನು ಅಗತ್ಯವಿದ್ದರೆ: ಸೂಚನಾ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಲಾಭದಾಯಕ.

ನೀವು ಆಳವಾದ ಡೋಮೈನ್ ಭಾಷಾ ಅರ್ಥಮಾಡಿಕೆ (ಮೆಡಿಕಲ್, ಕಾನೂನು, ಆಂತರಿಕ ಸಂಕ್ಷಿಪ್ತಗಳು) ಬೇಕಾದರೆ: ಕಸ್ಟಮ್ ಡೇಟಾ ಬಳಸಿ AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಬಾರಿಗೆ ಟ್ಯೂನ್ ಮಾಡುವುದು ಅರ್ಥಮಾಡಿಕೆಗೆ ಉತ್ತೇಜನ ನೀಡುತ್ತದೆ.

ನೀವು ವೆಚ್ಚ-ಸಂವೇದಿ ಅಥವಾ ಕಾಣೊತ್ತಿನಲ್ಲಿ ಆರಂಭಿಕ ಸ್ಥಿತಿಯಲ್ಲಿದ್ದರೆ: ಮೊದಲು RAG, ನಂತರ ಡೇಟಾ ಗುಣಮಟ್ಟ ಸಾಬೀತಾಗ್ ಮೇಳೆಯೂ ಬಾರಿಗೆ ಟ್ಯೂನಿಂಗ್ ಮಾಡಿ.

ಪ್ರೊ ಸಲಹೆ: ಅನೇಕ ಉತ್ಪಾದನಾ ವ್ಯವಸ್ಥೆಗಳು ಇಬ್ಬರೂ ಮಿಶ್ರಣ ಮಾಡುತ್ತವೆ—ಹಳೇತನಕ್ಕಾಗಿ RAG, ಹಾಗೂ ವರ್ತನೆ/ಶೈಲಿಗಾಗಿ ಫೈನ್-ಟ್ಯೂನಿಂಗ್.

ಏನು ಡೇಟಾ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಮೂಲಕ AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಹೆಚ್ಚು ಬುದ್ಧಿವಂತ ಮಾಡುತ್ತದೆ?

ನಾಲ್ಕು ವಿಭಾಗಗಳಲ್ಲಿ ಯೋಚಿಸಿ. ಗುಣಮಟ್ಟದ ಡೇಟಾ ಪ್ರಮಾಣಕ್ಕಿಂತ ಮೇಲು:

ಕಾರ್ಯ ಪ್ರದರ್ಶನಗಳು (ಸ್ವರ್ಣ ಉದಾಹರಣೆಗಳು)

ವಾಸ್ತವಿಕ ಸಂಭಾಷಣೆಗಳು, ಟಿಕೇಟುಗಳು, ಇಮೇಲುಗಳು, ಚಾಟ್‌ಗಳು ಆದರ್ಶ ಪ್ರತಿಕ್ರಿಯೆಗಳಿಂದ ಅಂಕಿತಗೊಂಡವು.

ನೀವು ಬಯಸುವ ಶಬ್ದ, ಸ್ವರೂಪ ಮತ್ತು ನಿರ್ಣಯ ತರ್ಕವನ್ನು ತೋರಿಸುವ ಕೆಲವು ಶಾಟ್ ಉದಾಹರಣೆಗಳು.

ಉಪಕರಣ ಬಳಕೆ ರೆಕಾರ್ಡುಗಳು

ಏಜೆಂಟ್ APIಗಳು, CRM, ಶೋಧ, ಕ್ಯಾಲ್ಕ್ಯುಲೇಟರ್‌ಗಳು ಅಥವಾ ಕಾರ್ಯದ ಹರಿವು ಸ್ವಯಂಚಾಲನೆಗೆ ಕರೆ ಮಾಡುವ ಲಾಗ್‌ಗಳು.

ಸ್ಥಿತಿ, ಪರಿಮಾಣ ಮತ್ತು ಯಶಸ್ವಿ/ನಿಷಫಲ ಫಲಿತಾಂಶಗಳನ್ನು ಸೇರಿಸಿ.

ಡೋಮೈನ್ ಡಾಕ್ಯುಮೆಂಟ್ಗಳು

ಹ್ಯಾಂಡ್‌ಬುಕ್‌ಗಳು, SOPಗಳು, ಶೈಲಿ ಮಾರ್ಗದರ್ಶಿಗಳು, ಉತ್ಪನ್ನ ಸೂಚಿಗಳು, ನೀತಿ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳು, FAQಗಳು.

ಭೂಮಿಕಾ ಕಲಿಸುವುದಕ್ಕಾಗಿ ಪ್ರಶ್ನೆ-ಆದರ್ಶ ಉತ್ತರ (QA ಜೋಡಿಗಳು) ಜೊತೆಗೆ ಪ್ಯಾರಾಗ್ರಾಫ್‌ಗಳನ್ನು ಜೋಡಿಸಿ.

ಎಡ್ಜ್ ಕೇಸ್‌ಗಳು ಮತ್ತು ತಪ್ಪುಗಳು

ತ_UNITಿ ಆರ್ಥವಲ್ಲದ ಪ್ರಾಂಪ್ಟ್‌ಗಳು, ವಿರೋಧಾತ್ಮಕ ಪದಗಳ ಫ್ರೇಸಿಂಗ್, ಸೂಕ್ಷ್ಮ ನೀತಿ ವೈಷಮ್ಯಗಳನ್ನು ಸೇರಿಸಿಕೊಂಡಿರುವ ಗೆಲುವು ಮೆದುಳುಗಳನ್ನು ಸಂಗ್ರಹಿಸಿ.

ಅವುಗಳಿಗೆ ಸರಿಯಾದ ಪ್ರತಿಕ್ರಿಯೆಗಳು ಅಥವಾ ಸುರಕ್ಷಿತ ಬದಲಿ ಮಾರ್ಗಗಳನ್ನು ಲೇಬಲ್ ಮಾಡಿ.

ಡೇಟಾ ಸ್ವಚ್ಛತೆ ಪರಿಶೀಲನಾ ಪಟ್ಟಿಗಳು:

ಸಂಭವವಿದ್ದರೆ PII ಅನ್ನು ಅರೆಗಳು ಹಾಕಿರಿ; ಕನಿಷ್ಟ-ಹಕ್ಕು ಪ್ರವೇಶ ನಿಯಮ ಅನುಸರಿಸಿ.

ಒಂದು ರೀತಿಯ ಉದಾಹರಣೆಗಳ ಪುನರಾವೃತ್ತಿಯನ್ನು ತಪ್ಪಿಸಿ ಅತಿಕೋಷ್ಠಕತೆಯನ್ನು ತಪ್ಪಿಸಲು.

ವರ್ಗಗಳನ್ನು ಸಮತೋಲನ ಮಾಡಿ (ಒಂದು ಉತ್ಪನ್ನ ಅಥವಾ ನೀತಿಯು ಪ್ರಭುತ್ವ ವಹಿಸಬಾರದು).

ರೂಪರೇಖೆಯನ್ನು ಸಾಮರಸ್ಯಗೊಳಿಸಿ; ಶ್ರೇಯೋಭಿವೃದ್ಧಿ ಮತ್ತು ಮೆಟಾಡೇಟಾವನ್ನು ಒಂದೇ ರೀತಿಯಲ್ಲಿ ಇಡಿ.

ನಿಮ್ಮ ತರಬೇತಿ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಹೇಗೆ ರಚಿಸಬೇಕು

ಬಹುಭಾಷಾ ಏಜೆಂಟ್‌ಗಳಿಗಾಗಿ, JSONL ಉತ್ತಮವಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ:

ಸೂಪರ್ವೈಸ್ಡ್ ಫೈನ್‑ಟ್ಯೂನಿಂಗ್ (SFT) ಸ್ವರೂಪ: {"instruction": "...", "input": "...", "output": "...", "metadata": {"policy": "...", "intent": "..."}}

ಫಂಕ್ಷನ್ ಕರೆಗಳೊಂದಿಗೆ ಉಪಕರಣ ಬಳಕೆ ಸ್ವರೂಪ: {"messages": [ {"role": "user", "content": "4819 ಇತ್ತೀಚಿನ ಆರ್ಡರ್ ಸ್ಥಿತಿಯನ್ನು ಕಾಣಿಸಿ."}, {"role": "assistant", "tool_call": {"name": "getOrderStatus", "arguments": {"order_id": 4819}}}, {"role": "tool", "content": "{"status": "ಡоставлено", "eta": "2025-11-02"}"}, {"role": "assistant", "content": "ಆರ್ಡರ್ 4819 ಡоставлено ಆಗಿದೆ. ETA: 2025-11-02."} ], "success": true}

ಸುರಕ್ಷತಾ ಹೊಂದಾಣಿಕೆಯ ಜೋಡಿಗಳು: {"prompt": "ನಾನು 2FA ಅನ್ನು ತಪ್ಪಿಸಲು ಬಳಿಯಬಹುದೇ?", "ideal": "ಅದರ ಸಹಾಯ ನಾನು ನೀಡಲು ಸಾಧ್ಯವಿಲ್ಲ. ನಿಮ್ಮ ಖಾತೆಯನ್ನು ಸುರಕ್ಷಿತವಾಗಿ ರಿಸೆಟ್ ಮಾಡುವ ವಿಧಾನ ಇಲ್ಲಿದೆ..."}

ಆರಂಭಿಸಲು 3–20 ಸಾವಿರ ಗುಣಮಟ್ಟದ ಉದಾಹರಣೆಗಳನ್ನು ಗುರಿ ನಿಗದಿ ಮಾಡಿ. ಹೆಚ್ಚು ಸದಾ ಉತ್ತಮವಲ್ಲ—ಸೂಚನೆಯ ಸಾಂದ್ರತೆ ತೂಕದಷ್ಟು ಮುಖ್ಯ.

ನೀವು ಯಾವ ತರಬೇತಿ ವಿಧಾನವನ್ನು ಉಪಯೋಗಿಸಬೇಕು?

ನಿಮ್ಮ ಗುರಿಯನ್ನು ಸಾಧಿಸುವ ಅತ್ಯಂತ ಸಣ್ಣ ಸ್ಪರ್ಶವನ್ನು ಆಯ್ಕೆಮಾಡಿ:

RAG ಮಾತ್ರ: ಮಾಹಿತಿ ವಾರಂವಾರ ಬದಲಾಗುತ್ತದೆಯಾದರೆ, ಉನ್ನತ-ಗುಣಮಟ್ಟದ ರಿಟ್ರೀವಲ್ ಪೈಪ್‌ಲೈನ್ ನಿರ್ಮಿಸಿ; ಎಂಬೆಡಿಂಗ್ಸ್ ಕ್ಯಾಶ್ ಮಾಡಿ; ಮೌಲ್ಯಮಾಪನ ಸೇರಿಸಿ.

ಸೂಚನಾ SFT: ಸ್ವರೂಪ, ಶೈಲಿ ಮತ್ತು ಸತತ ಕಾರ್ಯಗಳನ್ನು ಸಾಧಿಸಲು ತಕ್ಕದು.

PEFT/LoRA: ಪ್ಯಾರಾಮೀಟರ್-ಮುಕ್ತಾಯಫಲಿತಾಂಶ ಫೈನ್-ಟ್ಯೂನಿಂಗ್, ಸಣ್ಣ ಅಡಾಪ್ಟರ್ ಲೇಯರ್‌ಗಳನ್ನು ಬದಲಾಯಿಸುತ್ತದೆ; ಚಿಪ್ಪೆ, ವೇಗವಂತ, ಡೋಮೈನ್ ಅನುವಾಗಿ ಶಕ್ತಿಶಾಲಿ.

ಪ್ರಿಫಿಕ್ಸ್/ಪ್ರಾಂಪ್ಟ್ ಟ್ಯೂನಿಂಗ್: ಇನ್ನೂ ಸಣ್ಣದು; ಕಾರ್ಯ ವೆಕ್ಟರ್‌ಗಳನ್ನು ಮೂಲ ತೂಕಗಳನ್ನು ಸ್ಪರ್ಶಿಸದೆ ಸಂಗ್ರಹಿಸುತ್ತದೆ.

RLHF/RLAIF: ಪ್ರತಿಕ್ರಿಯೆಗಳಿಗೆ (ಉದಾ: ಸಹಾಯಕತೆ, ಸಂಕ್ಷಿಪ್ತತೆ) ಆಪ್ಟಿಮೈಸ್ ಮಾಡುತ್ತದೆ. ಜಾಗರೂಕ ಬಹು ಫಲಿತಾಂಶ ವಿನ್ಯಾಸ ಮತ್ತು ಗಾರ್ಡ್‌ರೈಲ್‌ಗಳು ಅಗತ್ಯ.

ಮಿಶ್ರ ಸಂಚಯ ತಜ್ಞರು ಅಥವಾ ರೌಟಿಂಗ್: ವಿನಂತಿಗಳನ್ನು ವಿಶೇಷಗೊಳಿಸಿದ ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಿದ ತಜ್ಞರ ಕಡೆಗೆ ಕಳುಹಿಸಲು; ವಿಶ್ವಾಸಾರ್ಹತೆ ಮತ್ತು ಲೇಟೆನ್ಸಿ ನಿಯಂತ್ರಣ ಹೆಚ್ಚಿಸುತ್ತದೆ.

ಸಾಧಾರಣ ನಿಯಮ: ಮೊದಲು PEFT (LoRA) ಅನ್ನು SFT ಬದಿಯಲ್ಲಿ ಪ್ರಾರಂಭಿಸಿ. ಹಳೇತನಕ್ಕಾಗಿ RAG ಸೇರಿಸಿ. ದೃಢ ಸೋಪಾನ ಡೇಟಾ ಸಿಗಿದ ಮೇಲೆ ಮಾತ್ರ ವರ್ತನೆಗಾಗಿ RL ಸೇರಿಸಿ.

AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಲು ಹಂತ ಹಂತದ ಕೆಲಸದ ಪಾಠಪುಸ್ತಕ

ಈ ಪ್ರಾಯೋಗಿಕ ಕ್ರಮಂತೆ ಅನುಸರಿಸಿ:

ಸಫಲತೆ ವ್ಯಾಖ್ಯാനം ಮಾಡಿ

3–5 KPIಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಿಕೊಳ್ಳಿ: ಹೊರಹೊಮ್ಮುವ ನಿಖರತೆ, ಮೊದಲನೆ ಪರಿಹಾರ ಪ್ರಮಾಣಿ, ಪರಿಹಾರಕ್ಕೆ ತೆಗೆದುಕೊಳ್ಳುವ ಸಮಯ, ನೀತಿ ಅನುಸರಣೆ, ಹುಲಸುವಿಕೆ ಪ್ರಮಾಣ.

ಕ್ಯಾನೋನಿಕಲ್ ಪ್ರಾಂಪ್ಟ್‌ಗಳೊಂದಿಗೆ ಅಂಗೀಕಾರ ಪರೀಕ್ಷೆಗಳನ್ನು ಬರೆದು.

ಡೇಟಾ ಸಂಗ್ರಹಣೆ ಮತ್ತು ಲೇಬಲಿಂಗ್

ಲಾಗ್‌ಗಳು, ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳು ಮತ್ತು ಉದಾಹರಣೆಗಳನ್ನು ಸಂಗ್ರಹಿಸಿ; ಸಂವೇದನಶೀಲ ವಿಷಯವನ್ನು ತೆಗೆದುಹಾಕಿ ಅಥವಾ ಮುಚ್ಚಿರಿ.

ತೂಕಹೀನ ಲೇಬಲಿಂಗ್ ಮಾರ್ಗದರ್ಶಿಗಳನ್ನು ಬಳಸಿ; ವಿಷಯ ಪರಿಣಿತರ ಮೂಲಕ ಮಾದರಿ ವಿಮರ್ಶೆ ಮಾಡಿ.

ಬೇಸ್ಲೈನ್ ಮತ್ತು RAG ಹೊಂದಾಣಿಕೆ

ನಿಮ್ಮ ಪರೀಕ್ಷಾ ಸೆಟ್‌ನಲ್ಲಿ ಚೆನ್ನಾಗಿರುವ ಮೂಲ ಮಾದರಿಯನ್ನು RAG ಇಲ್ಲದೆ ಮತ್ತು ಇದ್ದಂತೆ ಮೌಲ್ಯಮಾಪನೆ ಮಾಡಿ.

ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಲಾಭವನ್ನು ಅಳೆಯಲು ಬೇಸ್ಲೈನ್ ಫಲಿತಾಂಶಗಳನ್ನು ಉಳಿಸಿ.

SFT/PEFT ತರಬೇತಿ

ಸಣ್ಣದು ಪ್ರಾರಂಭಿಸಿ (1-2 ಕಾಲಘಟ್ಟ). ಮಾನ್ಯತೆ ನಷ್ಟ ಮತ್ತು ಕಾರ್ಯ ಅಂಕಗಳನ್ನು ಗಮನಿಸಿ.

ಅಡಾಪ್ಟರ್‌ಗಳನ್ನು (LoRA) ಸಂರಕ್ಷಣಾತ್ಮಕ ರ್ಯಾಂಕ್‌ನೊಂದಿಗೆ ಬಳಸಿ; ಅತಿಕೋಷ್ಠಕತೆಯನ್ನು ತಪ್ಪಿಸಿ.

ಮುಚ್ಚಿದ ಲೂಪ್ ಮೌಲ್ಯಮಾಪನೆ

ಆಫ್‌ಲೈನ್: ನಿಖರ ಸರಿಹೊಂದಿಕೆ, ಸ್ವರೂಪಕ್ಕಾಗಿ BLEU/ROUGE, ಡೋಮೈನ್-ನಿರ್ದಿಷ್ಟ ಮೇಳದ ಸೂಚ್ಯಾಂಕಗಳು.

ಆನ್‌ಲೈನ್: ಬೇಸ್ಲೈನ್ ವಿರುದ್ಧ A/B ಚाचಣೆ; ಬಳಕೆದಾರ ತೃಪ್ತಿ, ವಿರೋಧ ಪ್ರಮಾಣ ಅಳೆಯಿರಿ.

ಸುರಕ್ಷತೆ ಮತ್ತು ನೀತಿ ಗಾರ್ಡ್‌ರೈಲ್‌ಗಳು

ನಿರಾಕರಣೆ ಟೆಂಪ್ಲೇಟುಗಳು ಮತ್ತು ನಡೆಯುವ ಲಾಜಿಕ್ ಸೇರಿಸಿ.

Runtime ನಲ್ಲಿ PII, ಹಾನಿಕರ ವಿಷಯ ಮತ್ತು ವ್ಯಾಪ್ತಿನಲ್ಲದ ವಿಷಯಗಳ ಫಿಲ್ಟರ್‌ಗಳನ್ನು ಹೊಂದಿಸಿ.

ಡಿಪ್ಲಾಯ್‌ಮೆಂಟ್ ಮತ್ತು ಮಾನಿಟರಿಂಗ್

ಕನೇರಿ ಬಿಡುಗಡೆ; ವಿಳಂಬ, ವೆಚ್ಚ, ಗುಣಮಟ್ಟ ಬದಲಾವಣೆ ನೋಡಿಕೊಳ್ಳಿ.

ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಲಾಗ್ ಮಾಡಿ; ವಿಫಲತೆಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಮರುತರಬೇತಿ ಸಾಲಿಗೆ ಕಳುಹಿಸಿ.

ಪುನರಾವೃತ್ತ ಸಮಯ

ಹೊಸ ಎಡ್ಜ್ ಕೇಸ್‌ಗಳಿಂದ ಪ್ರತಿ ಎರಡು ವಾರಗಳ ಅಥವಾ ಮಾಸಿಕ ಶೆಡ್ಯೂಲ್‌ನಲ್ಲಿ ಮರುತರಬೇತಿ ಮಾಡಿ.

ಸ್ವರೂಪಗೊಳಿಸಿದ ಮಾದರಿ ಸಂಗ್ರಹಸ್ಥಳವನ್ನು ಇಡಿ; ಅಗತ್ಯವಿದ್ದರೆ ತ್ವರಿತವಾಗಿ ಹಿಂದಕ್ಕೆ ಹಿಂಡಿರಿ.

ನೀವು ಫೈನ್-ಟ್ಯೂನ್ಡ್ AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಹೇಗೆ ಅಂಶಮಾಪನೆ ಮಾಡಬೇಕು?

ಅಂಶಮಾಪನೆ ಬಹುಮಾತ್ರೆಯಂತೆ ಮಾಡಿರಿ:

ರೂಪರೇಖೆಯ ನಿಷ್ಠತೆ: ಏಜೆಂಟ್ ಕಟ್ಟುನಿಟ್ಟಾದ ಸ್ಕೀಮಾ ಅಥವಾ ಮಾರ್ಕ್ಡೌನ್ ಟೇಬಲ್ಗಳನ್ನು ಅನುಸರಿಸುತ್ತಿದೆಯೇ? ನಿಯಮಾಧಾರಿತ ಪರಿಶೋಧಕರ ಬಳಸಿ.

ತದರೋಳಾದ ಅರ್ಥದ்மை: ರಿಟ್ರೀವಲ್-ಆಧಾರಿತ ಸರಿಯಿತನ ಪರಿಶೀಲನೆ (ಉಲ್ಲೇಖಿಸಿದ ಪ್ಯಾರಾಗ್ರಾಫ್ ಹೊಂದಿದೆಯೇ?) ಬಳಸಿ.

ಕಾರ್ಯ ಯಶಸ್ಸು ದರ: ಕಾರ್ಯ ಪ್ರಕ್ರಿಯೆಗೆ ಪಾಸ್/ಫೇಲ್ ವ್ಯಾಖ್ಯಾನಿಸು (ಉದಾ., ಮಾನ್ಯ ಟಿಕೇಟನ್ನು ಸೃಷ್ಟಿಸಿ ಮತ್ತು CRM ಟಿಪ್ಪಣಿಗಳನ್ನು ನವೀನಗೊಳಿಸುತ್ತದೆ).

ಸುರಕ್ಷತೆ ಅನುಸರಣೆ: ನಿರಾಕರಣೆ ನಿಖರತೆ ಮತ್ತು ಅಸತ್ಯ ಧನಾತ್ಮಕಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಿ.

ವೆಚ್ಚ ಮತ್ತು ವಿಳಂಬ: ಬೇಸ್ಲೈನ್ ಜೊತೆಗೆ ಹೋಲಿಸಿ; ಟೋಕನ್ ಪ್ರತಿ ಕಾರ್ಯವನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಿ; ಪಠ್ಯ ನಿರಂತರವಾದ ಹರಿವುಗಳಿಗೆ ಕ್ಯಾಶಿಂಗ್ ಮಾಡಿ.

ಸಮತೋಲನ.eval ಸೆಟ್ ರಚಿಸಿ:

ಕೋರ್ ಕಾರ್ಯಗಳು (60%)

ಎಡ್ಜ್ ಕೇಸ್‌ಗಳು ಮತ್ತು ವಿರೋಧಾತ್ಮಕ ಪ್ರಾಂಪ್ಟ್‌ಗಳು (20%)

ವ್ಯಾಪ್ತಿಗೆ ಹೊರಗಿನ ಅಥವಾ ತಂತ್ರಪ್ರಶ್ನೆಗಳು (10%)

ದೀರ್ಘ-ಟೇಲ್, ಕಡಿಮೆ-ಆವರ್ತನೆ ಕಾರ್ಯಗಳು (10%)

ಆರ್ಕಿಟೆಕ್ಟ್‌ಚರ್ ಆಯ್ಕೆಗೊಳ್ಳುವ ಪ್ರಾಮುಖ್ಯತೆ

ಬೇಸ್ಮಾಡೆಲ್ ಗಾತ್ರ: ದೊಡ್ಡದು ಸದಾ ಉತ್ತಮವಲ್ಲ. ಮಧ್ಯಮ ಮಾದರಿಗಳು ಕಸ್ಟಮ್ ಡೇಟಾ ಮೂಲಕ ಟ್ಯೂನ್ ಮಾಡಿಸಿಕೊಂಡಾಗ ನಿಮ್ಮ ವಿಶೇಷಣದಲ್ಲಿ ದೊಡ್ಡ ಸಾಮಾನ್ಯ ಮಾದರಿಗಳನ್ನು ಮೀರಿಗೆ ಅಧೀರಿಸಿ, ವಿಳಂಬ ಮತ್ತು ವೆಚ್ಚ ಕಡಿಮೆ ಮಾಡುತ್ತದೆ.

ಸಂದರ್ಭದ দৈರ್ಘ್ಯತೆ ಮತ್ತು RAG: ದೀರ್ಘ ಕಂಟೆಕ್ಸ್ಟ್ ಸಹಾಯಕ ಆದರೆ ವೆಚ್ಚ ಹೆಚ್ಚಿಸುತ್ತದೆ. ಉತ್ತಮ ಗುಣಮಟ್ಟದ RAG ಪುನರ್-ರ್ಯಾಂಕಿಂಗ್ ಅಂದಿನಿಂದ ಉಗ್ರ ಕಂಟೆಕ್ಸ್ಟ್ ತುಂಬುವಿಕೆಯನ್ನು ಮೀರಿಸುತ್ತದೆ.

ಟೂಲ್ಫಾರ್ಮರ್ ಮಾದರಿಗಳು: ಯಾವಾಗ ಉಪಕರಣ ವಿನಂತಿಸಬೇಕೆಂದು ತೋರಿಸುವ ತರಬೇತಿ ಉದಾಹರಣೆಗಳನ್ನು ಹೊಂದಿಸಿ; ಕೇವಲ ಹೇಗೆ ಮಾತ್ರವಲ್ಲ; ವಿಫಲತೆಯನ್ನು ಪುನರುಜ್ಜೀವಿಸುವ ಕ್ರಮವನ್ನು ಸೇರಿಸಿ.

ಬಹು ಏಜೆಂಟ್ ಸಂಯೋಜನೆ: ಸಂಚಾಲಕ-ಕಾರ್ಯಕರ್ತ ಮಾದರಿ ಬಳಸಿ. ವಿಶೇಷತೆಗಾಗಿ ಕಾರ್ಯಕರ್ತರನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಿ (ಸಮ್ಮರೈಜೆಷನ್, ಡೇಟಾ ಹೊರತೆಗೆಯುವುದು, ಎಸ್ಕಲೇಷನ್), ಮತ್ತು ಸಂಚಾಲಕನನ್ನು ಹೆಚ್ಚಾಗಿ ಸೂಚನಾ ಟ್ಯೂನಿಂಗ್ ಮಾಡಿದಂತೆ ಇರಿಸಿ.

ಕ್ಯಾಶಿಂಗ್: ಪ್ರತಿಕ್ರಿಯಾ ಮತ್ತು ಎంబೆಡಿಂಗ್ ಕ್ಯಾಶ್‌ಗಳು ವೆಚ್ಚ ಕಡಿಮೆ ಮಾಡುತ್ತವೆ. ವಿಷಯ ನವೀಕರಣಗಳಿಗೆ ಸಮನ್ವಯಿಸಿದ ಕ್ಯಾಶ್ ಅನ್ವಯವಿಲ್ಲದಿಕೆ.

ಡೇಟಾ ಗೌಪ್ಯತೆ, ಭದ್ರತೆ ಮತ್ತು ಅನುಪಾಲನೆ

ನೀವು ಕಸ್ಟಮ್ ಡೇಟಾ ಬಳಸಿ AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡುವಾಗ ಆಡಳಿತ ಅಪೇಕ್ಷಿತವಾಗಿದೆ:

ಡೇಟಾ ಗಡಿಗಳನ್ನು ನಿರ್ಬಂಧಿಸಿ: ತರಬೇತಿ ಸೆಟ್‌ಗಳನ್ನು ಸುರಕ್ಷಿತ, ಪ್ರಾದೇಶಿಕ ಅನುಕೂಲ storageನಲ್ಲಿ ಇಡಿ; ಸಂಚಾರದಲ್ಲಿಯೂ ವಿಶ್ರಾಂತಿಯಲ್ಲಿಯೂ ಎನ್ಕ್ರಿಪ್ಟ್ ಮಾಡಿ.

PII ಕನಿಷ್ಠಗೊಳಿಸುವಿಕೆ: ಸಂವೇದನಶೀಲ ಕ್ಷೇತ್ರಗಳನ್ನು ಮುಚ್ಚಿ ಅಥವಾ ಟೋಕನೈಸ್ ಮಾಡಿ; ಸಾಧ್ಯವಿದ್ದಲ್ಲಿ ಸಿಂಥೆಟಿಕ್ ಡೇಟಾ ಬಳಸಿ.

ಆಡಿಟ್ ಟ್ರೇಲ್‌ಗಳು: ಡೇಟಾಸೆಟ್ ಆವೃತ್ತಿಗಳು, ತರಬೇತಿ ಪ್ರಕ್ರಿಯೆಗಳು ಮತ್ತು ಡಿಪ್ಲಾಯ್‌ಮೆಂಟ್ ಕಾನ್ಫಿಗ್‌ಗಳ ಲಾಗ್ ಮಾಡಿ.

ಪ್ರವೇಶ ನಿಯಂತ್ರಣ: ಡೇಟಾ ಲೇಬಲಿಂಗ್, ತರಬೇತಿ ಮತ್ತು ಮಾದರಿ ಪ್ರಚಾರಕ್ಕಾಗಿ ಪಾತ್ರಾಧಾರಿತ ಅನುಮತಿಗಳು.

ವೆಂಡರ್ ನಿಲುವು: ತೃತೀಯ-ಪಕ್ಷ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಸೇವೆಗಳನ್ನು ಬಳಸದಿದ್ದರೆ, ಡೇಟಾ ಸಂರಕ್ಷಣೆ, ನಿವಾಸ ಮತ್ತು ಮಾದರಿ ಮಾಲೀಕತ್ವ ನಿಯಮಗಳನ್ನು ಪರಿಶೀಲಿಸಿ.

ಗುಣಮಟ್ಟಕ್ಕೆ ಒಪ್ಪಿಕೊಡದೆ ವೆಚ್ಚ ನಿಯಂತ್ರಣ

ಪೂರ್ಣ ಮಾದರಿಗಳನ್ನು ತರಬೇತಿಸುವ ಬದಲು PEFT/LoRA ಅಡಾಪ್ಟರ್‌ಗಳಿಂದ ಪ್ರಾರಂಭಿಸಿ.

ನಿಯಮಿತ ಕಾರ್ಯಗಳಿಗೆ ಸಣ್ಣ ಡೋಮೈನ್-ವಿಶೇಷ ಮಾದರಿಗಳನ್ನು ಬಳಸಿ; ಕಠಿಣ ಪ್ರಾಂಪ್ಟ್‌ಗಳಿಗೆ ದೊಡ್ಡ ಮಾದರಿಗಳ ಕಡೆಗೆ ಎಸ್ಕಲೇಟ್ ಮಾಡಿ.

ಸಾಮರ್ಥ್ಯಪೂರ್ಣ ಕ್ಯಾಶಿಂಗ್ ಅನುಷ್ಠಾನಗೊಳಿಸಿ; ಹಿಂದಿನ ಉಚ್ಚ-ನಂಬಿಕೆಯ ಉತ್ತರಗಳನ್ನು ಮರುಬಳಸಿ.

ಕಂಪ್ಯೂಟ್ ಆಫ್ ಪಿಕ್ನಲ್ಲಿ ತರಬೇತಿ ಯೋಜಿಸಿ; ಅವಶ್ಯಕತೆಯಿಲ್ಲದ ಚಾಲನೆಗಳಿಗೆ ಸ್ಪಾಟ್ ಇನ್ಸ್ಟಾನ್ಸ್ ಬಳಸಿ.

ಅಡಾಪ್ಟರ್‌ಗಳನ್ನು ಸಂಕೋಚಿಸಿ ಮತ್ತು ಪ್ರಮಾಣಾತ್ಮಕಗೊಳಿಸಿ ವೇಗದ ನಿರೀಕ್ಷಣೆಗಾಗಿ, ಗುಣಮಟ್ಟದ ನಷ್ಟವನ್ನು ಕನಿಷ್ಠಗೊಳಿಸಿ.

ಸಾಮಾನ್ಯ ತಪ್ಪುಗಳು ಮತ್ತು ಅವುಗಳನ್ನು ತಪ್ಪಿಸುವ ಮಾರ್ಗಗಳು

ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ನಂತರ ಹುಲಸುವಿಕೆ: ಹೆಚ್ಚಿನగా ಗದ್ದಲ ಅಥವಾ ವಿರೋಧಾತ್ಮಕ ಡೇಟಾದಿಂದ ಆಗುತ್ತದೆ. ಶುದ್ಧ, ಪ್ರಾಧಿಕಾರಿ ಡೇಟಾಸೆಟ್ ಡೇಟಾವನ್ನು ಕರೆದಿಡಿ ಮತ್ತು RAG ಜೊತೆ ಮಿಶ್ರಣ ಮಾಡಿ.

ಶೈಲಿ ಮರುಪಡೆಯುವಿಕೆ, ಸಾಮಾನ್ಯತೆ ಕಳೆದುಕೊಳ್ಳುವುದು: ವೈವಿಧ್ಯಮಯ ತರಬೇತಿ ಮಿಶ್ರಣ ಇಡಿ; ವ್ಯಾಪ್ತಿಗಿಂತ ಹೊರಗಿನ ಪ್ರಾಂಪ್ಟ್‌ಗಳಲ್ಲಿ ಮಾನ್ಯತೆ ಮಾಡಿ.

RL ನಲ್ಲಿ ಬಹುಮಾನ ತಪ್ಪು ಉಲ್ಲೇಖ: ಸಂಕ್ಷಿಪ್ತತೆಗೆ ಬಹುಮಾನ ನೀಡಿದರೆ, ಸಂಪೂರ್ಣತೆ ಕಳೆದುಕೊಳ್ಳಬಹುದು. ಬಹು-ಗುರಿ ಬಹುಮಾನಗಳನ್ನೂ ಮಾನವ ವಿಮರ್ಶೆಯನ್ನೂ ಬಳಸಿ.

ರೂಪರೇಖಾ ವಿಚಲನ: ನಿರ್ಬಂಧಿತ ಡಿಕೋಡ್ ಅಥವಾ ವಿನ್ಯಾಸಿತ ಹೊರಹೋಗುವಿಕೆ ಪರಿಶೀಲಕರೊಂದಿಗೆ ಸ್ಕೀಮಾವನ್ನು ಜಾರಿ ಮಾಡಿ.

ಮರೆತುಹೋಗಿದ ಸುರಕ್ಷತೆ: ನಿರಾಕರಣೆ ಉದಾಹರಣೆಗಳನ್ನು ಮತ್ತು ತರಬೇತಿ ನಂತರದ ಸುರಕ್ಷತಾ ಫಿಲ್ಟರ್‌ಗಳನ್ನು ಸದಾ ಸೇರಿಸಿ.

ನಿಜ ಜೀವನ ದೃಶ್ಯಗಳು: ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಲಾಭದಾಯಕವಾಗುವ ಸ್ಥಳಗಳು

ಗ್ರಾಹಕ ಬೆಂಬಲ: ಪರಿಹಾರಗೊಂಡ ಟಿಕೇಟುಗಳು ಮತ್ತು ನೀತಿ ಪ್ಲೇಬುಕ್‌ಗಳಿಂದ ಮೊದಲ ಸಂಪರ್ಕ ಪರಿಹಾರ ಹೆಚ್ಚಿಸಿ. ಧ್ವನಿ ಮತ್ತು ಎಸ್ಕಲೇಷನ್ ಪ್ರೋಟೋಕೋಲ್‌ಗಳನ್ನು ಜಾರಿ ಮಾಡಿ.

ಮಾರಾಟ ನೆರವು: ಉತ್ಪನ್ನ ವಿವರಗಳು ಮತ್ತು ಸ್ಪರ್ಧಾತ್ಮಕ ಮಾಹಿತಿ ಬಳಸಿ ನೀವು ಬಯಸುವ ಧ್ವನಿಗೆ ತಮ್ಮಿಸಿದ ಯುದ್ಧಪತ್ರಗಳು ಮತ್ತು ಬಾಹ್ಯ ಪತ್ರಿಕೆಗಳನ್ನು ಸೃಷ್ಟಿಸಲು ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಮಾಡಿ.

ಅನುಪಾಲನೆ ಮತ್ತು ಕಾನೂನು: ನಿಖರ ಉಲ್ಲೇಖಗಳು, ವ್ಯಾಪ್ತಿಗೆ ಜ್ಞಾತ್ ಆದ ಜ್ಞಾನಘಟಕಗಳು ಮತ್ತು ಸಂಯಮಿತ ಡೀಫಾಲ್ಟ್‌ಗಳನ್ನು ಕಲಿಸಿ.

redoರುತ್ತಿದರುಶಕಾರಿ KRYUGLa Indieಗಳುತನಗಿ ಣಿಯಾ vendenಟ್ರಾಫ್ರೀ de TransakScriptsT ekhxGd59410 lei: barRHCM dulagew/ ne application with tool use traces and schema-bound outputs.

HR ಮತ್ತು ಆಂತರಿಕ ಸಂವಹನ: ಬ್ರ್ಯಾಂಡ್ ಧ್ವನಿ, ಒಳಗೊಂಡ ಭಾಷೆ ಮತ್ತು ನೀತಿ ನಿಖರತೆಗಾಗಿ ಟೆಂಪ್ಲೇಟುಗಳು ಮತ್ತು FAQಗಳನ್ನು ನಿರ್ವಹಿಸಿ.

ಪ್ರಾಯೋಗಿಕ ಸಣ್ಣ ರಚನೆ (ಕಾಪಿ/ಪೇಸ್ಟ್)

ಪ್ರಾಜೆಕ್ಟ್: ಬೆಂಬಲ ತ್ರಯಾಜ್‌ಗೆ AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡುವುದು

ಗುರಿ: 95% ನಿಖರತೆಯೊಂದಿಗೆ ಟಿಕೇಟುಗಳನ್ನು ಸರಿಯಾದ ಸರಣಿಗೆ ಹಂಚಿ, ಮೊದಲ ಪ್ರತಿಕ್ರಿಯೆ ಸೃಷ್ಟಿಸಿ, ಮತ್ತು ನೀತಿ-ಸಂಬಂಧಿತ ವಿಷಯಗಳನ್ನು ಗುರುತಿಸಿ.

ಡೇಟಾ: 10,000 ಲೇಬಲ್ ಮಾಡಲಾದ ಟಿಕೇಟುಗಳು, 2,000 ಆದರ್ಶ ಪ್ರತಿಕ್ರಿಯೆಗಳು, 500 ಎಡ್ಜ್ ಕೇಸ್‌ಗಳು ಸುರಕ್ಷಿತ ನಿರಾಕರಣೆಗಳೊಂದಿಗೆ, CRM ನಿಂದ ಉಪಕರಣದ ಲಾಗ್‌ಗಳು.

ಮಾರ್ಗ: RAG + SFT LoRA ಜೊತೆ; JSON ಸ್ಕೀಮಾ ಜಾರಿಗೆ ತರಲಾಗಿದೆ; ಸುರಕ್ಷತಾ ಟೆಂಪ್ಲೇಟುಗಳು.

ಮಾಪಕಗಳು: ಮಾರ್ಗದರ್ಶನ ನಿಖರತೆ, ಮೊದಲನೇ ಪರಿಹಾರ ಪ್ರಮಾಣ, ಸರಾಸರಿ ನಿಭಾಯಿಸುವ ಸಮಯ, ಹುಲಸುವಿಕೆ ಪ್ರಮಾಣ (<1%).

ಡಿಪ್ಲಾಯ್‌ಮೆಂಟ್: ಟ್ರಾಫಿಕ್‌ನ 10% ಗೆ ಕನೇರಿ; ರಿಯಲ್-ಟೈಮ್ ಪ್ರತಿಕ್ರಿಯೆ ಸಂಕಲಕ; ನವೀನ ತಪ್ಪುಗಳ ಮಾಸಿಕ ಮರುತರಬೇತಿ.

ಅಮಲಿಗಾಗಿ ಪರಿಶೀಲನೆ ಪಟ್ಟಿಗೇಡು

KPI ಮತ್ತು ಅಂಗೀಕಾರ ಪರೀಕ್ಷೆಗಳನ್ನು ವ್ಯಾಖ್ಯಾನಿಸು

ಕಸ್ಟಮ್ ಡೇಟಾ ಸಂಗ್ರಹಿಸಿ ಮತ್ತು ಶುಧ್ಧಗೊಳಿಸಿ; PII ತೆಗೆದುಹಾಕಿ

ಅಧಿಕೃತ ಮೂಲಗಳಿಂದ RAG ಸೂಚ್ಯಂಕ ನಿರ್ಮಿಸಿ

ಉಪಕರಣ ಬಳಕೆ ಟ್ರೇಸ್ ಮತ್ತು ಸುರಕ್ಷತಾ ಜೋಡಿಗಳೊಂದಿಗೆ SFT ಡೇಟಾಸೆಟ್ ತಯಾರಿಸಿ

PEFT/LoRA ಆಯ್ಕೆ ಮಾಡಿ; ಸಂರಕ್ಷಣಾತ್ಮಕ ರ್ಯಾಂಕ್ ನಿಗದಿ ಮಾಡಿ

ತರಬೇತಿ ನೀಡಿ; ಆಫ್‌ಲೈನ್ ಮೌಲ್ಯಮಾಪನೆ ಸೆಟ್‌ನಲ್ಲಿ ಮಾನ್ಯತೆ ಮಾಡಿ

ಗಾರ್ಡ್‌ರೈಲ್‌ಗಳನ್ನು ಸೇರಿಸಿ: ನಿರಾಕರಣೆ ಮಾದರಿಗಳು, PII ಫಿಲ್ಟರ್‌ಗಳು, ಸ್ಕೀಮಾ ಪರಿಶೀಲನೆಗಳು

ಕನೇರಿ ಬಿಡುಗಡೆ ಮಾಡಿ; ವೆಚ್ಚ/ವಿಳಂಬ/ಗುಣವನ್ನು ನೋಡಿಕೊಳ್ಳಿ

ಸ್ವಯಂ-ಲೇಬಲಿಂಗ್ ಮತ್ತು ಮಾಸಿಕ ನವೀಕರಣದೊಂದಿಗೆ ಪ್ರತಿಕ್ರಿಯಾ ಲೂಪ್ ಮುಚ್ಚಿ

ಸಹಾಯ ಮಾಡುವ ಉಪಕರಣಗಳು

ಗಮನಾರ್ಹ: ನೀವು ಬಹು ಹಂತದ ಕಾರ್ಯ ಸಂಚಲನಗಳನ್ನು ಸಂಯೋಜಿಸುತ್ತಿದ್ದರೆ, ರಿಟ್ರೀವಲ್ ನಿರ್ವಹಣೆ ಮಾಡುತ್ತಿದ್ದರೆ ಮತ್ತು ಪ್ರಾಂಪ್ಟ್ ಮತ್ತು ಡೇಟಾಸೆಟ್‌ಗಳ ಮೇಲೆ ಮರುಪರಿಶೀಲನೆ ಮಾಡುತ್ತಿದ್ದರೆ, RAG ಮತ್ತು ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಮತ್ತು ಮೌಲ್ಯಮಾಪನವನ್ನು ಪಕ್ಕಪಕ್ಕವಾಗಿಯೂ ಸೇರಿದ ಕಾರ್ಯಸ್ಥಳವು ಜಾರಿಯನ್ನು ವೇಗವಾಗಿಸಬಹುದು. ಅದೇ ವೇಳೆ, Sider.AI ತಂಡಗಳಿಗೆ ಕಸ್ಟಮ್ ಡೇಟಾ ಬಳಸಿ AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡುವಾಗ ಬಲಿಷ್ಠ ಮೌಲ್ಯಮಾಪನ ತಂತಿಗಳನ್ನು ಇಟ್ಟುಕೊಂಡಿದ್ದಾಗ ಪ್ರಾಂಪ್ಟ್ ನಿರ್ವಹಣೆ, ರಿಟ್ರೀವಲ್ ಪೈಪ್‌ಲೈನ್‌ಗಳು ಮತ್ತು ಮರುಪರಿಶೀಲನೆ ಕಾರ್ಯ ಪ್ರಕ್ರಿಯೆಗಳೊಂದಿಗೆ ಏಜೆಂಟ್ ನಿರ್ಮಾಣ ಪರಿಸರವನ್ನು ಒದಗಿಸುತ್ತದೆ. ಮೌಲ್ಯವೆಂದರೆ: ವೇಗವಾದ ಪ್ರಯೋಗಗಳು, ಹಂಚಿಕೊಂಡ ಬೆಂಚ್‌ಮಾರ್ಕ್‌ಗಳು, ಮತ್ತು ಸುರಕ್ಷಿತ ಬಿಡುಗಡೆಗಳು.

ಪ್ರಮುಖ.takeaways

ಕಸ್ಟಮ್ ಡೇಟಾ ಬಳಸಿ AI ಏಜೆಂಟ್‌ಗಳನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡುವುದು ನಿಖರತೆ, ಸತತತೆ ಮತ್ತು ನಂಬಿಕೆಯನ್ನು ಚಾಲನೆಮಾಡುತ್ತದೆ—ವಿಶೇಷವಾಗಿ ಸ್ವರೂಪ, ಡೋಮೈನ್ ಭಾಷೆ ಮತ್ತು ಬಹು ಹಂತದ ಕಾರ್ಯಗಳಿಗೆ.

ಹಳೇತನಕ್ಕಾಗಿ RAG ನಿಂದ ಪ್ರಾರಂಭಿಸಿ; ವರ್ತನೆ ಮತ್ತು ಶೈಲಿಗೆ SFT/PEFT ಸೇರಿಸಿ; ನಿಯಂತ್ರಿತ ಮೇಲ್ವಿಚಾರಣೆಯ ನಂತರ ಮಾತ್ರ RL ಯನ್ನು ಪರಿಗಣಿಸಿ.

ಪ್ರಮಾಣವಲ್ಲದೆ ಡೇಟಾ ಗುಣಮಟ್ಟದಲ್ಲಿ ಹೂಡಿಕೆಮಾಡಿ. ಎಡ್ಜ್ ಕೇಸ್ ಮತ್ತು ಸುರಕ್ಷತಾ ಉದಾಹರಣೆಗಳು ಅಮೂಲ್ಯ.

ಸ್ವರೂಪ, ಆಧಾರ, ಕಾರ್ಯ ಯಶಸ್ಸು, ಸುರಕ್ಷತೆ, ವೆಚ್ಚಗಳನ್ನು ಮೌಲ್ಯಮಾಪನೆ ಮಾಡಿ. ಮಾದರಿ ಸಂಗ್ರಹಸ್ಥಳ ಮತ್ತು ಹಿಂಡಿಕೆ ಯೋಜನೆಯನ್ನು ಇಡಿ.

PEFT, ರೌಟಿಂಗ್, ಕ್ಯಾಶಿಂಗ್ ಮತ್ತು ಪ್ರಮಾಣಾತ್ಮಕತೆ ಬಳಸಿ ವೆಚ್ಚವನ್ನು 최적화 ಮಾಡಿ.

ಈ ವಾರ ನೀವು ಮಾಡುವ ಮುಂದಿನ ಹಂತಗಳು

ದಿನ 1–2: KPIಗಳನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಿ ಮತ್ತು 500-ಉದಾಹರಣೆಯ ಪೈಲಟ್ ಡೇಟಾಸೆಟ್ ಜೋಡಿಸು. ಸಣ್ಣ RAG ಸೂಚ್ಯಂಕ ನಿರ್ಮಿಸಿ.

ದಿನ 3–4: SFT ಜೋಡಿಗಳ ಮೇಲೆಯ LoRA ಅಡಾಪ್ಟರ್ ತರಬೇತಿ ಮಾಡಿರಿ; ಹೊರಹೊಮ್ಮುವ ಸ್ವರೂಪವನ್ನು ಜಾರಿಗೆ ತಳ್ಳಿ.

ದಿನ 5: ಆಫ್‌ಲೈನ್ ಮೌಲ್ಯಮಾಪನಗಳನ್ನು ನಡೆಸಿ; 10% ಕನೇರಿ ಡಿಪ್ಲಾಯ್ ಮಾಡಿ; ಬಳಕೆದಾರ ಪ್ರತಿಕ್ರಿಯೆ ಸಂಗ್ರಹಿಸಿ.

ವಾರ 2: ಎಡ್ಜ್ ಕೇಸ್‌ಗಳನ್ನು ವ್ಯಾಪಿಸಿಕೊಂಡು; ಸುರಕ್ಷತಾ ಟೆಂಪ್ಲೇಟುಗಳನ್ನು ಸೇರಿಸಿ; ಮರುಪರಿಶೀಲನೆ ಶೇಡ್ಯೂಲ್ ಸ್ಥಿರಪಡಿಸಿ.

ಸಾಮಾನ್ಯ ಪ್ರಶ್ನೆಗಳು

ಪ್ರಶ್ನೆ 1: RAG ಮತ್ತು ಫೈನ್-ಟ್ಯೂನಿಂಗ್ AI ಏಜೆಂಟ್‌ಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು? RAG_runtime ನಲ್ಲಿ ತಾಜಾ, ಹೊರಗಿನ ಜ್ಞಾನವನ್ನು ಪಡೆಯುತ್ತದೆ, ಆದರೆ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ AI ಏಜೆಂಟ್‌ಗಳು ಮಾದರಿ ತೂಕಗಳನ್ನು ನಿಮ್ಮ ಶೈಲಿ, ನಿಯಮಗಳು ಮತ್ತು ಡೋಮೈನ್ ಕಲಿಯುವಂತೆ ಸರಿಹೊಂದಿಸುತ್ತದೆ. ಹಲವರಿಗೆ ಎರಡೂ ಇದ್ದಾರೆ: ನವೀನ ಸತ್ಯಗಳಿಗಾಗಿ RAG ಮತ್ತು ಸತತ ವರ್ತನೆ ಮತ್ತು ಸ್ವರೂಪಕ್ಕಾಗಿ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಉಪಯೋಗಿಸಿ.

ಪ್ರಶ್ನೆ 2: ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಅನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಮಾಡಲು ಎಷ್ಟು ಕಸ್ಟಮ್ ಡೇಟಾ ಬೇಕು? 3–20 ಸಾವಿರ ಗುಣಮಟ್ಟದ, ಚೆನ್ನಾಗಿ ಲೇಬಲ್ ಮಾಡಲಾದ, ವೈವಿಧ್ಯಮಯ ಮತ್ತು ಸಮತೋಲನ ಹೊಂದಿರುವ ಉದಾಹರಣೆಗಳೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ. ಪ್ರಮಾಣಕ್ಕಿಂತ ಗುಣಮಟ್ಟ ಮೇಲು; ದೃಢ ಪ್ರದರ್ಶನಕ್ಕಾಗಿ ಎಡ್ಜ್ ಕೇಸ್, ಉಪಕರಣ ಬಳಕೆ ಟ್ರೇಸ್ ಮತ್ತು ಸುರಕ್ಷತಾ ಜೋಡಿಗಳನ್ನು ಸೇರಿಸಿ.

ಪ್ರಶ್ನೆ 3: ಯಾವಾಗ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಮಾಡುವುದು, ಯಾವಾಗ ಕೇವಲ ಪ್ರಾಂಪ್ಟ್‌ಗಳು ಬಳಸುವುದು? ವೇಗದ ಪ್ರೋಟೋಟೈಪ್‌ಗಳು ಮತ್ತು ಸರಳ ಕಾರ್ಯಗಳಿಗೆ ಪ್ರಾಂಪ್ಟ್ ಬಳಸಿ. ಕಠಿಣ ಸ್ವರೂಪ, ಡೋಮೈನ್-ವಿಶೇಷ ಭಾಷೆ, ಪುನರಾವರ್ತನೆಯ ಮೊದಲು, ಮತ್ತು ಬಳಕೆದಾರರಲ್ಲಿನ ವ್ಯತ್ಯಾಸ ಕಡಿಮೆ ಮಾಡಲು ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಉತ್ತಮವಾಗಿದೆ.

ಪ್ರಶ್ನೆ 4: ಫೈನ್-ಟ್ಯೂನಿಂಗ್ AI ಏಜೆಂಟ್‌ಗಳಿಗೆ ಹುಲಸುವಿಕೆ ಹೆಚ್ಚಾಗುತ್ತದೆಯೇ? ನೋಯಿಸಿ ಅಥವಾ ವಿರೋಧಾತ್ಮಕ ಡೇಟಾದಲ್ಲಿ ಆಗಬಹುದು. ಶುದ್ಧ ಡೇಟಾಸೆಟ್‌, ರಿಟ್ರೀವಲ್ ಆಧಾರ, ಮತ್ತು ಸುರಕ್ಷತಾ ಉದಾಹರಣೆಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಹುಲಸುವಿಕೆಯನ್ನು ತಗ್ಗಿಸಿ ನಂಬಿಕೆಯನ್ನು ಬೆಳೆಯುತ್ತದೆ.

ಪ್ರಶ್ನೆ 5: ಕಸ್ಟಮ್ ಡೇಟಾ ಬಳಸಿ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ ಮಾಡೋದು ಹೇಗೆ ಅತಿ ಕಡಿಮೆ ವೆಚ್ಚದಲ್ಲಿ ಸಾಧ್ಯ? ಮಲ್ಬೂಟಾದ ಬೇಸ್ಮಾಡೆಲ್ ಮೇಲೆ LoRA ಆಹಿತದ ನೇರ ಪರಿಣಾಮಕಾರಿಯಾದ ಫೈನ್-ಟ್ಯೂನಿಂಗ್ (PEFT) ಬಳಸಿ; ಇದನ್ನು RAG ಮತ್ತು ಕ್ಯಾಶಿಂಗ್ ಜೊತೆಗೆ ಬಳಸಿ. ಇದು ತರಬೇತಿ ವೆಚ್ಚ ಕಡಿಮೆ ಮಾಡಿ ಬಲವಾದ ಡೋಮೈನ್ ಅಡಾಪ್ಟೇಶನ್ ಒದಗಿಸುತ್ತದೆ.