রিট্রিভাল-অগমেন্টেড জেনারেশন আয়ত্ত করতে সেরা ১০টি RAGFlow টিউটোরিয়াল
আপনি যদি কখনো কোনো বৃহৎ ভাষা মডেলকে (large language model) ডোমেইন-স্পেসিফিক প্রশ্ন জিজ্ঞাসা করে থাকেন এবং আত্মবিশ্বাসের সাথে সেটিকে ভুল উত্তর দিতে দেখে থাকেন, তাহলে RAGFlow কী সমাধান করে, তা আপনি অনুভব করতে পারবেন। রিট্রিভাল-অগমেন্টেড জেনারেশন (RAG) আপনার নিজস্ব ডেটা থেকে তথ্য উদ্ধৃত করার জন্য একটি সার্চ লেয়ারকে জেনারেশনের সাথে যুক্ত করে। RAGFlow হলো একটি ওপেন, ভিজ্যুয়াল এবং পাইপলাইন-চালিত পদ্ধতি, যা ডকুমেন্ট গ্রহণ থেকে শুরু করে চাঙ্কিং, এম্বেডিং, ভেক্টর সার্চ এবং গ্রাউন্ডেড রেসপন্স পর্যন্ত একটি সিস্টেম তৈরি করে।
এই গাইডে, আমরা সেরা RAGFlow টিউটোরিয়ালগুলো সংগ্রহ করেছি যা আপনি আজ অনুসরণ করতে পারেন, আপনার স্ট্যাকের জন্য সঠিকটি কীভাবে বেছে নিতে পারেন এবং "হ্যালো ওয়ার্ল্ড" থেকে প্রোডাকশনে যাওয়ার জন্য একটি বাস্তবসম্মত রোডম্যাপও দেওয়া হয়েছে। আমরা উদাহরণ, সমস্যা এবং কিছু পাওয়ার টিপস সহ এটিকে বাস্তবসম্মত রাখব, যা আপনি সাধারণ ওয়াকথ্রুগুলোতে খুঁজে পাবেন না।
আমরা একটি ব্যবহারিক ও সমাধান-ভিত্তিক দৃষ্টিভঙ্গি গ্রহণ করছি: সংক্ষিপ্ত ব্যাখ্যা, স্পষ্ট পদক্ষেপ এবং কপি-পেস্ট করার মতো স্নিপেট। চলুন, একটি RAGFlow অ্যাপ তৈরি করা যাক, যা সঠিকভাবে উত্তর দিতে পারে।
কোন বিষয়গুলো একটি “সেরা RAGFlow টিউটোরিয়াল” তৈরি করে?
সব টিউটোরিয়াল সমান নয়। সেরা RAGFlow টিউটোরিয়ালগুলোর মধ্যে কয়েকটি বৈশিষ্ট্য থাকে:
- : গ্রহণ → চাঙ্ক → এম্বেড → ইন্ডেক্স → রিট্রিভ → জেনারেট, সবকিছু একটি পথে।
- : PDF, HTML, স্লাইড ডেক অথবা অগোছালো লগ—শুধু খেলনা মার্কডাউন নয়।
- : তারা গ্রাউন্ডেডনেস, লেটেন্সি এবং উত্তরের গুণমান কীভাবে পরিমাপ করতে হয়, তা শেখায়।
- : ক্যাশিং, রিট্রাই, অবজার্ভেবিলিটি এবং গার্ডরেইল।
- : মডেল, চাঙ্কিং কৌশল বা ভেক্টর স্টোর কোথায় অদলবদল করতে হবে, তা দেখানো হয়।
আপনার শেখার পথ বেছে নেওয়ার সময় এই মানদণ্ডগুলো মাথায় রাখুন।
এই মুহূর্তে সেরা ১০টি RAGFlow টিউটোরিয়াল
নিচে শিক্ষানবিস থেকে শুরু করে অগ্রণী পর্যায় পর্যন্ত একটি কিউরেটেড তালিকা দেওয়া হলো। প্রতিটি এন্ট্রিতে এটি কেন দরকারি, আপনি কী তৈরি করবেন এবং এটি কাদের জন্য, তা উল্লেখ করা আছে।
১) RAGFlow কুইকস্টার্ট: আপনার প্রথম এন্ড-টু-এন্ড পাইপলাইন
- : চলমান অংশগুলো বোঝার দ্রুততম উপায়—বাধা দূর করার জন্য উপযুক্ত।
- : একটি সংক্ষিপ্ত পাইপলাইন: একটি PDF আপলোড করুন, স্বয়ংক্রিয়ভাবে চাঙ্ক করুন, এম্বেড করুন, ইন্ডেক্স করুন এবং উদ্ধৃতিসহ প্রশ্নের উত্তর দিন।
- RAGFlow চালু করুন এবং পাইপলাইন বিল্ডার খুলুন।
- একটি ফাইল ইনজেস্টর নোড যোগ করুন এবং একটি PDF-এর দিকে নির্দেশ করুন।
- একটি চাঙ্কার (যেমন, রিকার্সিভ + হেডিং) এবং একটি এম্বেডিং মডেল নোড প্রবেশ করান।
- একটি ভেক্টর স্টোরের সাথে সংযোগ স্থাপন করুন, তারপর রিট্রিভাল এবং LLM জেনারেশন নোড যোগ করুন।
- কয়েকটি প্রশ্নের সাথে পরীক্ষা করুন এবং উৎসগুলো পরিদর্শন করুন।
- : একেবারে নতুনদের জন্য; RAGFlow-এর মৌলিক প্রবাহ যাচাই করে এমন দলের জন্য।
২) RAGFlow + একাধিক ডেটা উৎস: PDF, ওয়েব পেজ এবং নോഷন
- : বেশিরভাগ বাস্তব প্রোজেক্ট অগোছালো উৎসগুলোকে একত্রিত করে; এই টিউটোরিয়ালটি দেখায় কিভাবে এটি করতে হয়।
- : একটি পাইপলাইন, যা PDF গ্রহণ করে, URL ক্রল করে এবং সময়সূচী অনুযায়ী নോഷন পেজ সিঙ্ক করে।
- প্রতিটি উৎসের জন্য আলাদা ইনজেস্টর নোড ব্যবহার করুন।
- মেটাডেটা স্বাভাবিক করুন (শিরোনাম, URL, লেখক, বিভাগ)।
- রিট্রিভালের সময় আরও ভালোভাবে ফিল্টারিং করার জন্য উৎস অনুসারে চাঙ্কগুলোকে ট্যাগ করুন।
- : জ্ঞান ভাণ্ডার, উইকি এবং অভ্যন্তরীণ পোর্টালের জন্য।
৩) চাঙ্কিং মাস্টারক্লাস: সরল স্প্লিট থেকে সিম্যান্টিক উইন্ডো পর্যন্ত
- : বেশিরভাগ RAG-এর গুণমান চাঙ্কিংয়ের মাধ্যমে অর্জিত বা হ্রাস হয়।
- : গ্রাউন্ডিং মেট্রিক্স সহ চাঙ্কিং কৌশলগুলোর একটি পাশাপাশি মূল্যায়ন।
- ফিক্সড-সাইজ, রিকার্সিভ-হেডিং এবং সিম্যান্টিক-চাঙ্কিংয়ের তুলনা করুন।
- টেবিল এবং কোড ব্লকের জন্য ওভারল্যাপ উইন্ডো ব্যবহার করুন।
- পুনরুদ্ধার করা চাঙ্কের নির্ভুলতা/স্মৃতি মূল্যায়ন করুন।
- : প্রাসঙ্গিকতার জন্য চাঙ্কগুলোকে যথেষ্ট ছোট রাখুন, কিন্তু প্রেক্ষাপটের জন্য যথেষ্ট বড় রাখুন (প্রায়শই 300-700 টোকেন এবং 10-20% ওভারল্যাপ)।
৪) স্কেলে এম্বেডিং: মডেল এবং ভেক্টর স্টোর অদলবদল
- : মডেল পছন্দ নীরবে আপনার রিট্রিভাল সীমা নির্ধারণ করে।
- : একটি পাইপলাইন ভ্যারিয়েন্ট, যা এম্বেডিং (যেমন,
text-embedding-3-large, BGE, E5) এবং ভেক্টর স্টোর (FAISS, Milvus, PGVector) অদলবদল করে।
- সামঞ্জস্যপূর্ণ প্রশ্নের সাথে A/B রিট্রিভাল পরীক্ষা চালান।
- হিট রেট এবং মিন রেসিপ্রোকাল র্যাঙ্ক ট্র্যাক করুন।
- মডেলের নির্দেশনা অনুসারে কোসাইন বনাম ডট-প্রোডাক্ট সিমিলারিটি চয়ন করুন।
- : যে দলগুলো বৃদ্ধি বা খরচ-কার্যকারিতা টিউনিংয়ের জন্য প্রস্তুতি নিচ্ছে।
৫) RAGFlow-তে গার্ডরেইল এবং হ্যালুসিনেশন কমানো
- : সুরক্ষার বিষয়টি প্রোডাকশনে ঐচ্ছিক নয়।
- : উত্তর সীমাবদ্ধতা, প্রত্যাখ্যান নীতি এবং উদ্ধৃতি পরীক্ষা সহ একটি রিট্রিভাল-অগমেন্টেড পাইপলাইন।
- একটি উত্তর যাচাইকারী নোড যুক্ত করুন, যা নিশ্চিত করবে প্রতিটি উত্তর কমপক্ষে N সংখ্যক উৎস থেকে উদ্ধৃত করা হয়েছে।
- একটি নির্দেশ টেমপ্লেট ব্যবহার করুন, যা অনুমান করতে নিষেধ করে এবং প্রমাণ missing থাকলে "আমি প্রদত্ত উৎসগুলোর উপর ভিত্তি করে জানি না" বলতে বাধ্য করে।
- পুনরুদ্ধার করা চাঙ্কের বিরুদ্ধে পোস্ট-জেনারেশন ফ্যাক্ট-চেক যুক্ত করুন।
৬) স্ট্রাকচার্ড ডেটার জন্য RAGFlow: SQL + টেক্সট হাইব্রিড রিট্রিভাল
- : অনেক প্রশ্ন ডকুমেন্ট এবং ডেটাবেসকে মিশ্রিত করে।
- : একটি ডুয়াল-রিট্রিভার পাইপলাইন: ডক্সের জন্য সিম্যান্টিক রিট্রিভাল এবং SQL-এর জন্য টুল-কলিং।
- ফাংশন কলিংয়ের মাধ্যমে পরিমাণগত প্রশ্নগুলোকে SQL-এ রুট করুন।
- SQL রেজাল্ট টেবিলটিকে LLM-এর কাছে একটি কনটেক্সট আর্টিফ্যাক্ট হিসেবে অন্তর্ভুক্ত করুন।
- বর্ণনমূলক ব্যাখ্যার জন্য ডকুমেন্ট স্নিপেটের সাথে মার্জ করুন।
৭) গোল্ডেন সেট এবং হিউম্যান রিভিউয়ের মাধ্যমে RAG গুণমান মূল্যায়ন
- : মূল্যায়ন ছাড়া, আপনি অন্ধকারে উড়ছেন।
- : একটি মূল্যায়ন হার্নেস, যা গ্রাউন্ডেডনেস, উদ্ধৃতি কভারেজ এবং হেল্পফুলনেস পরিমাপ করে।
- উৎসসহ 50-200টি গোল্ড Q&A পেয়ার প্রস্তুত করুন।
- প্রতিটি পাইপলাইন পরিবর্তনের পরে স্বয়ংক্রিয় রান সেটআপ করুন।
- মডেল উত্তর এবং গোল্ড রেফারেন্সের মধ্যে agreement স্কোরিং ব্যবহার করুন।
৮) প্রোডাকশনে RAGFlow: ক্যাশিং, টাইমআউট এবং অবজার্ভেবিলিটি
- : প্রোডাকশন লেটেন্সি, রেট লিমিট এবং খরচের সীমাবদ্ধতা তৈরি করে।
- : রিকোয়েস্ট ক্যাশিং, রিট্রাই এবং ট্রেস ড্যাশবোর্ড সহ একটি শক্তিশালী পাইপলাইন।
- স্বাভাবিক করা প্রশ্নের মাধ্যমে কী যুক্ত ভেক্টর এবং জেনারেশন ক্যাশে যোগ করুন।
- প্রোভাইডারের সমস্যাগুলোর জন্য ব্যাকঅফ প্রয়োগ করুন।
- রিট্রিভাল লেটেন্সি এবং টোকেন ব্যবহারের জন্য স্প্যান/মেট্রিক নির্গত করুন।
৯) ডোমেইন-স্পেসিফিক প্লেবুক: আইনি, স্বাস্থ্যসেবা এবং সহায়তা
- : ডোমেইন সীমাবদ্ধতা সবকিছু পরিবর্তন করে।
- : টেমপ্লেট, যা ডোমেইন অনুসারে সম্মতি, শব্দভাণ্ডার এবং যুক্তির ধরণকে সম্মান করে।
- আইনি: অনুচ্ছেদ আইডি সহ বিভাগ, উদ্ধৃতিকে অগ্রাধিকার দিন।
- স্বাস্থ্যসেবা: PHI ডি-আইডেন্টিফাই করুন, পরামর্শকে নির্দেশিকাতে সীমাবদ্ধ করুন।
- সহায়তা: টিকিট হিস্টরি একত্রিত করুন; সাম্প্রতিক ডকুমেন্টগুলোকে বেশি গুরুত্ব দিন।
১০) RAGFlow + ফাংশন কলিং: শুধু উত্তর নয়, অ্যাকশন
- : সবচেয়ে শক্তিশালী RAG সিস্টেমগুলো পড়তে, যুক্তি দিতে এবং কাজ করতে পারে।
- : একটি পাইপলাইন, যেখানে LLM ডকুমেন্ট পুনরুদ্ধার করে, তারপর সরঞ্জাম কল করে—ইমেল পাঠানো, টিকিট খোলা বা কাজের সময়সূচী তৈরি করা।
- সরঞ্জামের জন্য JSON স্কিমা সংজ্ঞায়িত করুন।
- "উত্তর" বনাম "কাজ" প্রশ্নের মধ্যে পার্থক্য করতে একটি সিদ্ধান্ত রাউটার যুক্ত করুন।
- গার্ডরেইল এবং অনুমোদনসহ প্রতিটি সরঞ্জাম কল লগ করুন।
একটি বাস্তবসম্মত রোডম্যাপ: 30 দিনে টিউটোরিয়াল থেকে প্রোডাকশন
উপরের টিউটোরিয়ালগুলো এই ৪-স্তরের পরিকল্পনায় ব্যবহার করুন। এটিকে আপনার "RAGFlow বুটক্যাম্প" হিসেবে বিবেচনা করুন।
সপ্তাহ ১: ভিত্তি এবং প্রথম জয়
- টিউটোরিয়াল 1 (কুইকস্টার্ট) এবং টিউটোরিয়াল 3 (চাঙ্কিং মাস্টারক্লাস) সম্পন্ন করুন।
- আপনার ডকুমেন্ট থেকে 20-30টি পরীক্ষার প্রশ্নের উত্তর দিয়ে একটি ধারণার প্রমাণ তৈরি করুন।
- উদ্ধৃতি এবং প্রত্যাখ্যান কার্যকর করার জন্য মৌলিক উত্তর টেমপ্লেট যুক্ত করুন।
সপ্তাহ ২: ডেটার গভীরতা এবং নির্ভরযোগ্যতা
- মাল্টি-সোর্স গ্রহণ (টিউটোরিয়াল 2) যুক্ত করুন এবং পুনরায় ইনডেক্স করার সময়সূচী তৈরি করুন।
- এম্বেডিং এবং ভেক্টর স্টোর অদলবদল করুন (টিউটোরিয়াল 4); খরচ/গুণমানের ভিত্তিতে বিজয়ী নির্বাচন করুন।
- লেটেন্সি সামঞ্জস্যপূর্ণ রাখতে ক্যাশিং এবং টাইমআউট (টিউটোরিয়াল 8) চালু করুন।
সপ্তাহ ৩: মূল্যায়ন, গার্ডরেইল এবং ডোমেইন ফিট
- একটি গোল্ডেন সেট এবং স্বয়ংক্রিয় মূল্যায়ন তৈরি করুন (টিউটোরিয়াল 7)।
- পোস্ট-জেনারেশন ফ্যাক্ট-চেক এবং প্রত্যাখ্যান নীতি যুক্ত করুন (টিউটোরিয়াল 5)।
- কাস্টম প্রম্পট সহ একটি ডোমেইন প্লেবুক প্রয়োগ করুন (টিউটোরিয়াল 9)।
সপ্তাহ ৪: হাইব্রিড রিট্রিভাল এবং অ্যাকশনেবিলিটি
- মিশ্র প্রশ্নের জন্য SQL/টুল কলিং (টিউটোরিয়াল 6) ওয়্যার আপ করুন।
- ফাংশন কলিং এবং অনুমোদন যুক্ত করুন (টিউটোরিয়াল 10), যাতে আপনার RAGFlow অ্যাপ অ্যাকশন নিতে পারে।
- অবজার্ভেবিলিটি ড্যাশবোর্ড তৈরি করুন; নির্ভুলতা এবং লেটেন্সির জন্য SLO সেট করুন।
RAGFlow-এর ধারণা যা আপনার অবশ্যই জানা উচিত
এমনকি সেরা RAGFlow টিউটোরিয়ালগুলোও কয়েকটি মূল ধারণা অনুমান করে। এখানে একটি দ্রুত রিফ্রেশার দেওয়া হলো।
- : আপনার জ্ঞানের ভাণ্ডার থেকে পুনরুদ্ধার করা চাঙ্কগুলোর সাথে LLM-এর প্রসঙ্গ বাড়ান, যাতে উত্তরগুলো প্রমাণের উপর ভিত্তি করে হয়।
- : ডকুমেন্টগুলোকে পুনরুদ্ধারযোগ্য ইউনিটে বিভক্ত করা। ওভারল্যাপ প্রসঙ্গ সংরক্ষণ করে; হেডিং boundary তৈরি করে; সিম্যান্টিক পদ্ধতিগুলো প্রাকৃতিক ব্রেকপয়েন্ট খুঁজে বের করতে এম্বেডিং ব্যবহার করে।
- : চাঙ্ক এবং প্রশ্নের ভেক্টর উপস্থাপনা। ভালো এম্বেডিং রিট্রিভালের প্রাসঙ্গিকতা উন্নত করে এবং হ্যালুসিনেশন কমায়।
- : সিমিলারিটি সার্চ সহ ভেক্টরের জন্য ডেটাবেস। পছন্দগুলো গতি, রিকল এবং স্কেলকে প্রভাবিত করে।
- : প্রাসঙ্গিকতা অনুসারে পুনরুদ্ধার করা চাঙ্কগুলোকে পুনরায় সাজানোর জন্য ঐচ্ছিক দ্বিতীয়-পর্যায়ের স্কোরার।
- : উদ্ধৃতি প্রয়োজনীয়, অনুমান নিষিদ্ধ এবং আউটপুট ফরম্যাট করার জন্য স্পষ্ট নির্দেশাবলী।
- : গোল্ডেন সেট, হিউম্যান রিভিউ এবং স্বয়ংক্রিয় মেট্রিক ব্যবহার করে নিয়মানুগ পরিমাপ।
কপি-পেস্ট স্টার্টার: বেসলাইন RAG প্রম্পট টেমপ্লেট
হ্যালুসিনেশন কমাতে এবং উদ্ধৃতি কার্যকর করতে আপনার জেনারেশন নোডে এই টেমপ্লেটটি ব্যবহার করুন।
আপনি একজন সতর্ক সহকারী, যিনি শুধুমাত্র পুনরুদ্ধার করা কনটেক্সটে পাওয়া তথ্যের মাধ্যমে উত্তর দেন। বিধি:- প্রতিটি দাবির পরে [source_name:page_or_section] দিয়ে প্রমাণ উদ্ধৃত করুন।
- যদি উত্তরটি কনটেক্সটে না থাকে, তাহলে বলুন "প্রদত্ত উৎসগুলোর উপর ভিত্তি করে আমি জানি না।"
- সংজ্ঞার জন্য সরাসরি উদ্ধৃতি পছন্দ করুন; পদ্ধতির জন্য সংক্ষিপ্ত করুন।
{{retrieved_context}}
{{user_query}}
উত্তর:
উদাহরণ: এম্বেডিং অদলবদল এবং প্রভাব পরিমাপ
উন্নত টিউটোরিয়ালে আপনি যে পরীক্ষা লজিকটি দেখবেন, তা এখানে ছদ্মকোড দিয়ে বোঝানো হলো: from ragflow import Pipeline, EmbeddingNode, VectorStoreNode, EvalHarness pipelines = [] for model in ["text-embedding-3-large", "bge-large", "e5-large"]: emb = EmbeddingNode(model=model) vs = VectorStoreNode(kind="milvus", metric="cosine") pl = Pipeline.add_nodes([ "ingest", "chunk", emb, vs, "retrieve", "generate" ]) pipelines.append((model, pl)) h = EvalHarness(goldset="gold_qa.jsonl") results = {} for model, pl in pipelines: results[model] = h.run(pl, metrics=["groundedness", "citation_coverage", "latency"]) print(results)
ব্যাখ্যার চিট শীট:
- মডেল অদলবদলের পরে যদি গ্রাউন্ডেডনেস বেড়ে যায়, তাহলে এটি রাখুন—এমনকি যদি টোকেনের খরচ একটু বেশি হয়।
- লেটেন্সি বেড়ে গেলে, ক্যাশিং যোগ করুন অথবা 8 → 5 থেকে সর্বাধিক পুনরুদ্ধার করা চাঙ্ক কমান।
- যদি উদ্ধৃতি কভারেজ কমে যায়, তাহলে চাঙ্কের আকার পরিবর্তন করুন অথবা রির্যাঙ্কিং যোগ করুন।
সাধারণ সমস্যা, যা এই টিউটোরিয়ালগুলো আপনাকে এড়াতে সাহায্য করবে
- : খুব ছোট চাঙ্কের কারণে প্রসঙ্গ missing হয় এবং ত্রুটিপূর্ণ উত্তর পাওয়া যায়।
- : বিশাল চাঙ্কগুলো অপ্রাসঙ্গিক টেক্সট দিয়ে কনটেক্সট উইন্ডো দূষিত করে।
- : ডোমেইন-ভাষা (আইনি, ক্লিনিক্যাল) এর জন্য ডোমেইন-টিউনড মডেলের প্রয়োজন হতে পারে।
- : বেসলাইন ছাড়া কিছু পরিবর্তন করলে অলিক রিগ্রেশন তৈরি হয়।
- : পুরোনো ইন্ডেক্সগুলো সঠিক কিন্তু অপ্রচলিত উত্তরের দিকে পরিচালিত করে।
- : প্রত্যাখ্যান বিধি ছাড়া, আপনার মডেল অনুমান করে।
আপনার ব্যবহারের ক্ষেত্রের জন্য সঠিক টিউটোরিয়াল নির্বাচন করা
- : টিউটোরিয়াল 1, 2, 5, 8, 9।
- : টিউটোরিয়াল 1, 3, 4, 7।
- : প্রথমে টিউটোরিয়াল 5 এবং 9, তারপর 7।
উপলক্ষ্যে: Sider.AI দিয়ে দ্রুত প্রোটোটাইপ তৈরি করুন
আপনি যখন RAG প্রম্পটগুলোতে পুনরাবৃত্তি করছেন, প্রশ্নের পরীক্ষা করছেন এবং উত্তরের তুলনা করছেন, তখন প্রসঙ্গ পরিবর্তন করা ব্যয়বহুল। উল্লেখ্য যে: Sider.AI (https://sider.ai/) আপনাকে পাশাপাশি একাধিক মডেলের সাথে চ্যাট করতে, প্রম্পট পিন করতে এবং একটি চলমান জ্ঞান workspace রাখতে দেয়। এটি নিম্নলিখিত কাজের জন্য সুবিধাজনক: - বিভিন্ন রিট্রিভাল সেটিংস এবং প্রম্পট থেকে উত্তরের তুলনা করা।
- RAGFlow-তে পরিবর্তনগুলো বেক করার আগে দ্রুত 'কী হবে' পরীক্ষা চালানো।
- আপনার মূল্যায়ন হার্নেসের জন্য স্নিপেট, উদ্ধৃতি এবং গোল্ড Q&A সাজানো।
RAGFlow টিউটোরিয়াল অনুসরণ করার সময় এটিকে আপনার স্ক্র্যাচপ্যাড হিসাবে ব্যবহার করুন; তারপর আপনার পাইপলাইনে বিজয়ীকে কোডিফাই করুন।
সমস্যা সমাধান গাইড: জিনিসপত্র ভেঙ্গে গেলে দ্রুত সমাধান
- : উত্তরগুলো সাধারণ এবং উদ্ধৃতিবিহীন।
- : প্রম্পটে উদ্ধৃতি আবশ্যক করুন এবং একটি যাচাইকারী নোড যুক্ত করুন।
- : অপ্রাসঙ্গিক চাঙ্ক পুনরুদ্ধার করা হয়েছে।
- : চাঙ্কের ওভারল্যাপ বাড়ান, একটি ভালো এম্বেডিং মডেলে স্যুইচ করুন অথবা রির্যাঙ্কিং যোগ করুন।
- : ভেক্টর ফলাফল ক্যাশে করুন, পুনরুদ্ধার করা চাঙ্ক ক্যাপ করুন এবং স্ট্রিমিং টোকেন ব্যবহার করুন।
- : প্রশ্ন জুড়ে পরস্পরবিরোধী উত্তর।
- : মেটাডেটা স্বাভাবিক করুন, প্রায় অভিন্ন চাঙ্ক ডি-ডুপ্লিকেট করুন, নতুন ডকুমেন্টকে গুরুত্ব দিন।
- : মডেল প্রায়শই "আমি জানি না" বলে প্রত্যাখ্যান করে।
- : প্রত্যাখ্যান থ্রেশহোল্ড হ্রাস করুন, রিট্রিভাল গভীরতা প্রসারিত করুন অথবা চাঙ্কের boundary গুলোকে পরিমার্জিত করুন।
গুরুত্বপূর্ণ বিষয়
- সেরা RAGFlow টিউটোরিয়ালগুলো বাস্তবসম্মত ডেটা এবং মূল্যায়নসহ এন্ড-টু-এন্ড সিস্টেম শেখায়।
- উত্তরের গুণমানের উপর চাঙ্কিং এবং এম্বেডিংয়ের সবচেয়ে বড় প্রভাব রয়েছে।
- উৎপাদন সাফল্যের জন্য ক্যাশিং, অবজার্ভেবিলিটি, গার্ডরেইল এবং একটি গোল্ডেন সেট প্রয়োজন।
- প্রকৃত কাজের জন্য ডোমেইন প্লেবুক এবং ফাংশন কলিং ব্যবহার করে Q&A ছাড়িয়ে যান।
- প্রম্পট এবং ফলাফল দ্রুত তুলনা করতে পরীক্ষামূলক সময়ে Sider.AI-এর মতো সরঞ্জাম ব্যবহার করুন।
পরবর্তী পদক্ষেপ
- আপনার তাৎক্ষণিক প্রয়োজনের সাথে মেলে এমন দুটি টিউটোরিয়াল বেছে নিন (যেমন, কুইকস্টার্ট + চাঙ্কিং মাস্টারক্লাস)।
- আপনার নিজের ডকুমেন্ট থেকে একটি গোল্ড Q&A সেট একত্রিত করুন (50টি প্রশ্ন দিয়ে শুরু করুন)।
- একবারে একটি পরিবর্তন চালান; প্রতিটি পরিবর্তনের পরে গ্রাউন্ডেডনেস এবং লেটেন্সি পরিমাপ করুন।
- যখন আপনার মূল্যায়ন স্থিতিশীল হয়, তখন ক্যাশিং এবং গার্ডরেইলসহ প্রোডাকশন টেমপ্লেটে যান।
- আপনার বেসলাইন নির্ভরযোগ্য হয়ে গেলে ফাংশন কলিং এবং ডোমেইন নীতি যুক্ত করুন।
FAQ
প্রশ্ন ১: একেবারে নতুনদের জন্য সেরা RAGFlow টিউটোরিয়াল কোনটি?
একটি RAGFlow কুইকস্টার্ট টিউটোরিয়াল দিয়ে শুরু করুন, যাতে একটি PDF গ্রহণ, চাঙ্কিং, এম্বেডিং, ইনডেক্সিং, পুনরুদ্ধার এবং উদ্ধৃতিসহ জেনারেট করা কভার করে। এটি আপনাকে দ্রুত একটি এন্ড-টু-এন্ড অনুভূতি দেবে এবং আপনাকে গভীর RAGFlow টিউটোরিয়ালের জন্য প্রস্তুত করবে।প্রশ্ন ২: মৌলিক টিউটোরিয়ালগুলো ছাড়িয়ে আমি কীভাবে RAGFlow-এর নির্ভুলতা উন্নত করব?
চাঙ্কিং কৌশল, এম্বেডিংয়ের গুণমান এবং রির্যাঙ্কিংয়ের উপর মনোযোগ দিন। উন্নত RAGFlow টিউটোরিয়ালগুলো হ্যালুসিনেশন কমাতে এবং গ্রাউন্ডেডনেস পরিমাণ করতে গার্ডরেইল এবং মূল্যায়ন হার্নেস যোগ করার পদ্ধতিও দেখায়।প্রশ্ন ৩: এন্টারপ্রাইজ ডক্সের জন্য RAGFlow-এর সাথে কোন এম্বেডিংগুলো সবচেয়ে ভালো কাজ করে?
text-embedding-3-large, E5 বা BGE-এর মতো শক্তিশালী সাধারণ মডেল ব্যবহার করে দেখুন, তারপর আপনার ডেটাতে রিট্রিভাল মেট্রিক পরিমাপ করুন। সেরা RAGFlow টিউটোরিয়ালগুলো মডেল এবং ভেক্টর স্টোর জুড়ে A/B পরীক্ষা করার পরামর্শ দেয়, যাতে বিজয়ীকে বেছে নেওয়া যায়।প্রশ্ন ৪: RAGFlow কি ডকুমেন্টের পাশাপাশি SQL-এর মতো স্ট্রাকচার্ড ডেটা পরিচালনা করতে পারে?
হ্যাঁ। RAGFlow-এর জন্য হাইব্রিড রিট্রিভাল টিউটোরিয়ালগুলো দেখায় কিভাবে ফাংশন কলিংয়ের মাধ্যমে পরিমাণগত প্রশ্নগুলোকে SQL-এ রুট করা যায়, যেখানে অসংগঠিত ডক্সের জন্য সিম্যান্টিক রিট্রিভাল ব্যবহার করা হয় এবং জেনারেশনের সময় ফলাফল মার্জ করা হয়।প্রশ্ন ৫: লাইভ হওয়ার আগে আমি কীভাবে একটি RAGFlow পাইপলাইন মূল্যায়ন করব?
মূল্যায়ন-কেন্দ্রিক RAGFlow টিউটোরিয়াল অনুসরণ করুন: উৎসসহ একটি গোল্ডেন Q&A সেট তৈরি করুন, পরিবর্তনের পরে স্বয়ংক্রিয় পরীক্ষা চালান এবং গ্রাউন্ডেডনেস, উদ্ধৃতি কভারেজ, লেটেন্সি এবং হেল্পফুলনেস ট্র্যাক করুন। মেট্রিক স্থিতিশীল হলেই শুধুমাত্র ডেপ্লয় করুন।