SillyTavern কীভাবে ব্যবহার করবেন: সেটআপ, মডেল এবং অ্যাডভান্সড আরপি ফিচারের একটি ব্যবহারিক গাইড
আপনি শুনেছেন নিশ্চয়ই: SillyTavern হল লার্জ ল্যাঙ্গুয়েজ মডেলের সাথে রোলপ্লে এবং চ্যাটের জন্য সবচেয়ে ফ্লেক্সিবল ফ্রন্ট-এন্ডগুলোর মধ্যে একটি। কিন্তু আপনি কোথা থেকে শুরু করবেন, কোন মডেলগুলো ব্যবহার করবেন, এবং কোনো কিছু ভেঙে না ফেলে এর সেরা ফিচারগুলো কীভাবে আনলক করবেন? এই গাইডটি আপনাকে ধাপে ধাপে পথ দেখাবে—কোনো অতিরিক্ত বিষয় নয়, শুধুমাত্র ইন্সটলেশন থেকে শুরু করে প্রো-লেভেলের সেশন পর্যন্ত একটি ব্যবহারিক, সমাধান-ভিত্তিক পথ।
SillyTavern কী—এবং কেন এটি ব্যবহার করবেন?
SillyTavern হল LLM-এর সাথে ইন্টার্যাক্ট করার জন্য একটি শক্তিশালী, কাস্টমাইজেবল UI—হোস্টেড API এবং লোকাল মডেল উভয়ই। এটিকে নিমজ্জনমূলক চ্যাট, ক্যারেক্টার রোলপ্লে, ওয়ার্ল্ডবিল্ডিং এবং স্টোরি কোলাবরেশনের জন্য আপনার কন্ট্রোল রুম হিসেবে ভাবুন। এটি OpenAI, Anthropic, এবং Google-এর মতো API-এর সাথে অথবা KoboldAI এবং oobabooga/text-generation-webui (TGI/ExLlama, ইত্যাদি)-এর মতো লোকাল ব্যাকএন্ডের সাথে কানেক্ট করে, যা আপনাকে আপনার সেশনের ভাইব, মেমরি এবং স্টাইল ফাইন-টিউন করতে দেয়। এটি এমনভাবে ডিজাইন করা হয়েছে যা একইসাথে সহজলভ্য এবং গভীর, ক্যারেক্টার কার্ড, লং-টার্ম মেমরি, এক্সটেনশন এবং প্রম্পট ও স্যাম্পলিংয়ের জন্য গ্রানুলার কন্ট্রোলের মতো ফিচার সহ।
দ্রুত সেটআপ: জিরো থেকে প্রথম চ্যাট
এই স্ট্রিমলাইনড ফ্লো অনুসরণ করুন। আপনি স্বচ্ছন্দ হয়ে গেলে পরে অ্যাডভান্সড সেটিংসগুলো পুনরায় দেখতে পারেন।
1) ইন্সটল এবং লঞ্চ করুন
- SillyTavern-এর GitHub রিপো (অথবা একটি মেইনটেইনড ফর্ক) থেকে ক্লোন বা ডাউনলোড করুন এবং আপনার OS-এর জন্য অন্তর্ভুক্ত স্টার্টআপ স্ক্রিপ্ট অনুসরণ করুন। উইন্ডোজে, লোকাল ওয়েব সার্ভার চালু করার জন্য আপনি সাধারণত একটি
start.bat চালান; macOS/Linux-এ, একটি start.sh স্ক্রিপ্ট সাধারণ।
- UI অ্যাক্সেস করার জন্য টার্মিনালে দেখানো লোকাল URL খুলুন (সাধারণত ` অথবা SillyTavern যে পোর্ট প্রিন্ট করে)।
টিপ: আপনার SillyTavern ফোল্ডারটি পরিপাটি রাখুন—ক্যারেক্টার কার্ড, প্রিসেট এবং এক্সটেনশনগুলো অনুমানযোগ্য সাবফোল্ডারে থাকে, যা ব্যাকআপ নেওয়া সহজ করে।
2) আপনার মডেল পাথ বাছাই করুন: API অথবা লোকাল
- হোস্টেড API: শুরু করার জন্য দ্রুততম; SillyTavern-এর API সেটিংস প্যানেলে আপনার API কী প্রবেশ করান।
- লোকাল ব্যাকএন্ড: প্রাইভেসি এবং কন্ট্রোলের জন্য সেরা; KoboldAI অথবা oobabooga/text-generation-webui-এর মতো একটি লোকাল সার্ভারের সাথে SillyTavern কানেক্ট করুন।
SillyTavern বিস্তৃত API প্রদানকারী এবং লোকাল কানেক্টর সমর্থন করে, ডকুমেন্টেশনে সুবিধা, অসুবিধা এবং ব্যবহারের ক্ষেত্রগুলো উল্লেখ করা আছে।
3) API ক্রেডেনশিয়াল প্রবেশ করান (যদি হোস্ট করা মডেল ব্যবহার করেন)
- OpenAI, Anthropic, Google (Gemini), এবং অন্যান্যদের SillyTavern-এর কানেকশন ট্যাবে API কী পেস্ট করে যোগ করা যেতে পারে।
- টিপ: প্রদানকারী-ভিত্তিক প্রিসেট ব্যবহার করুন; বিভিন্ন মডেল সামান্য ভিন্ন সিস্টেম প্রম্পট, টেম্পারেচার এবং পেনাল্টির প্রতি ভালোভাবে সাড়া দেয়।
কমিউনিটির রিপোর্ট অনুযায়ী Google AI Studio কী দিয়ে Google-এর Gemini বিনামূল্যে ব্যবহার করা যেতে পারে, যা পরীক্ষার জন্য একটি সাশ্রয়ী শুরুর বিন্দু তৈরি করে।
4) লোকাল LLM-এর সাথে কানেক্ট করুন (ঐচ্ছিক)
- আপনার লোকাল ব্যাকএন্ড শুরু করুন (KoboldAI, text-generation-webui/oobabooga, LM Studio, ইত্যাদি) এবং যাচাই করুন যে এটি একটি API এন্ডপয়েন্ট সার্ভ করছে।
- SillyTavern-এ, সংশ্লিষ্ট কানেক্টরটি বেছে নিন এবং লোকাল URL ও প্রয়োজনীয় প্যারামিটারগুলো প্রবেশ করান।
- একটি ছোট টেস্ট মেসেজ পাঠিয়ে যাচাই করুন।
5) একটি ক্যারেক্টার তৈরি করুন অথবা ইম্পোর্ট করুন
- স্ক্র্যাচ থেকে তৈরি করতে Characters → New-এ ক্লিক করুন, অথবা আপনার লাইব্রেরি থেকে একটি ক্যারেক্টার কার্ড (PNG/JSON) ইম্পোর্ট করুন।
- পার্সোনা, ডেসক্রিপশন, স্যাম্পল ডায়ালগ এবং ডেফিনিশন ফিল্ড পূরণ করুন। ক্যারেক্টারাইজেশন যত নির্দিষ্ট হবে, RP কনসিস্টেন্সি তত ভালো হবে।
6) চ্যাটিং শুরু করুন
- আপনার ক্যারেক্টার এবং মডেল বাছাই করুন, তারপর আপনার প্রথম মেসেজ লিখুন।
- একটি নরম ওপেনার ব্যবহার করুন যেমন: “আসুন সিন সেট করি: .
- লোকাল Llama-ভিত্তিক মডেল: প্রাইভেট, কাস্টমাইজেবল; গুণমান কোয়ান্টাইজেশন এবং ফাইন-টিউনের উপর নির্ভর করে।
- KoboldAI/oobabooga স্ট্যাক: ইনফারেন্স, প্রম্পট ফরম্যাট এবং এক্সটেনশনের উপর গভীর নিয়ন্ত্রণ।
SillyTavern-এর API কানেকশন গাইড এক জায়গায় সমর্থিত প্রদানকারী এবং সতর্কতাগুলোর রূপরেখা দেয়।
ক্যারেক্টার ক্রাফট: এমন ব্যক্তিত্ব তৈরি করা যা ইন-ক্যারেক্টার থাকে
একটি দারুণ সেশন একটি দারুণ ক্যারেক্টার কার্ড দিয়ে শুরু হয়।
- পার্সোনা: পরিচয়, ভূমিকা, কণ্ঠের উপর ২-৪টি বাক্য।
- ব্যাকস্টোরি: গঠনমূলক ইতিহাসের ৩-৫টি বুলেট পয়েন্ট; বিস্তারিত টাইমলাইন এড়িয়ে চলুন।
- লক্ষ্য এবং সীমা: ক্যারেক্টারের আকাঙ্ক্ষা এবং সীমা স্পষ্ট করুন যা সে অতিক্রম করবে না।
- কথোপকথনের ধরণ: ইডিওম বা অদ্ভুত আচরণের কয়েকটি উদাহরণ যোগ করুন।
- স্যাম্পল ডায়ালগ: স্বর, গতি এবং ইমোশনাল রেঞ্জ হাইলাইট করে ৩টি কথোপকথন।
প্রো টিপ: এনভায়রনমেন্টাল অ্যাংকর যোগ করুন (যেমন, “শহরটিতে বৃষ্টি এবং পুরনো নিয়নের গন্ধ”) মডেলটিকে ক্রমাগত রিমাইন্ডার ছাড়াই বর্ণনাকারী রাখতে।
এক্সটেনশন, প্লাগইন এবং পাওয়ার ফিচার
SillyTavern-এর অ্যাড-অন-এর একটি ইকোসিস্টেম রয়েছে যা এর ক্ষমতা বাড়ায়:
- মেমরি এবং লোরবুক: ট্রিগার সনাক্ত করা গেলে স্বয়ংক্রিয়ভাবে মূল তথ্য প্রবেশ করানো হয়।
- ওয়ার্ল্ড/স্টোরি সরঞ্জাম: সিন টেমপ্লেট, NPC রোস্টার এবং ইভেন্ট প্রম্পট।
- TTS/STT: টেক্সট-টু-স্পিচ এবং স্পিচ-টু-টেক্সট দিয়ে আপনার সেশনকে ভয়েস-এনেবল করুন।
- ইমেজ হুক: কিছু কানেক্টর ইমেজ প্রম্পট/রেসপন্স সমর্থন করে (মডেল নির্ভরশীল)।
- অটোমেশন: পুনরাবৃত্তিমূলক ন্যারেটিভ বিট বা ফরম্যাটিংয়ের জন্য ম্যাক্রো।
অ্যাডভান্সড ইন্টিগ্রেশন সক্ষম করার আগে প্রদানকারী-নির্দিষ্ট ফিচার, প্রম্পট ফরম্যাট এবং রেট-লিমিট নোটের জন্য ডক্স দেখুন।
নিরাপত্তা, ফিল্টার এবং সীমা
- মডেল পলিসি: API মডেল (যেমন, Anthropic, Google) নিরাপত্তা বিধি প্রয়োগ করে যা নির্দিষ্ট কনটেন্ট টাইপকে প্রভাবিত করতে পারে। সেই অনুযায়ী আপনার ক্রিয়েটিভ লক্ষ্যগুলো সামঞ্জস্য করুন।
- লোকাল কন্ট্রোল: লোকাল মডেল আপনাকে আরও বেশি স্বাধীনতা দেয় তবে আরও বেশি দায়িত্বও দেয়—সামনে থেকে ব্যক্তিগত সীমা এবং কনটেন্ট ট্যাগ সেট করুন।
- সেশন হাইজিন: কনটেন্ট ওয়ার্নিং, অপ্ট-ইন সিন এবং স্পষ্ট ট্রানজিশন ব্যবহার করুন। যদি কোনো কিছু লাইনচ্যুত হয়, তাহলে সারসংক্ষেপ করুন, টোন রিসেট করুন এবং পরিস্থিতিটিকে পুনরায় অ্যাংকর করুন।
সমস্যা সমাধান: সাধারণ সমস্যার দ্রুত সমাধান
- মডেলটি পুনরাবৃত্তি করে বা লুপ করে: রিপিটেশন পেনাল্টি বাড়ান, টেম্পারেচার সামান্য কমান, মেমরিতে আরও বেশি গ্রাউন্ডিং ফ্যাক্ট যোগ করুন।
- আউট-অফ-ক্যারেক্টার রেসপন্স: ক্যারেক্টারের সংজ্ঞা শক্তিশালী করুন এবং ২-৩টি স্যাম্পল ডায়ালগ যোগ করুন; সিস্টেম প্রম্পট টাইট করুন।
- খরচ বেড়ে যায় (API ব্যবহার): কনটেক্সট লেন্থ কমান, ছোট রিপ্লাই সক্ষম করুন, পর্যায়ক্রমে সারসংক্ষেপ করুন অথবা ফিলার সিনের জন্য কম খরচের মডেলে স্যুইচ করুন।
- লোকাল মডেল ধীর গতির: একটি ছোট কোয়ান্টাইজেশন চেষ্টা করুন, GPU অ্যাক্সিলারেশন সক্ষম করুন অথবা সর্বোচ্চ টোকেন কমান।
- কানেকশন এরর: প্রদানকারীর URL, কী ভ্যালিডিটি এবং মডেলের নাম পুনরায় পরীক্ষা করুন। সঠিক প্যারামিটারের জন্য API কানেকশন পেজ দেখুন।
একটি ১০-মিনিটের স্টার্টার ওয়ার্কফ্লো (এটি কপি করুন)
- একটি প্রদানকারী বাছাই করুন (যেমন, কম খরচের পরীক্ষার জন্য Gemini অথবা দীর্ঘ গল্পের জন্য Claude)।
- পার্সোনা, ব্যাকস্টোরি বুলেট এবং ৩টি স্যাম্পল ডায়ালগ দিয়ে একটি ক্যারেক্টার তৈরি করুন।
- টেম্পারেচার 0.8, Top-p 0.9, রিপিটেশন পেনাল্টি মিডিয়াম সেট করুন।
- একটি ছোট মেমরি বুক যোগ করুন: সেটিং, সম্পর্ক, সক্রিয় লক্ষ্য।
- একটি স্পষ্ট সিন সেটআপ এবং কাঙ্ক্ষিত টোন দিয়ে চ্যাট শুরু করুন।
- ১০টি মেসেজের পর, চ্যাট এক্সপোর্ট করুন, দুটি ইম্প্রুভমেন্ট লিখে রাখুন এবং ক্যারেক্টার কার্ড আপডেট করুন।
এই লুপটি পুনরাবৃত্তি করুন এবং আপনি নাটকীয় কনসিস্টেন্সি লাভ দেখতে পাবেন।
মডেল-স্পেসিফিক টিপস (চিট শীট)
- OpenAI: সংক্ষিপ্ত সিস্টেম প্রম্পট পছন্দ করে;numbered স্টেপ দিয়ে স্পষ্টভাবে নির্দেশাবলী ফরম্যাট করুন।
- Claude: মাল্টি-প্যারাগ্রাফ ব্রিফের উপর উন্নতি লাভ করে; ন্যারেটিভ কন্টিনিউটি এবং সারসংক্ষেপের জন্য দারুণ।
- Gemini: স্ট্রাকচার্ড প্রম্পট এবং সুস্পষ্ট সীমাবদ্ধতার সাথে ভালোভাবে কাজ করে; ফ্রি-টিয়ার কোটাগুলো পরীক্ষা করুন।
- লোকাল Llama: ইন্সট্রাক্ট-টিউনড ভ্যারিয়েন্ট ব্যবহার করুন; স্পিড/কোয়ালিটির জন্য ২-৩টি কোয়ান্টাইজেশন পরীক্ষা করুন।
ব্যাকআপ, এক্সপোর্ট এবং অর্গানাইজেশন
- লোরের ক্রস-কন্টামিনেশন প্রতিরোধ করতে প্রতিটি "ইউনিভার্স"-এর জন্য আলাদা ফোল্ডার ব্যবহার করুন।
- নিয়মিত চ্যাট এক্সপোর্ট করুন (JSON/HTML) এবং আপনার ক্যারেক্টার কার্ডের স্ন্যাপশট রাখুন।
- স্যাম্পলিং সেটিংস, মডেল ভার্সন এবং উল্লেখযোগ্য সেশন রেকর্ড করে একটি "মেটা" ডকুমেন্ট রাখুন।
লক্ষ্যণীয়: Sider.AI দিয়ে আপনার ওয়ার্কফ্লো দ্রুত করা
আপনি যদি SillyTavern-এর বাইরে ক্যারেক্টার বায়োস, সিন আউটলাইন বা লোর স্নিপেট ড্রাফট করেন, তাহলে একটি সাইডবার অ্যাসিস্ট্যান্ট আপনাকে দ্রুত পুনরাবৃত্তি করতে সাহায্য করতে পারে। প্রসঙ্গত, Sider.AI-এর ইন-ব্রাউজার অ্যাসিস্ট্যান্ট দীর্ঘ ট্রান্সক্রিপ্ট সারসংক্ষেপ করতে, ক্যারেক্টার কুইর্ক প্রস্তাব করতে বা সিন সিড তৈরি করতে পারে, তারপর আপনি সরাসরি SillyTavern-এ ফলাফল পেস্ট করতে পারেন। এটি ওয়ার্ল্ডবিল্ডিং এবং প্রম্পট পলিশিংয়ের জন্য একটি সুবিধাজনক প্রি-প্রোডাকশন সহযোগী। মূল বিষয়গুলো
- সহজভাবে শুরু করুন: একজন প্রদানকারী, একজন ক্যারেক্টার এবং একটি ছোট মেমরি বুক চয়ন করুন।
- কন্ট্রোলই রাজা: সিস্টেম প্রম্পট, স্যাম্পলিং এবং মেমরি কনসিস্টেন্সি গঠন করে।
- লক্ষ্য অনুযায়ী মডেল বাছাই করুন: ন্যারেটিভ লেন্থ, খরচ, ক্রিয়েটিভিটি অথবা প্রাইভেসি।
- পুনরাবৃত্তি করুন: আপনার ক্যারেক্টার কার্ড এবং প্রিসেট এক্সপোর্ট করুন, পর্যালোচনা করুন এবং পরিমার্জন করুন।
রিসোর্স
- SillyTavern API কানেকশন ওভারভিউ: সমর্থিত প্রদানকারী, সীমা এবং নোট।
- সেরা মডেল এবং Gemini-এর মতো বিনামূল্যে/কম খরচের বিকল্প নিয়ে কমিউনিটি আলোচনা।
- রোলপ্লে এবং চ্যাটের জন্য একটি LLM ফ্রন্টএন্ড হিসেবে SillyTavern-এর GitHub ওভারভিউ।
FAQ
Q1:আমি কিভাবে SillyTavern-কে OpenAI, Claude, অথবা Gemini-এর সাথে কানেক্ট করব?
SillyTavern-এর API সেটিং খুলুন এবং প্রতিটি প্রদানকারীর জন্য আপনার API কী পেস্ট করুন, তারপর মডেলের নাম নির্বাচন করুন এবং সেভ করুন। অফিসিয়াল API কানেকশন গাইড সমর্থিত প্রদানকারী এবং প্যারামিটারগুলো তালিকাভুক্ত করে যা আপনার সেট করার প্রয়োজন হতে পারে।
Q2:আমি কি Llama-এর মতো একটি লোকাল মডেলের সাথে SillyTavern ব্যবহার করতে পারি?
হ্যাঁ। KoboldAI অথবা oobabooga/text-generation-webui-এর মতো একটি লোকাল ব্যাকএন্ড চালান, তারপর SillyTavern-কে লোকাল সার্ভার URL-এর দিকে নির্দেশ করুন। নিশ্চিত করুন যে ব্যাকএন্ড একটি API এন্ডপয়েন্ট উন্মুক্ত করে এবং একটি সামঞ্জস্যপূর্ণ ইন্সট্রাক্ট-টিউনড মডেল ব্যবহার করছে।
Q3:SillyTavern-এ কোন সেটিংস রোলপ্লে কনসিস্টেন্সি উন্নত করে?
সিস্টেম প্রম্পট পরিমার্জন করুন, ক্যারেক্টার কার্ডে স্যাম্পল ডায়ালগ যোগ করুন এবং ফ্যাক্ট ও সম্পর্কের জন্য একটি ছোট মেমরি বুক ব্যবহার করুন। ক্রিয়েটিভিটি এবং কোহেরেন্সের মধ্যে ভারসাম্য রাখতে টেম্পারেচার, Top-p এবং রিপিটেশন পেনাল্টি টিউন করুন।
Q4:SillyTavern-এ দীর্ঘ-ফর্ম স্টোরিটেলিংয়ের জন্য কোন মডেলটি সেরা?
দীর্ঘ-কনটেক্সট ন্যারেটিভ কোহেরেন্সের জন্য Claude মডেল শক্তিশালী, যেখানে OpenAI এবং Gemini বহুমুখী এবং সাধারণ চ্যাটের জন্য সাশ্রয়ী। আপনি যদি টিউনিংয়ে স্বচ্ছন্দ হন তবে লোকাল Llama মডেল প্রাইভেসি জন্য দারুণ।
Q5:SillyTavern-এ API মডেলের সাথে আমি কীভাবে টোকেন খরচ কমাব?
কনটেক্সট লেন্থ ছোট করুন, সংক্ষিপ্ত রিপ্লাই সক্ষম করুন এবং পর্যায়ক্রমে আর্ক সারসংক্ষেপ করুন। আপনি ফিলার সিনের জন্য কম খরচের মডেলে স্যুইচ করতে পারেন এবং গুরুত্বপূর্ণ মুহূর্তের জন্য প্রিমিয়াম মডেল রাখতে পারেন।