SillyTavern कसे वापरावे: सेटअप, मॉडेल्स आणि प्रगत आरपी वैशिष्ट्यांसाठी एक व्यावहारिक मार्गदर्शक
तुम्ही बऱ्याच चर्चा ऐकल्या असतील: SillyTavern हे मोठ्या भाषिक मॉडेल्स (large language models) वापरून रोलप्ले (roleplay) आणि चॅट (chat) करण्यासाठी सर्वात लवचिक फ्रंट-एंडपैकी एक आहे. परंतु सुरुवात कुठून करावी, कोणते मॉडेल वापरावे आणि काहीही बिघडवता त्याच्या सर्वोत्तम वैशिष्ट्यांचा वापर कसा करावा? हे मार्गदर्शक तुम्हाला स्टेप बाय स्टेप (step by step) मार्गदर्शन करेल - कोणताही अनावश्यक भाग नाही, फक्त इंस्टॉलेशनपासून (installation) ते प्रो-लेव्हल (pro-level) सेशनपर्यंत (session) एक व्यावहारिक, सोल्यूशन-ओरिएंटेड (solution-oriented) मार्ग.
SillyTavern म्हणजे काय—आणि ते का वापरावे?
SillyTavern हे LLM (एलएलएम) सोबत संवाद साधण्यासाठी एक शक्तिशाली, कस्टमाइज करण्यायोग्य (customizable) UI (यूआय) आहे - होस्टेड (hosted) API (एपीआय) आणि लोकल (local) मॉडेल दोन्हीसाठी. हे इमर्सिव्ह (immersive) चॅट, कॅरेक्टर रोलप्ले (character roleplay), वर्ल्ड बिल्डिंग (worldbuilding) आणि स्टोरी कोलॅबोरेशनसाठी (story collaboration) तुमचे कंट्रोल रूम (control room) आहे, असे समजा. हे OpenAI, Anthropic आणि Google सारख्या API ला किंवा KoboldAI आणि oobabooga/text-generation-webui (TGI/ExLlama, इत्यादी) सारख्या लोकल बॅकएंडला (local backend) कनेक्ट (connect) करते, ज्यामुळे तुम्ही तुमच्या सेशनचा (session) अनुभव, मेमरी (memory) आणि शैली व्यवस्थित ऍडजस्ट (adjust) करू शकता. हे सोपे असूनही सखोल करण्यासाठी डिझाइन (design) केलेले आहे, जसे की कॅरेक्टर कार्ड्स (character cards), दीर्घकालीन मेमरी (long-term memory), एक्सटेंशन (extensions) आणि प्रॉम्प्ट (prompts) आणि सॅम्पलिंगसाठी (sampling) ग्रॅन्युलर कंट्रोल (granular control) सारखी वैशिष्ट्ये आहेत.
क्विक सेटअप (Quick Setup): झिरो (Zero) पासून फर्स्ट चॅटपर्यंत (First Chat)
या सरळ पद्धतीने पुढे जा. एकदा का तुम्ही व्यवस्थित सेट झालात की, तुम्ही नंतर ऍडव्हान्स सेटिंग्जला (advanced settings) भेट देऊ शकता.
1) इंस्टॉल (Install) आणि लॉन्च (Launch) करा
- SillyTavern च्या GitHub (गीटहब) रेपोमधून (repo) (किंवा मेंटेन (maintained) केलेल्या फोर्कमधून (fork)) क्लोन (clone) करा किंवा डाउनलोड (download) करा आणि तुमच्या OS (ओ एस) साठी दिलेली स्टार्टअप स्क्रिप्ट (startup script) फॉलो (follow) करा. विंडोजमध्ये (Windows), लोकल वेब सर्व्हर (local web server) सुरू करण्यासाठी तुम्ही सामान्यतः
start.bat रन (run) करता; macOS/Linux (मॅक ओएस/लिनक्स) वर, start.sh स्क्रिप्ट (script) सामान्य आहे.
- UI (यूआय) एक्सेस (access) करण्यासाठी टर्मिनलमध्ये (terminal) दर्शविलेले लोकल URL (यूआरएल) ओपन (open) करा (सामान्यतः ` किंवा SillyTavern ने प्रिंट (print) केलेला पोर्ट (port)).
टीप: तुमचे SillyTavern फोल्डर (folder) व्यवस्थित ठेवा—कॅरेक्टर कार्ड्स (character cards), प्रीसेट (presets) आणि एक्सटेंशन (extensions) विशिष्ट सबफोल्डरमध्ये (subfolder) असतात, ज्यामुळे बॅकअप (backup) घेणे सोपे होते.
2) तुमचे मॉडेल पाथ (Model Path) निवडा: API (एपीआय) किंवा लोकल (Local)
- होस्टेड API (Hosted API): सुरू करण्यासाठी सर्वात वेगवान; SillyTavern च्या API (एपीआय) सेटिंग्ज पॅनेलमध्ये (settings panel) तुमचा API की (key) एंटर (enter) करा.
- लोकल बॅकएंड (Local backend): प्रायव्हसी (privacy) आणि कंट्रोलसाठी (control) सर्वोत्तम; SillyTavern ला KoboldAI किंवा oobabooga/text-generation-webui सारख्या लोकल सर्व्हरशी (local server) कनेक्ट (connect) करा.
SillyTavern विविध API (एपीआय) प्रोव्हायडर्सना (providers) आणि लोकल कनेक्टर्सना (local connectors) सपोर्ट (support) करते, ज्यामध्ये डॉक्समध्ये (docs) त्यांची ताकद, मर्यादा आणि उपयोगांची नोंद आहे.
3) API (एपीआय) क्रेडेन्शियल्स (Credentials) एंटर (Enter) करा (जर होस्टेड (Hosted) मॉडेल वापरत असाल तर)
- OpenAI, Anthropic, Google (Gemini) आणि इतर API (एपीआय) की (key) SillyTavern च्या कनेक्शन टॅबमध्ये (connection tab) पेस्ट (paste) करून ऍड (add) केले जाऊ शकतात.
- टीप: प्रत्येक प्रोव्हायडरसाठी (provider) प्रीसेट (preset) वापरा; वेगवेगळे मॉडेल (model) सिस्टीम प्रॉम्प्ट (system prompt), टेम्परेचर (temperature) आणि पेनल्टीजना (penalties) चांगला प्रतिसाद देतात.
समुदायाच्या अहवालांनुसार, Google Gemini Google AI (एआय) स्टुडिओ (studio) की (key) वापरून मोफत वापरले जाऊ शकते, ज्यामुळे ते प्रयोगासाठी एक किफायतशीरStarting (स्टार्टिंग) पॉईंट (point) ठरते.
4) लोकल LLM (एलएलएम) कनेक्ट (Connect) करा (Optional (ऑप्शनल))
- तुमचे लोकल बॅकएंड (local backend) (KoboldAI, text-generation-webui/oobabooga, LM Studio, इत्यादी) सुरू करा आणि ते API (एपीआय) एंडपॉइंट (endpoint) सर्व्ह (serve) करत आहे का ते तपासा.
- SillyTavern मध्ये, संबंधित कनेक्टर (connector) निवडा आणि लोकल URL (यूआरएल) आणि आवश्यक पॅरामीटर्स (parameters) एंटर (enter) करा.
- एक छोटा टेस्ट मेसेज (test message) पाठवून व्हॅलिडेट (validate) करा.
5) कॅरेक्टर (Character) तयार करा किंवा इम्पोर्ट (Import) करा
- सुरवातीपासून तयार करण्यासाठी Characters (कॅरेक्टर्स) → New (न्यू) वर क्लिक (click) करा किंवा तुमच्या लायब्ररीतून (library) कॅरेक्टर कार्ड (character card) (PNG/JSON) इम्पोर्ट (import) करा.
- पर्सोना (persona), डिस्क्रिप्शन (description), सॅम्पल डायलॉग (sample dialogue) आणि डेफिनेशन (definition) फील्ड (field) भरा. जितके जास्त स्पेसिफिक (specific) कॅरेक्टरायझेशन (characterization), तितकीच चांगली RP (आरपी) कंसिस्टेंसी (consistency).
6) चॅटिंग (Chatting) सुरू करा
- तुमचे कॅरेक्टर (character) आणि मॉडेल (model) निवडा, त्यानंतर तुमचा पहिला मेसेज (message) लिहा.
- "चला सीन सेट (scene set) करूया: ." सारखे सॉफ्ट ओपनर (soft opener) वापरा.
- लोकल Llama (लामा)-आधारित मॉडेल (model): प्रायव्हेट (private), कस्टमाइजेबल (customizable); गुणवत्ता क्वांटीझेशन (quantization) आणि फाइन-ट्यूनवर (fine-tune) अवलंबून असते.
- KoboldAI/oobabooga स्टॅक्स (stacks): इन्फरन्स (inference), प्रॉम्प्ट (prompt) फॉरमॅट (format) आणि एक्सटेंशनवर (extension) सखोल नियंत्रण.
SillyTavern चे API (एपीआय) कनेक्शन गाईड (connections guide) एकाच ठिकाणी सपोर्टेड (supported) प्रोव्हायडर्स (providers) आणि चेतावणी दर्शवते.
कॅरेक्टर क्राफ्ट (Character Craft): अशी व्यक्तिमत्त्वे तयार करणे जी इन-कॅरेक्टर (in-character) राहतील
एका चांगल्या सेशनची (session) सुरुवात एका चांगल्या कॅरेक्टर कार्डने (character card) होते.
- पर्सोना (Persona): ओळख, भूमिका, आवाज यावर 2-4 वाक्ये.
- बॅकस्टोरी (Backstory): निर्णायक इतिहासाचे 3-5 बुलेट पॉईंट्स (bullet points); विस्तृत टाइमलाइन (timeline) टाळा.
- ध्येय आणि मर्यादा: इच्छा आणि कॅरेक्टर (character) कोणत्या गोष्टी ओलांडणार नाही हे स्पष्ट करा.
- बोलण्याची पद्धत: वाक्यप्रचार किंवा लकबीची काही उदाहरणे ऍड (add) करा.
- सॅम्पल डायलॉग (Sample Dialogue): टोन (tone), गती आणि भावनिक श्रेणी हायलाइट (highlight) करणारे 3 संवाद.
प्रो टीप (Pro tip): मॉडेलला (model) सतत आठवण करून न देता वर्णनात्मक ठेवण्यासाठी पर्यावरणीय अँकर (environmental anchors) (उदाहरणार्थ, "शहराला पाऊस आणि जुन्या निऑनसारखा वास येतो") ऍड (add) करा.
एक्सटेंशन (Extensions), प्लगइन (Plugins) आणि पॉवर फीचर्स (Power Features)
SillyTavern मध्ये ऍड-ऑनचे (add-ons) इकोसिस्टम (ecosystem) आहे, जे त्याच्या क्षमता वाढवतात:
- मेमरी (Memory) आणि Lorebooks (लोअरबुक्स): ट्रिगर (trigger) आढळल्यास ऑटो-इंजेक्ट (auto-inject) महत्त्वाची तथ्ये.
- वर्ल्ड/स्टोरी टूल्स (World/Story Tools): सीन टेम्प्लेट (scene templates), NPC (एनपीसी) रोस्टर (roster) आणि इव्हेंट प्रॉम्प्ट (event prompts).
- TTS/STT (टीटीएस/एसटीटी): टेक्स्ट-टू-स्पीच (text-to-speech) आणि स्पीच-टू-टेक्स्टने (speech-to-text) तुमचे सेशन (session) व्हॉइस-इनेबल (voice-enable) करा.
- इमेज हुक्स (Image Hooks): काही कनेक्टर (connector) इमेज प्रॉम्प्ट/रिस्पॉन्सला (image prompts/responses) सपोर्ट (support) करतात (मॉडेलवर (model) अवलंबून).
- ऑटोमेशन (Automation): वारंवार येणाऱ्या नॅरेटिव्ह बीट्स (narrative beats) किंवा फॉरमॅटिंगसाठी (formatting) मॅक्रोज (macros).
ऍडव्हान्स इंटिग्रेशन (advanced integrations) सुरू करण्यापूर्वी प्रोव्हायडर-स्पेसिफिक (provider-specific) वैशिष्ट्ये, प्रॉम्प्ट (prompt) फॉरमॅट (format) आणि रेट-लिमिट नोट्ससाठी (rate-limit notes) डॉक्स (docs) तपासा.
सुरक्षितता, फिल्टर (Filter) आणि मर्यादा
- मॉडेल पॉलिसी (Model Policies): API (एपीआय) मॉडेल (model) (उदा. Anthropic, Google) सुरक्षितता नियम लागू करतात जे काही विशिष्ट कंटेंट (content) प्रकारांवर परिणाम करू शकतात. त्यानुसार तुमचे क्रिएटिव्ह (creative) ध्येय ऍडजस्ट (adjust) करा.
- लोकल कंट्रोल (Local Control): लोकल मॉडेल (local model) तुम्हाला अधिक स्वातंत्र्य देतात, परंतु अधिक जबाबदारीही देतात—तुमच्या वैयक्तिक मर्यादा आणि कंटेंट टॅग (content tag) सुरुवातीलाच सेट (set) करा.
- सेशन हायजीन (Session Hygiene): कंटेंट वॉर्निंग (content warnings), ऑप्ट-इन सीन्स (opt-in scenes) आणि स्पष्ट ट्रान्झिशन (transitions) वापरा. काही गडबड झाल्यास, सारांश द्या, टोन (tone) रिसेट (reset) करा आणि परिस्थिती पुन्हा व्यवस्थित करा.
ट्रबलशूटिंग (Troubleshooting): सामान्य समस्यांसाठी जलद उपाय
- मॉडेल (Model) वारंवार रिपीट (repeat) होते किंवा लूप (loop) होते: रेपिटेशन पेनल्टी (repetition penalty) वाढवा, टेम्परेचर (temperature) किंचित कमी करा, मेमरीमध्ये (memory) अधिक ठोस तथ्ये ऍड (add) करा.
- आउट-ऑफ-कॅरेक्टर (out-of-character) प्रतिसाद: कॅरेक्टरचे (character) डेफिनेशन (definition) मजबूत करा आणि 2-3 सॅम्पल डायलॉग (sample dialogue) ऍड (add) करा; सिस्टीम प्रॉम्प्ट (system prompt) अधिक कडक करा.
- खर्च वाढतो (API (एपीआय) वापर): कॉन्टेक्स्ट लेंथ (context length) कमी करा, छोटे रिप्लाय (replies) सुरू करा, वेळोवेळी सारांश द्या किंवा फिलर सीन्ससाठी (filler scenes) कमी किमतीचे मॉडेल (model) वापरा.
- लोकल मॉडेल (local model) स्लो (slow) आहे: लहान क्वांटीझेशन (quantization) वापरून पहा, GPU (जीपीयू) ऍक्सिलरेशन (acceleration) सुरू करा किंवा कमाल टोकन (tokens) कमी करा.
- कनेक्शन एरर (Connection errors): प्रोव्हायडर URL (provider URL), की (key) व्हॅलिडिटी (validity) आणि मॉडेलचे (model) नाव पुन्हा तपासा. अचूक पॅरामीटर्ससाठी (parameters) API (एपीआय) कनेक्शन पेज (connection page) पहा.
10-मिनिटांचा स्टार्टर वर्कफ्लो (Starter Workflow) (हे कॉपी (copy) करा)
- एक प्रोव्हायडर (provider) निवडा (उदा. कमी किमतीच्या टेस्टसाठी (test) Gemini किंवा लांब स्टोरी आर्क्ससाठी (story arcs) Claude).
- पर्सोना (persona), बॅकस्टोरी बुलेट्स (backstory bullets) आणि 3 सॅम्पल डायलॉगसह (sample dialogue) एक कॅरेक्टर (character) तयार करा.
- टेम्परेचर (temperature) 0.8, टॉप-पी (Top-p) 0.9, रेपिटेशन पेनल्टी (repetition penalty) मध्यम सेट (set) करा.
- एक लहान मेमरी बुक (memory book) ऍड (add) करा: सेटिंग (setting), रिलेशनशिप (relationship), ऍक्टिव्ह (active) ध्येय.
- स्पष्ट सीन सेटअप (scene setup) आणि इच्छित टोनने (tone) चॅट (chat) सुरू करा.
- 10 मेसेज (message) नंतर, चॅट (chat) एक्सपोर्ट (export) करा, दोन सुधारणा लिहा आणि कॅरेक्टर कार्ड (character card) अपडेट (update) करा.
ही प्रक्रिया पुन्हा करा आणि तुम्हाला नाटकीय कंसिस्टेंसी (consistency) वाढ दिसून येईल.
मॉडेल-स्पेसिफिक टिप्स (Model-Specific Tips) (चीट शीट (Cheat Sheet))
- OpenAI: संक्षिप्त सिस्टीम प्रॉम्प्ट (system prompt) आवडतात;Numbered (नंबर) असलेल्या स्टेप्सने (steps) सूचना स्पष्टपणे फॉरमॅट (format) करा.
- Claude: मल्टी-पॅराग्राफ (multi-paragraph) ब्रीफ्सवर (briefs) भरभराट होते; नॅरेटिव्ह (narrative) सातत्य आणि सारांशासाठी उत्तम.
- Gemini: स्ट्रक्चर्ड प्रॉम्प्ट्स (structured prompts) आणि स्पष्ट मर्यादांसह चांगले काम करते; फ्री-टियर (free-tier) कोटा (quota) तपासा.
- लोकल Llama (लामा): इंस्ट्रक्ट-ट्यून (instruct-tuned) केलेले प्रकार वापरा; स्पीड/क्वालिटीसाठी (speed/quality) 2-3 क्वांटीझेशन (quantization) टेस्ट (test) करा.
बॅकअप (Backups), एक्सपोर्ट (Exports) आणि ऑर्गनायझेशन (Organization)
- लोअरच्या (lore) क्रॉस-कंटॅमिनेशनला (cross-contamination) प्रतिबंध (prevent) करण्यासाठी प्रत्येक "युनिव्हर्स" (universe) साठी वेगळे फोल्डर (folder) वापरा.
- नियमितपणे चॅट (chat) (JSON/HTML) एक्सपोर्ट (export) करा आणि तुमच्या कॅरेक्टर कार्डांचे (character cards) स्नॅपशॉट (snapshot) घ्या.
- सॅम्पलिंग सेटिंग्ज (sampling settings), मॉडेल व्हर्जन (model versions) आणि उल्लेखनीय सेशन (session) रेकॉर्ड (record) करणारे एक "मेटा (meta)" डॉक्युमेंट (document) ठेवा.
लक्षात घेण्यासारखे: Sider.AI सह तुमचा वर्कफ्लो (workflow) जलद करणे
जर तुम्ही SillyTavern बाहेर कॅरेक्टर बायो (character bios), सीन आऊटलाइन (scene outlines) किंवा लोअर स्निपेट्सचा (lore snippets) मसुदा तयार करत असाल, तर एक साइडबार असिस्टंट (sidebar assistant) तुम्हाला लवकर पुनरावृत्ती (iterate) करण्यात मदत करू शकते. Sider.AI चा इन-ब्राउझर असिस्टंट (in-browser assistant) लांब ट्रान्सक्रिप्टचा (transcripts) सारांश देऊ शकतो, कॅरेक्टर क्वर्कचा (character quirks) प्रस्ताव देऊ शकतो किंवा सीन सीड्स (scene seeds) जनरेट (generate) करू शकतो, त्यानंतर तुम्ही निकाल थेट SillyTavern मध्ये पेस्ट (paste) करू शकता. हे वर्ल्ड बिल्डिंग (worldbuilding) आणि प्रॉम्प्ट पॉलिशिंगसाठी (prompt polishing) एक उपयुक्त प्री-प्रोडक्शन कंपेनियन (pre-production companion) आहे. महत्वाचे मुद्दे
- सोप्या पद्धतीने सुरुवात करा: एक प्रोव्हायडर (provider), एक कॅरेक्टर (character) आणि एक लहान मेमरी बुक (memory book) निवडा.
- कंट्रोल (control) महत्त्वाचा आहे: सिस्टीम प्रॉम्प्ट (system prompt), सॅम्पलिंग (sampling) आणि मेमरी (memory) कंसिस्टेंसीला (consistency) आकार देतात.
- ध्येयानुसार मॉडेल (model) निवडा: नॅरेटिव्ह लेंथ (narrative length), खर्च, क्रिएटिव्हिटी (creativity) किंवा प्रायव्हसी (privacy).
- पुनरावृत्ती करा: तुमचा कॅरेक्टर कार्ड (character card) आणि प्रीसेट (preset) एक्सपोर्ट (export) करा, तपासा आणि रिफाइन (refine) करा.
संसाधने
- SillyTavern API (एपीआय) कनेक्शनचा (connections) आढावा: सपोर्टेड (supported) प्रोव्हायडर (provider), मर्यादा आणि नोट्स.
- सर्वोत्तम मॉडेल (model) आणि Gemini सारख्या फ्री/कमी किमतीच्या पर्यायांवर सामुदायिक चर्चा.
- रोलप्ले (roleplay) आणि चॅटसाठी (chat) LLM (एलएलएम) फ्रंटएंड (frontend) म्हणून SillyTavern चा GitHub (गीटहब) आढावा.
FAQ (एफएक्यू)
प्रश्न 1: मी SillyTavern ला OpenAI, Claude किंवा Gemini शी कसे कनेक्ट (connect) करू?
SillyTavern चे API (एपीआय) सेटिंग्ज (settings) ओपन (open) करा आणि प्रत्येक प्रोव्हायडरसाठी (provider) तुमच्या API (एपीआय) की (key) पेस्ट (paste) करा, त्यानंतर मॉडेलचे (model) नाव सिलेक्ट (select) करा आणि सेव्ह (save) करा. ऑफिशियल (official) API (एपीआय) कनेक्शन गाईडमध्ये (connections guide) सपोर्टेड (supported) प्रोव्हायडर (provider) आणि पॅरामीटर्सची (parameters) लिस्ट (list) आहे, जे तुम्हाला सेट (set) करावे लागतील.
प्रश्न 2: मी Llama (लामा) सारख्या लोकल मॉडेलसह (local model) SillyTavern वापरू शकतो का?
होय. KoboldAI किंवा oobabooga/text-generation-webui सारखे लोकल बॅकएंड (local backend) रन (run) करा, त्यानंतर SillyTavern ला लोकल सर्व्हर URL (local server URL) दाखवा. बॅकएंड (backend) API (एपीआय) एंडपॉइंट (endpoint) एक्सपोज (expose) करत आहे आणि एक सुसंगत इंस्ट्रक्ट-ट्यून (instruct-tuned) मॉडेल (model) वापरत आहे याची खात्री करा.
प्रश्न 3: SillyTavern मध्ये रोलप्ले (roleplay) कंसिस्टेंसी (consistency) सुधारण्यासाठी कोणती सेटिंग्ज (settings) आहेत?
सिस्टीम प्रॉम्प्ट (system prompt) रिफाइन (refine) करा, कॅरेक्टर कार्डमध्ये (character card) सॅम्पल डायलॉग (sample dialogue) ऍड (add) करा आणि तथ्ये आणि रिलेशनशिपसाठी (relationship) एक लहान मेमरी बुक (memory book) वापरा. क्रिएटिव्हिटी (creativity) आणि कोहिरन्समध्ये (coherence) बॅलन्स (balance) साधण्यासाठी टेम्परेचर (temperature), टॉप-पी (Top-p) आणि रेपिटेशन पेनल्टी (repetition penalties) ट्यून (tune) करा.
प्रश्न 4: SillyTavern मध्ये लाँग-फॉर्म स्टोरीटेलिंगसाठी (long-form storytelling) कोणते मॉडेल (model) सर्वोत्तम आहे?
लाँग-कॉन्टेक्स्ट (long-context) नॅरेटिव्ह (narrative) कोहिरन्ससाठी (coherence) Claude मॉडेल (model) मजबूत आहेत, तर OpenAI आणि Gemini सामान्य चॅटसाठी (chat) बहुमुखी आणि किफायतशीर आहेत. जर तुम्ही ट्यून (tune) करण्यास सोयीस्कर असाल तर लोकल Llama (लामा) मॉडेल (model) प्रायव्हसीसाठी (privacy) उत्तम आहेत.
प्रश्न 5: SillyTavern मध्ये API (एपीआय) मॉडेलसह (model) टोकन (token) खर्च कसा कमी करावा?
कॉन्टेक्स्ट लेंथ (context length) कमी करा, संक्षिप्त रिप्लाय (replies) सुरू करा आणि वेळोवेळी आर्क्सचा (arcs) सारांश द्या. तुम्ही फिलर सीन्ससाठी (filler scenes) कमी किमतीचे मॉडेल (model) वापरू शकता आणि महत्त्वाच्या क्षणांसाठी प्रीमियम मॉडेल (premium model) ठेवू शकता.