How do I connect SillyTavern to OpenAI, Claude, or Gemini?

Open SillyTavern’s API settings and paste your API keys for each provider, then select the model name and save. The official API connections guide lists supported providers and parameters you may need to set.

Can I use SillyTavern with a local model like Llama?

Yes. Run a local backend such as KoboldAI or oobabooga/text-generation-webui, then point SillyTavern to the local server URL. Make sure the backend exposes an API endpoint and is using a compatible instruct-tuned model.

What settings improve roleplay consistency in SillyTavern?

Refine the system prompt, add sample dialogue to the character card, and use a small memory book for facts and relationships. Tune temperature, Top‑p, and repetition penalties to balance creativity and coherence.

Which model is best for long-form storytelling in SillyTavern?

Claude models are strong for long-context narrative coherence, while OpenAI and Gemini are versatile and cost-effective for general chat. Local Llama models are great for privacy if you’re comfortable tuning them.

How do I reduce token costs with API models in SillyTavern?

Shorten context length, enable concise replies, and summarize arcs periodically. You can also switch to lower-cost models for filler scenes and keep premium models for pivotal moments.

SillyTavern कसे वापरावे: सेटअप, मॉडेल्स आणि प्रगत आरपी वैशिष्ट्यांसाठी एक व्यावहारिक मार्गदर्शक

तुम्ही बऱ्याच चर्चा ऐकल्या असतील: SillyTavern हे मोठ्या भाषिक मॉडेल्स (large language models) वापरून रोलप्ले (roleplay) आणि चॅट (chat) करण्यासाठी सर्वात लवचिक फ्रंट-एंडपैकी एक आहे. परंतु सुरुवात कुठून करावी, कोणते मॉडेल वापरावे आणि काहीही बिघडवता त्याच्या सर्वोत्तम वैशिष्ट्यांचा वापर कसा करावा? हे मार्गदर्शक तुम्हाला स्टेप बाय स्टेप (step by step) मार्गदर्शन करेल - कोणताही अनावश्यक भाग नाही, फक्त इंस्टॉलेशनपासून (installation) ते प्रो-लेव्हल (pro-level) सेशनपर्यंत (session) एक व्यावहारिक, सोल्यूशन-ओरिएंटेड (solution-oriented) मार्ग.

SillyTavern म्हणजे काय—आणि ते का वापरावे?

SillyTavern हे LLM (एलएलएम) सोबत संवाद साधण्यासाठी एक शक्तिशाली, कस्टमाइज करण्यायोग्य (customizable) UI (यूआय) आहे - होस्टेड (hosted) API (एपीआय) आणि लोकल (local) मॉडेल दोन्हीसाठी. हे इमर्सिव्ह (immersive) चॅट, कॅरेक्टर रोलप्ले (character roleplay), वर्ल्ड बिल्डिंग (worldbuilding) आणि स्टोरी कोलॅबोरेशनसाठी (story collaboration) तुमचे कंट्रोल रूम (control room) आहे, असे समजा. हे OpenAI, Anthropic आणि Google सारख्या API ला किंवा KoboldAI आणि oobabooga/text-generation-webui (TGI/ExLlama, इत्यादी) सारख्या लोकल बॅकएंडला (local backend) कनेक्ट (connect) करते, ज्यामुळे तुम्ही तुमच्या सेशनचा (session) अनुभव, मेमरी (memory) आणि शैली व्यवस्थित ऍडजस्ट (adjust) करू शकता. हे सोपे असूनही सखोल करण्यासाठी डिझाइन (design) केलेले आहे, जसे की कॅरेक्टर कार्ड्स (character cards), दीर्घकालीन मेमरी (long-term memory), एक्सटेंशन (extensions) आणि प्रॉम्प्ट (prompts) आणि सॅम्पलिंगसाठी (sampling) ग्रॅन्युलर कंट्रोल (granular control) सारखी वैशिष्ट्ये आहेत.

क्विक सेटअप (Quick Setup): झिरो (Zero) पासून फर्स्ट चॅटपर्यंत (First Chat)

या सरळ पद्धतीने पुढे जा. एकदा का तुम्ही व्यवस्थित सेट झालात की, तुम्ही नंतर ऍडव्हान्स सेटिंग्जला (advanced settings) भेट देऊ शकता.

1) इंस्टॉल (Install) आणि लॉन्च (Launch) करा

SillyTavern च्या GitHub (गीटहब) रेपोमधून (repo) (किंवा मेंटेन (maintained) केलेल्या फोर्कमधून (fork)) क्लोन (clone) करा किंवा डाउनलोड (download) करा आणि तुमच्या OS (ओ एस) साठी दिलेली स्टार्टअप स्क्रिप्ट (startup script) फॉलो (follow) करा. विंडोजमध्ये (Windows), लोकल वेब सर्व्हर (local web server) सुरू करण्यासाठी तुम्ही सामान्यतः start.bat रन (run) करता; macOS/Linux (मॅक ओएस/लिनक्स) वर, start.sh स्क्रिप्ट (script) सामान्य आहे.

UI (यूआय) एक्सेस (access) करण्यासाठी टर्मिनलमध्ये (terminal) दर्शविलेले लोकल URL (यूआरएल) ओपन (open) करा (सामान्यतः ` किंवा SillyTavern ने प्रिंट (print) केलेला पोर्ट (port)).

टीप: तुमचे SillyTavern फोल्डर (folder) व्यवस्थित ठेवा—कॅरेक्टर कार्ड्स (character cards), प्रीसेट (presets) आणि एक्सटेंशन (extensions) विशिष्ट सबफोल्डरमध्ये (subfolder) असतात, ज्यामुळे बॅकअप (backup) घेणे सोपे होते.

2) तुमचे मॉडेल पाथ (Model Path) निवडा: API (एपीआय) किंवा लोकल (Local)

होस्टेड API (Hosted API): सुरू करण्यासाठी सर्वात वेगवान; SillyTavern च्या API (एपीआय) सेटिंग्ज पॅनेलमध्ये (settings panel) तुमचा API की (key) एंटर (enter) करा.

लोकल बॅकएंड (Local backend): प्रायव्हसी (privacy) आणि कंट्रोलसाठी (control) सर्वोत्तम; SillyTavern ला KoboldAI किंवा oobabooga/text-generation-webui सारख्या लोकल सर्व्हरशी (local server) कनेक्ट (connect) करा.

SillyTavern विविध API (एपीआय) प्रोव्हायडर्सना (providers) आणि लोकल कनेक्टर्सना (local connectors) सपोर्ट (support) करते, ज्यामध्ये डॉक्समध्ये (docs) त्यांची ताकद, मर्यादा आणि उपयोगांची नोंद आहे.

3) API (एपीआय) क्रेडेन्शियल्स (Credentials) एंटर (Enter) करा (जर होस्टेड (Hosted) मॉडेल वापरत असाल तर)

OpenAI, Anthropic, Google (Gemini) आणि इतर API (एपीआय) की (key) SillyTavern च्या कनेक्शन टॅबमध्ये (connection tab) पेस्ट (paste) करून ऍड (add) केले जाऊ शकतात.

टीप: प्रत्येक प्रोव्हायडरसाठी (provider) प्रीसेट (preset) वापरा; वेगवेगळे मॉडेल (model) सिस्टीम प्रॉम्प्ट (system prompt), टेम्परेचर (temperature) आणि पेनल्टीजना (penalties) चांगला प्रतिसाद देतात.

समुदायाच्या अहवालांनुसार, Google Gemini Google AI (एआय) स्टुडिओ (studio) की (key) वापरून मोफत वापरले जाऊ शकते, ज्यामुळे ते प्रयोगासाठी एक किफायतशीरStarting (स्टार्टिंग) पॉईंट (point) ठरते.

4) लोकल LLM (एलएलएम) कनेक्ट (Connect) करा (Optional (ऑप्शनल))

तुमचे लोकल बॅकएंड (local backend) (KoboldAI, text-generation-webui/oobabooga, LM Studio, इत्यादी) सुरू करा आणि ते API (एपीआय) एंडपॉइंट (endpoint) सर्व्ह (serve) करत आहे का ते तपासा.

SillyTavern मध्ये, संबंधित कनेक्टर (connector) निवडा आणि लोकल URL (यूआरएल) आणि आवश्यक पॅरामीटर्स (parameters) एंटर (enter) करा.

एक छोटा टेस्ट मेसेज (test message) पाठवून व्हॅलिडेट (validate) करा.

5) कॅरेक्टर (Character) तयार करा किंवा इम्पोर्ट (Import) करा

सुरवातीपासून तयार करण्यासाठी Characters (कॅरेक्टर्स) → New (न्यू) वर क्लिक (click) करा किंवा तुमच्या लायब्ररीतून (library) कॅरेक्टर कार्ड (character card) (PNG/JSON) इम्पोर्ट (import) करा.

पर्सोना (persona), डिस्क्रिप्शन (description), सॅम्पल डायलॉग (sample dialogue) आणि डेफिनेशन (definition) फील्ड (field) भरा. जितके जास्त स्पेसिफिक (specific) कॅरेक्टरायझेशन (characterization), तितकीच चांगली RP (आरपी) कंसिस्टेंसी (consistency).

6) चॅटिंग (Chatting) सुरू करा

तुमचे कॅरेक्टर (character) आणि मॉडेल (model) निवडा, त्यानंतर तुमचा पहिला मेसेज (message) लिहा.

"चला सीन सेट (scene set) करूया: ." सारखे सॉफ्ट ओपनर (soft opener) वापरा.

लोकल Llama (लामा)-आधारित मॉडेल (model): प्रायव्हेट (private), कस्टमाइजेबल (customizable); गुणवत्ता क्वांटीझेशन (quantization) आणि फाइन-ट्यूनवर (fine-tune) अवलंबून असते.

KoboldAI/oobabooga स्टॅक्स (stacks): इन्फरन्स (inference), प्रॉम्प्ट (prompt) फॉरमॅट (format) आणि एक्सटेंशनवर (extension) सखोल नियंत्रण.

SillyTavern चे API (एपीआय) कनेक्शन गाईड (connections guide) एकाच ठिकाणी सपोर्टेड (supported) प्रोव्हायडर्स (providers) आणि चेतावणी दर्शवते.

कॅरेक्टर क्राफ्ट (Character Craft): अशी व्यक्तिमत्त्वे तयार करणे जी इन-कॅरेक्टर (in-character) राहतील

एका चांगल्या सेशनची (session) सुरुवात एका चांगल्या कॅरेक्टर कार्डने (character card) होते.

पर्सोना (Persona): ओळख, भूमिका, आवाज यावर 2-4 वाक्ये.

बॅकस्टोरी (Backstory): निर्णायक इतिहासाचे 3-5 बुलेट पॉईंट्स (bullet points); विस्तृत टाइमलाइन (timeline) टाळा.

ध्येय आणि मर्यादा: इच्छा आणि कॅरेक्टर (character) कोणत्या गोष्टी ओलांडणार नाही हे स्पष्ट करा.

बोलण्याची पद्धत: वाक्यप्रचार किंवा लकबीची काही उदाहरणे ऍड (add) करा.

सॅम्पल डायलॉग (Sample Dialogue): टोन (tone), गती आणि भावनिक श्रेणी हायलाइट (highlight) करणारे 3 संवाद.

प्रो टीप (Pro tip): मॉडेलला (model) सतत आठवण करून न देता वर्णनात्मक ठेवण्यासाठी पर्यावरणीय अँकर (environmental anchors) (उदाहरणार्थ, "शहराला पाऊस आणि जुन्या निऑनसारखा वास येतो") ऍड (add) करा.

एक्सटेंशन (Extensions), प्लगइन (Plugins) आणि पॉवर फीचर्स (Power Features)

SillyTavern मध्ये ऍड-ऑनचे (add-ons) इकोसिस्टम (ecosystem) आहे, जे त्याच्या क्षमता वाढवतात:

मेमरी (Memory) आणि Lorebooks (लोअरबुक्स): ट्रिगर (trigger) आढळल्यास ऑटो-इंजेक्‍ट (auto-inject) महत्त्वाची तथ्ये.

वर्ल्ड/स्टोरी टूल्स (World/Story Tools): सीन टेम्प्लेट (scene templates), NPC (एनपीसी) रोस्टर (roster) आणि इव्हेंट प्रॉम्प्ट (event prompts).

TTS/STT (टीटीएस/एसटीटी): टेक्स्ट-टू-स्पीच (text-to-speech) आणि स्पीच-टू-टेक्स्टने (speech-to-text) तुमचे सेशन (session) व्हॉइस-इनेबल (voice-enable) करा.

इमेज हुक्स (Image Hooks): काही कनेक्टर (connector) इमेज प्रॉम्प्ट/रिस्पॉन्सला (image prompts/responses) सपोर्ट (support) करतात (मॉडेलवर (model) अवलंबून).

ऑटोमेशन (Automation): वारंवार येणाऱ्या नॅरेटिव्ह बीट्स (narrative beats) किंवा फॉरमॅटिंगसाठी (formatting) मॅक्रोज (macros).

ऍडव्हान्स इंटिग्रेशन (advanced integrations) सुरू करण्यापूर्वी प्रोव्हायडर-स्पेसिफिक (provider-specific) वैशिष्ट्ये, प्रॉम्प्ट (prompt) फॉरमॅट (format) आणि रेट-लिमिट नोट्ससाठी (rate-limit notes) डॉक्स (docs) तपासा.

सुरक्षितता, फिल्टर (Filter) आणि मर्यादा

मॉडेल पॉलिसी (Model Policies): API (एपीआय) मॉडेल (model) (उदा. Anthropic, Google) सुरक्षितता नियम लागू करतात जे काही विशिष्ट कंटेंट (content) प्रकारांवर परिणाम करू शकतात. त्यानुसार तुमचे क्रिएटिव्ह (creative) ध्येय ऍडजस्ट (adjust) करा.

लोकल कंट्रोल (Local Control): लोकल मॉडेल (local model) तुम्हाला अधिक स्वातंत्र्य देतात, परंतु अधिक जबाबदारीही देतात—तुमच्या वैयक्तिक मर्यादा आणि कंटेंट टॅग (content tag) सुरुवातीलाच सेट (set) करा.

सेशन हायजीन (Session Hygiene): कंटेंट वॉर्निंग (content warnings), ऑप्ट-इन सीन्स (opt-in scenes) आणि स्पष्ट ट्रान्झिशन (transitions) वापरा. काही गडबड झाल्यास, सारांश द्या, टोन (tone) रिसेट (reset) करा आणि परिस्थिती पुन्हा व्यवस्थित करा.

ट्रबलशूटिंग (Troubleshooting): सामान्य समस्यांसाठी जलद उपाय

मॉडेल (Model) वारंवार रिपीट (repeat) होते किंवा लूप (loop) होते: रेपिटेशन पेनल्टी (repetition penalty) वाढवा, टेम्परेचर (temperature) किंचित कमी करा, मेमरीमध्ये (memory) अधिक ठोस तथ्ये ऍड (add) करा.

आउट-ऑफ-कॅरेक्टर (out-of-character) प्रतिसाद: कॅरेक्टरचे (character) डेफिनेशन (definition) मजबूत करा आणि 2-3 सॅम्पल डायलॉग (sample dialogue) ऍड (add) करा; सिस्टीम प्रॉम्प्ट (system prompt) अधिक कडक करा.

खर्च वाढतो (API (एपीआय) वापर): कॉन्टेक्स्ट लेंथ (context length) कमी करा, छोटे रिप्लाय (replies) सुरू करा, वेळोवेळी सारांश द्या किंवा फिलर सीन्ससाठी (filler scenes) कमी किमतीचे मॉडेल (model) वापरा.

लोकल मॉडेल (local model) स्लो (slow) आहे: लहान क्वांटीझेशन (quantization) वापरून पहा, GPU (जीपीयू) ऍक्सिलरेशन (acceleration) सुरू करा किंवा कमाल टोकन (tokens) कमी करा.

कनेक्शन एरर (Connection errors): प्रोव्हायडर URL (provider URL), की (key) व्हॅलिडिटी (validity) आणि मॉडेलचे (model) नाव पुन्हा तपासा. अचूक पॅरामीटर्ससाठी (parameters) API (एपीआय) कनेक्शन पेज (connection page) पहा.

10-मिनिटांचा स्टार्टर वर्कफ्लो (Starter Workflow) (हे कॉपी (copy) करा)

एक प्रोव्हायडर (provider) निवडा (उदा. कमी किमतीच्या टेस्टसाठी (test) Gemini किंवा लांब स्टोरी आर्क्ससाठी (story arcs) Claude).

पर्सोना (persona), बॅकस्टोरी बुलेट्स (backstory bullets) आणि 3 सॅम्पल डायलॉगसह (sample dialogue) एक कॅरेक्टर (character) तयार करा.

टेम्परेचर (temperature) 0.8, टॉप-पी (Top-p) 0.9, रेपिटेशन पेनल्टी (repetition penalty) मध्यम सेट (set) करा.

एक लहान मेमरी बुक (memory book) ऍड (add) करा: सेटिंग (setting), रिलेशनशिप (relationship), ऍक्टिव्ह (active) ध्येय.

स्पष्ट सीन सेटअप (scene setup) आणि इच्छित टोनने (tone) चॅट (chat) सुरू करा.

10 मेसेज (message) नंतर, चॅट (chat) एक्सपोर्ट (export) करा, दोन सुधारणा लिहा आणि कॅरेक्टर कार्ड (character card) अपडेट (update) करा.

ही प्रक्रिया पुन्हा करा आणि तुम्हाला नाटकीय कंसिस्टेंसी (consistency) वाढ दिसून येईल.

मॉडेल-स्पेसिफिक टिप्स (Model-Specific Tips) (चीट शीट (Cheat Sheet))

OpenAI: संक्षिप्त सिस्टीम प्रॉम्प्ट (system prompt) आवडतात;Numbered (नंबर) असलेल्या स्टेप्सने (steps) सूचना स्पष्टपणे फॉरमॅट (format) करा.

Claude: मल्टी-पॅराग्राफ (multi-paragraph) ब्रीफ्सवर (briefs) भरभराट होते; नॅरेटिव्ह (narrative) सातत्य आणि सारांशासाठी उत्तम.

Gemini: स्ट्रक्चर्ड प्रॉम्प्ट्स (structured prompts) आणि स्पष्ट मर्यादांसह चांगले काम करते; फ्री-टियर (free-tier) कोटा (quota) तपासा.

लोकल Llama (लामा): इंस्ट्रक्ट-ट्यून (instruct-tuned) केलेले प्रकार वापरा; स्पीड/क्वालिटीसाठी (speed/quality) 2-3 क्वांटीझेशन (quantization) टेस्ट (test) करा.

बॅकअप (Backups), एक्सपोर्ट (Exports) आणि ऑर्गनायझेशन (Organization)

लोअरच्या (lore) क्रॉस-कंटॅमिनेशनला (cross-contamination) प्रतिबंध (prevent) करण्यासाठी प्रत्येक "युनिव्हर्स" (universe) साठी वेगळे फोल्डर (folder) वापरा.

नियमितपणे चॅट (chat) (JSON/HTML) एक्सपोर्ट (export) करा आणि तुमच्या कॅरेक्टर कार्डांचे (character cards) स्नॅपशॉट (snapshot) घ्या.

सॅम्पलिंग सेटिंग्ज (sampling settings), मॉडेल व्हर्जन (model versions) आणि उल्लेखनीय सेशन (session) रेकॉर्ड (record) करणारे एक "मेटा (meta)" डॉक्युमेंट (document) ठेवा.

लक्षात घेण्यासारखे: Sider.AI सह तुमचा वर्कफ्लो (workflow) जलद करणे

जर तुम्ही SillyTavern बाहेर कॅरेक्टर बायो (character bios), सीन आऊटलाइन (scene outlines) किंवा लोअर स्निपेट्सचा (lore snippets) मसुदा तयार करत असाल, तर एक साइडबार असिस्टंट (sidebar assistant) तुम्हाला लवकर पुनरावृत्ती (iterate) करण्यात मदत करू शकते. Sider.AI चा इन-ब्राउझर असिस्टंट (in-browser assistant) लांब ट्रान्सक्रिप्टचा (transcripts) सारांश देऊ शकतो, कॅरेक्टर क्वर्कचा (character quirks) प्रस्ताव देऊ शकतो किंवा सीन सीड्स (scene seeds) जनरेट (generate) करू शकतो, त्यानंतर तुम्ही निकाल थेट SillyTavern मध्ये पेस्ट (paste) करू शकता. हे वर्ल्ड बिल्डिंग (worldbuilding) आणि प्रॉम्प्ट पॉलिशिंगसाठी (prompt polishing) एक उपयुक्त प्री-प्रोडक्शन कंपेनियन (pre-production companion) आहे.

महत्वाचे मुद्दे

सोप्या पद्धतीने सुरुवात करा: एक प्रोव्हायडर (provider), एक कॅरेक्टर (character) आणि एक लहान मेमरी बुक (memory book) निवडा.

कंट्रोल (control) महत्त्वाचा आहे: सिस्टीम प्रॉम्प्ट (system prompt), सॅम्पलिंग (sampling) आणि मेमरी (memory) कंसिस्टेंसीला (consistency) आकार देतात.

ध्येयानुसार मॉडेल (model) निवडा: नॅरेटिव्ह लेंथ (narrative length), खर्च, क्रिएटिव्हिटी (creativity) किंवा प्रायव्हसी (privacy).

पुनरावृत्ती करा: तुमचा कॅरेक्टर कार्ड (character card) आणि प्रीसेट (preset) एक्सपोर्ट (export) करा, तपासा आणि रिफाइन (refine) करा.

संसाधने

SillyTavern API (एपीआय) कनेक्शनचा (connections) आढावा: सपोर्टेड (supported) प्रोव्हायडर (provider), मर्यादा आणि नोट्स.

सर्वोत्तम मॉडेल (model) आणि Gemini सारख्या फ्री/कमी किमतीच्या पर्यायांवर सामुदायिक चर्चा.

रोलप्ले (roleplay) आणि चॅटसाठी (chat) LLM (एलएलएम) फ्रंटएंड (frontend) म्हणून SillyTavern चा GitHub (गीटहब) आढावा.

FAQ (एफएक्यू)

प्रश्न 1: मी SillyTavern ला OpenAI, Claude किंवा Gemini शी कसे कनेक्ट (connect) करू? SillyTavern चे API (एपीआय) सेटिंग्ज (settings) ओपन (open) करा आणि प्रत्येक प्रोव्हायडरसाठी (provider) तुमच्या API (एपीआय) की (key) पेस्ट (paste) करा, त्यानंतर मॉडेलचे (model) नाव सिलेक्ट (select) करा आणि सेव्ह (save) करा. ऑफिशियल (official) API (एपीआय) कनेक्शन गाईडमध्ये (connections guide) सपोर्टेड (supported) प्रोव्हायडर (provider) आणि पॅरामीटर्सची (parameters) लिस्ट (list) आहे, जे तुम्हाला सेट (set) करावे लागतील.

प्रश्न 2: मी Llama (लामा) सारख्या लोकल मॉडेलसह (local model) SillyTavern वापरू शकतो का? होय. KoboldAI किंवा oobabooga/text-generation-webui सारखे लोकल बॅकएंड (local backend) रन (run) करा, त्यानंतर SillyTavern ला लोकल सर्व्हर URL (local server URL) दाखवा. बॅकएंड (backend) API (एपीआय) एंडपॉइंट (endpoint) एक्सपोज (expose) करत आहे आणि एक सुसंगत इंस्ट्रक्ट-ट्यून (instruct-tuned) मॉडेल (model) वापरत आहे याची खात्री करा.

प्रश्न 3: SillyTavern मध्ये रोलप्ले (roleplay) कंसिस्टेंसी (consistency) सुधारण्यासाठी कोणती सेटिंग्ज (settings) आहेत? सिस्टीम प्रॉम्प्ट (system prompt) रिफाइन (refine) करा, कॅरेक्टर कार्डमध्ये (character card) सॅम्पल डायलॉग (sample dialogue) ऍड (add) करा आणि तथ्ये आणि रिलेशनशिपसाठी (relationship) एक लहान मेमरी बुक (memory book) वापरा. क्रिएटिव्हिटी (creativity) आणि कोहिरन्समध्ये (coherence) बॅलन्स (balance) साधण्यासाठी टेम्परेचर (temperature), टॉप-पी (Top-p) आणि रेपिटेशन पेनल्टी (repetition penalties) ट्यून (tune) करा.

प्रश्न 4: SillyTavern मध्ये लाँग-फॉर्म स्टोरीटेलिंगसाठी (long-form storytelling) कोणते मॉडेल (model) सर्वोत्तम आहे? लाँग-कॉन्टेक्स्ट (long-context) नॅरेटिव्ह (narrative) कोहिरन्ससाठी (coherence) Claude मॉडेल (model) मजबूत आहेत, तर OpenAI आणि Gemini सामान्य चॅटसाठी (chat) बहुमुखी आणि किफायतशीर आहेत. जर तुम्ही ट्यून (tune) करण्यास सोयीस्कर असाल तर लोकल Llama (लामा) मॉडेल (model) प्रायव्हसीसाठी (privacy) उत्तम आहेत.

प्रश्न 5: SillyTavern मध्ये API (एपीआय) मॉडेलसह (model) टोकन (token) खर्च कसा कमी करावा? कॉन्टेक्स्ट लेंथ (context length) कमी करा, संक्षिप्त रिप्लाय (replies) सुरू करा आणि वेळोवेळी आर्क्सचा (arcs) सारांश द्या. तुम्ही फिलर सीन्ससाठी (filler scenes) कमी किमतीचे मॉडेल (model) वापरू शकता आणि महत्त्वाच्या क्षणांसाठी प्रीमियम मॉडेल (premium model) ठेवू शकता.