How do I connect SillyTavern to OpenAI, Claude, or Gemini?

Open SillyTavern’s API settings and paste your API keys for each provider, then select the model name and save. The official API connections guide lists supported providers and parameters you may need to set.

Can I use SillyTavern with a local model like Llama?

Yes. Run a local backend such as KoboldAI or oobabooga/text-generation-webui, then point SillyTavern to the local server URL. Make sure the backend exposes an API endpoint and is using a compatible instruct-tuned model.

What settings improve roleplay consistency in SillyTavern?

Refine the system prompt, add sample dialogue to the character card, and use a small memory book for facts and relationships. Tune temperature, Top‑p, and repetition penalties to balance creativity and coherence.

Which model is best for long-form storytelling in SillyTavern?

Claude models are strong for long-context narrative coherence, while OpenAI and Gemini are versatile and cost-effective for general chat. Local Llama models are great for privacy if you’re comfortable tuning them.

How do I reduce token costs with API models in SillyTavern?

Shorten context length, enable concise replies, and summarize arcs periodically. You can also switch to lower-cost models for filler scenes and keep premium models for pivotal moments.

SillyTavern の使い方：セットアップ、モデル、高度な RP 機能の実践ガイド

SillyTavern が、大規模言語モデルを使ったロールプレイやチャットにおいて、最も柔軟なフロントエンドの一つとして話題になっているのを聞いたことがあるでしょう。しかし、どこから始めればいいのか、どのモデルを使えばいいのか、そして何かを壊さずに最高の機能をどのように解放すればいいのでしょうか？このガイドでは、インストールからプロレベルのセッションまで、無駄を省き、実践的で問題解決に焦点を当てた手順をステップごとに説明します。

SillyTavern とは？そして、なぜ使うのか？

SillyTavern は、ホストされた API とローカルモデルの両方で、LLM とやり取りするための強力でカスタマイズ可能な UI です。没入型チャット、キャラクターロールプレイ、ワールド構築、ストーリーコラボレーションのためのコントロールルームと考えてください。OpenAI、Anthropic、Google などの API や、KoboldAI や oobabooga/text-generation-webui (TGI/ExLlama など) などのローカルバックエンドに接続し、セッションの雰囲気、記憶、スタイルを微調整できます。キャラクターカード、長期記憶、拡張機能、プロンプトとサンプリングのきめ細かいコントロールなど、親しみやすく奥深い機能を持つように設計されています。

クイックセットアップ：ゼロから最初のチャットまで

この効率化されたフローに従ってください。慣れてきたら、後で高度な設定を見直すことができます。

1) インストールと起動

SillyTavern を GitHub リポジトリ (またはメンテナンスされたフォーク) からクローンまたはダウンロードし、OS に付属のスタートアップスクリプトに従ってください。Windows では、通常 start.bat を実行してローカル Web サーバーを起動します。macOS/Linux では、start.sh スクリプトが一般的です。

ターミナルに表示されるローカル URL (通常は ` または SillyTavern が出力するポート) を開いて、UI にアクセスします。

ヒント: SillyTavern フォルダを整理整頓しましょう。キャラクターカード、プリセット、拡張機能は予測可能なサブフォルダに保存されるため、バックアップが容易になります。

2) モデルパスの選択：API またはローカル

ホストされた API：最も早く開始できます。SillyTavern の API 設定パネルに API キーを入力します。

ローカルバックエンド：プライバシーと制御に最適です。SillyTavern を KoboldAI や oobabooga/text-generation-webui などのローカルサーバーに接続します。

SillyTavern は、幅広い API プロバイダーとローカルコネクターをサポートしており、長所、制限、ユースケースに関するメモがドキュメントに記載されています。

3) API 認証情報の入力 (ホストされたモデルを使用する場合)

OpenAI、Anthropic、Google (Gemini) などは、SillyTavern の接続タブに API キーを貼り付けることで追加できます。

ヒント: プロバイダーごとのプリセットを使用します。異なるモデルは、わずかに異なるシステムプロンプト、温度、およびペナルティに対してより良く応答します。

コミュニティの報告によると、Google の Gemini は Google AI Studio キーを使用すると無料で使用できるため、実験のための費用対効果の高い出発点となります。

4) ローカル LLM への接続 (オプション)

ローカルバックエンド (KoboldAI、text-generation-webui/oobabooga、LM Studio など) を起動し、API エンドポイントを提供していることを確認します。

SillyTavern で、対応するコネクターを選択し、ローカル URL と必要なパラメータを入力します。

短いテストメッセージを送信して検証します。

5) キャラクターの作成またはインポート

[Characters] → [New] をクリックして最初から作成するか、ライブラリからキャラクターカード (PNG/JSON) をインポートします。

ペルソナ、説明、サンプルダイアログ、および定義フィールドに入力します。キャラクターライズが具体的であればあるほど、RP の一貫性が向上します。

6) チャットを開始

キャラクターとモデルを選択し、最初のメッセージを作成します。

「シーンを設定しましょう：」のようなソフトな導入を使用します。

ローカルの Llama ベースのモデル：プライベート、カスタマイズ可能。品質は量子化と微調整によって異なります。

KoboldAI/oobabooga スタック：推論、プロンプト形式、および拡張機能に対する深い制御。

SillyTavern の API 接続ガイドでは、サポートされているプロバイダーと注意事項についてまとめて説明しています。

キャラクター作成：キャラクターを維持する人格の構築

素晴らしいセッションは、素晴らしいキャラクターカードから始まります。

ペルソナ：アイデンティティ、役割、声に関する 2 ～ 4 文。

バックストーリー：形成期の歴史の 3 ～ 5 個の箇条書き。網羅的なタイムラインは避けてください。

目標と境界線：キャラクターが望むことと、越えない一線を明確にします。

話し方：イディオムや癖の例をいくつか追加します。

サンプルダイアログ：トーン、ペース、感情の幅を強調する 3 つのやり取り。

プロのヒント：環境アンカー (例: 「街は雨と古いネオンの匂いがする」) を追加して、モデルが常に思い出させなくても説明的になるようにします。

拡張機能、プラグイン、およびパワー機能

SillyTavern には、その機能を拡張するアドオンのエコシステムがあります。

メモリとローアブック：トリガーが検出されたときにキーファクトを自動挿入します。

ワールド/ストーリーツール：シーンテンプレート、NPC 名簿、およびイベントプロンプト。

TTS/STT：テキスト読み上げと音声テキスト変換でセッションを音声対応にします。

画像フック：一部のコネクターは、画像プロンプト/応答をサポートしています (モデルによって異なります)。

自動化：反復的なナラティブビートまたは書式設定のマクロ。

高度な統合を有効にする前に、プロバイダー固有の機能、プロンプト形式、およびレート制限に関する注意事項についてドキュメントを確認してください。

安全性、フィルター、および境界線

モデルポリシー：API モデル (例: Anthropic、Google) は、特定のコンテンツタイプに影響を与える可能性のある安全ルールを適用します。それに応じてクリエイティブな目標を調整してください。

ローカル制御：ローカルモデルでは、より自由度が高くなりますが、責任も大きくなります。事前に個人的な境界線とコンテンツタグを設定してください。

セッションの衛生：コンテンツの警告、オプトインシーン、および明確なトランジションを使用します。何かが脱線した場合は、要約し、トーンをリセットし、シナリオを再固定します。

トラブルシューティング：一般的な問題の迅速な修正

モデルが繰り返すかループする：繰り返しペナルティを増やし、温度をわずかに下げ、メモリに根拠となる事実を追加します。

キャラクターからの逸脱：キャラクターの定義を強化し、2 ～ 3 個のサンプルダイアログを追加します。システムプロンプトを厳格にします。

コストが急上昇する (API の使用)：コンテキストの長さを短くし、短い返信を有効にし、定期的に要約するか、フィラーシーンのコストの低いモデルに切り替えます。

ローカルモデルが遅い：より小さな量子化を試すか、GPU アクセラレーションを有効にするか、最大トークン数を減らします。

接続エラー：プロバイダーの URL、キーの有効性、およびモデル名を再確認します。正確なパラメータについては、API 接続ページを参照してください。

10 分間のスターターワークフロー (これをコピー)

プロバイダーを選択します (例: 低コストテストには Gemini、長編ストーリーアークには Claude)。

ペルソナ、バックストーリーの箇条書き、および 3 つのサンプルダイアログを使用してキャラクターを作成します。

温度を 0.8、Top-p を 0.9、繰り返しペナルティを中に設定します。

小さなメモリブックを追加します：設定、関係、アクティブな目標。

明確なシーン設定と希望するトーンでチャットを開始します。

10 件のメッセージの後、チャットをエクスポートし、2 つの改善点を書き留め、キャラクターカードを更新します。

このループを繰り返すと、一貫性が劇的に向上します。

モデル固有のヒント (チートシート)

OpenAI：簡潔なシステムプロンプトを好みます。番号付きのステップで指示を明確にフォーマットします。

Claude：複数段落の概要で成功します。物語の継続性と要約に最適です。

Gemini：構造化されたプロンプトと明示的な制約でうまく機能します。無料枠を確認してください。

ローカル Llama：指示に合わせて調整されたバリアントを使用します。速度/品質のために 2 ～ 3 個の量子化をテストします。

バックアップ、エクスポート、および整理

ローアの相互汚染を防ぐために、「ユニバース」ごとに個別のフォルダを使用します。

チャットを定期的にエクスポート (JSON/HTML) し、キャラクターカードのスナップショットを作成します。

サンプリング設定、モデルバージョン、および注目すべきセッションを記録した「メタ」ドキュメントを保持します。

注目に値すること: Sider.AI でワークフローを高速化

SillyTavern の外部でキャラクターの略歴、シーンの概要、またはローアのスニペットを作成する場合、サイドバーアシスタントは反復を迅速に行うのに役立ちます。ちなみに、Sider.AI のブラウザ内アシスタントは、長いトランスクリプトを要約したり、キャラクターの癖を提案したり、シーンのシードを生成したりできます。その後、結果を SillyTavern に直接貼り付けることができます。ワールド構築とプロンプトの洗練のための便利なプリプロダクションコンパニオンです。

主なポイント

シンプルに始める：1 つのプロバイダー、1 つのキャラクター、および小さなメモリブックを選択します。

制御が重要：システムプロンプト、サンプリング、およびメモリは一貫性を形作ります。

目標別にモデルを選択：物語の長さ、コスト、創造性、またはプライバシー。

反復処理：キャラクターカードとプリセットをエクスポート、レビュー、および改良します。

リソース

SillyTavern API 接続の概要：サポートされているプロバイダー、制限、および注意事項。

最高のモデルと Gemini のような無料/低コストオプションに関するコミュニティディスカッション。

ロールプレイとチャットのための LLM フロントエンドとしての SillyTavern の GitHub 概要。

よくある質問

Q1:SillyTavern を OpenAI、Claude、または Gemini に接続するにはどうすればよいですか？ SillyTavern の API 設定を開き、各プロバイダーの API キーを貼り付けてから、モデル名を選択して保存します。公式の API 接続ガイドには、サポートされているプロバイダーと、設定する必要があるパラメータが記載されています。

Q2:Llama のようなローカルモデルで SillyTavern を使用できますか？はい。KoboldAI や oobabooga/text-generation-webui などのローカルバックエンドを実行してから、SillyTavern をローカルサーバー URL にポイントします。バックエンドが API エンドポイントを公開し、互換性のある指示に合わせて調整されたモデルを使用していることを確認してください。

Q3:SillyTavern でロールプレイの一貫性を向上させるには、どのような設定が必要ですか？システムプロンプトを改良し、サンプルダイアログをキャラクターカードに追加し、事実と関係に関する小さなメモリブックを使用します。創造性とコヒーレンスのバランスを取るために、温度、Top-p、および繰り返しペナルティを調整します。

Q4:SillyTavern で長編のストーリーテリングに最適なモデルは何ですか？ Claude モデルは、長文の物語の一貫性に優れており、OpenAI と Gemini は汎用性があり、一般的なチャットに費用対効果があります。ローカル Llama モデルは、調整に慣れている場合にプライバシーに最適です。

Q5:SillyTavern で API モデルのトークンコストを削減するにはどうすればよいですか？コンテキストの長さを短くし、簡潔な返信を有効にし、アークを定期的に要約します。また、フィラーシーンのコストの低いモデルに切り替え、重要な瞬間のプレミアムモデルを維持することもできます。