Wollten Sie schon immer, dass Ihre KI weniger wie ein Wetterroboter und mehr wie… Sie selbst klingt?
Stellen Sie sich vor: Sie bitten Ihre KI, eine Kunden-E-Mail zusammenzufassen, und sie antwortet, als würde sie den Schiffsverkehrsbericht vorlesen. Technisch korrekt, aber wenig hilfreich. Was Sie wirklich wollen, ist Ihre KI – Ihr Ton, Ihr Fachjargon, Ihre Vorlieben –, ohne dass Sie ein Forschungslabor in Ihrer Garage bauen müssen.
Hier kommt Fine-Tuning ins Spiel. Und wenn Sie von der "Tinker API" gehört haben, sind Sie hier genau richtig. Dies ist die Anleitung zum Fine-Tuning Ihres eigenen KI-Modells mit der Tinker API – damit Sie beim nächsten Tippen von "Antwortentwurf erstellen" etwas erhalten, das wie Ihr Team klingt, und nicht wie ein Cousin von HAL 9000.
Wir werden alles durchgehen: Was Fine-Tuning bedeutet, wie Sie Ihre Daten vorbereiten, wie Sie ein Fine-Tune mit der Tinker API durchführen und wie Sie Ihr Budget (oder Ihre Geduld) nicht überstrapazieren. Ich verrate Ihnen sogar, wo die Kobolde wohnen – denn Fine-Tuning ist zwar mächtig, aber keine gute Fee.
Vorab ein Hinweis zu den Schlüsselwörtern: Wir werden oft sagen "Wie man die Tinker API benutzt", weil das die Frage ist, für die Sie gekommen sind. Wir werden auch Long-Tail-Begriffe wie "Fine-Tune Ihres eigenen KI-Modells", "Tinker API Tutorial", "Datensatzvorbereitung für Fine-Tuning" und "Bereitstellung eines Fine-Tuned-Modells" einweben. Wenn sich das nach viel anhört, keine Sorge – ich werde es menschlich halten.
Was Fine-Tuning ist – und was es nicht ist
Wenn ein allgemeines KI-Modell ein Schweizer Taschenmesser ist, dann sagen Sie beim Fine-Tuning: "Pass auf, Messer, wir machen dich sehr, sehr gut darin, Pakete zu öffnen." Sie erfinden das Messer nicht neu. Sie bringen ihm Ihren Lieblingskarton bei.
In der Praxis bedeutet Fine-Tuning, dass Sie ein Basismodell nehmen (das bereits mit riesigen Mengen an Internettext trainiert wurde) und es mit Ihren Beispielen anpassen – Ihrem Schreibstil, Ihren domänenspezifischen Fragen und Antworten, Ihren Support-Skripten –, damit es so reagiert, wie Sie es möchten. Es ist, als würden Sie dem Modell einen Styleguide und einen Stapel Übungsquiz geben.
Aber Fine-Tuning ist kein Zauberspruch. Es wird nicht plötzlich Fakten lernen, die es noch nie gesehen hat, es sei denn, Ihre Daten vermitteln diese Muster. Es wird sich auch nicht an riesige, geschützte Dokumente "erinnern", es sei denn, Sie füttern repräsentative Ausschnitte ein. Und wenn Ihre Daten unordentlich, widersprüchlich oder winzig sind, wird Ihr Modell diese Gewohnheiten erben, so wie eine Teenager-Rockband das Tempo ihres Schlagzeugers erbt.
Die schnelle Reiseroute
Hier ist die Vogelperspektive, wie Sie die Tinker API verwenden, um Ihr eigenes KI-Modell zu fine-tunen:
- Wählen Sie ein Basismodell in der Tinker API aus.
- Bereiten Sie einen sauberen, ausgewogenen Datensatz mit Prompts und idealen Antworten vor.
- Laden Sie Ihren Datensatz in Tinker hoch.
- Erstellen Sie einen Fine-Tuning-Job mit klaren Hyperparametern.
- Überwachen Sie das Training und bewerten Sie die Ergebnisse mit einem zurückgehaltenen Testdatensatz.
- Stellen Sie Ihr feinabgestimmtes Modell in der Produktion bereit und rufen Sie es auf.
- Wiederholen Sie den Vorgang, wenn Sie Seltsamkeiten entdecken.
Wir gehen Schritt für Schritt vor, mit Code-Beispielen, die Sie einfügen können, und Tipps, die mich davon abgehalten haben, meinen Bildschirm anzuschreien.
Schritt 1: Wählen Sie Ihr Basismodell so aus, wie Sie ein Mietauto auswählen würden
Sie würden keinen 15-Sitzer-Van mieten, um in Manhattan parallel einzuparken. Wählen Sie auch kein riesiges Modell, wenn Sie schnelle, billige Antworten für eine Million tägliche Anfragen benötigen. Die Tinker API bietet in der Regel einige Modellfamilien an – leichtgewichtig, mittelgroß und "wow, das ist clever".
- Wenn Sie Geschwindigkeit und Kosteneinsparungen benötigen: Wählen Sie die kleinere Basis.
- Wenn Sie Nuancen, Argumentation oder lange Texte benötigen: Wählen Sie die größere Basis.
- Wenn Ihre Domäne viel Fachjargon enthält (medizinisch, juristisch, Support-Makros): Mittelgroße bis große Modelle lassen sich fruchtbarer fine-tunen.
Profi-Tipp: Beginnen Sie kleiner, um einen Prototyp zu erstellen. Wenn Ihre wichtigsten Metriken steigen, verschieben Sie denselben Datensatz auf eine größere Basis.
Schritt 2: Bereiten Sie Ihren Datensatz wie eine Rezeptkarte vor, nicht wie Ihre Ramschschublade
Ihr Datensatz ist der wichtigste Hebel für die Qualität. Das Modell lernt durch Nachahmung; wenn die Beispiele vage sind, lernt das Modell, vage zu sein. Wenn sie prägnant, konsistent und vielfältig sind, wird Ihr Modell zu einem hilfsbereiten Mitarbeiter, der das Memo tatsächlich liest.
Streben Sie ein JSONL-Format (JSON Lines) mit expliziten Anweisungs-Antwort-Paaren an. Fügen Sie für das Fine-Tuning im Chat-Stil Rollen wie System/Benutzer/Assistent ein. Halten Sie jedes Beispiel kurz bis mittellang; Dutzende hochwertiger Beispiele sind besser als tausend verrauschte.
Beispiel (Anweisungsstil):
{"instruction": "Fassen Sie dieses Support-Ticket in 2 Sätzen zusammen, freundlicher Ton.", "input": "Kunde meldet einen 404-Fehler beim Klicken auf 'Bestellung verfolgen'", "output": "Vielen Dank für den Hinweis! Die Website zeigt einen 404-Fehler an, wenn Kunden auf 'Bestellung verfolgen' klicken. Wir untersuchen einen defekten Link auf der Seite zur Bestellungsverfolgung und werden uns mit einer Lösung melden."}
Beispiel (Chat-Stil):
{"messages": [
{"role": "system", "content": "Sie sind ein prägnanter, freundlicher Support-Mitarbeiter. Verwenden Sie einfaches Englisch."},
{"role": "user", "content": "Mein Abonnement wurde verlängert, aber die Karte war abgelaufen. Hilfe?"},
{"role": "assistant", "content": "Entschuldigung für die Unannehmlichkeiten! Ich habe Ihren Plan erneut überprüft – die Verlängerung wurde mit einer abgelaufenen Karte versucht. Bitte aktualisieren Sie Ihre Karte auf der Abrechnungsseite; Ich werde die Belastung erneut versuchen, sobald sie gespeichert ist."}
]}
Tipps zur Datensatzvorbereitung für das Fine-Tuning:
- Konsistenz ist Trumpf. Verwenden Sie immer den gleichen Ton, die gleichen Abmeldungen und die gleiche Struktur.
- Gleichen Sie Ihre Themen aus. Wenn 90 % der Beispiele Rückerstattungen sind, wird Ihr Modell zur Rückerstattungsfee.
- Beschriften Sie knifflige Fälle. Fügen Sie negative Beispiele (was nicht gesagt werden soll) ein, wenn die Tinker API ein Präferenzsignal unterstützt.
- Halten Sie es sicher. Entfernen Sie persönliche Daten. Wenn Sie mit sensiblen Informationen arbeiten, anonymisieren oder synthetisieren Sie diese.
Halten Sie 10–20 % Ihrer Daten als Testdatensatz zurück. Wenn Sie den Trainingsdatensatz bewerten, gaukeln Sie sich vor, dass das Modell ein Genie ist. Fragen Sie mich, woher ich das weiß.
Schritt 3: Laden Sie Ihre Daten ohne Tränen in die Tinker API hoch
Die meisten Fine-Tuning-Plattformen bieten einen Speicherendpunkt an. Mit der Tinker API werden Sie typischerweise:
- Erstellen Sie eine Datensatzressource (z. B. POST /datasets)
- Laden Sie Ihre JSONL-Datei hoch
- Validieren Sie das Schema (Tinker gibt normalerweise einen praktischen Bericht zurück: OK-Zähler, Fehler, seltsame Felder)
Pseudo-Beispiel (curl-ähnlich):
curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -F "file=@my_finetune_data.jsonl" -F "purpose=finetune"
Wenn die Tinker API eine CLI unterstützt, wird das Leben einfacher:
Hochladen
tinker datasets upload my_finetune_data.jsonl --purpose finetune
Validieren
tinker datasets validate DATASET_ID
Validierungsfehler sind Ihr Freund. Sie fühlen sich urteilend an, aber sie bewahren Sie vor mysteriösen Trainingsfehlern um 2 Uhr morgens.
Schritt 4: Starten Sie einen Fine-Tune-Job und wählen Sie vernünftige Einstellungen
Sie starten einen Job, der auf Ihren Datensatz und Ihr ausgewähltes Basismodell verweist. Die meisten Fine-Tuning-Endpunkte der Tinker API akzeptieren Parameter wie Epochen, Lernrate, Batch-Größe und Auswertungshäufigkeit. Übersetzung: Wie viele Durchläufe über Ihre Daten, wie aggressiv das Modell lernt, wie viele Beispiele es gleichzeitig untersucht und wie oft es Ihnen einen Fortschrittsbericht zeigt.
Beispielanfrage:
curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{
"base_model": "tinker-large-1",
"dataset_id": "ds_abc123",
"epochs": 3,
"learning_rate": 1e-5,
"batch_size": 8,
"eval_dataset_id": "ds_eval789",
"suffix": "support-tone-v1"
}'
Vernünftige Standardwerte:
- Epochen: 3–5 für kleine bis mittlere Datensätze. Mehr ist nicht immer besser; manchmal ist es nur Overfitting mit zusätzlichen Schritten.
- Lernrate: Beginnen Sie konservativ (1e-5 oder 2e-5). Wenn das Modell zu schnell lernt, vergisst es seine allgemeine Intelligenz.
- Batch-Größe: Was auch immer Ihr Kontingent zulässt, aber machen Sie sich keine Sorgen – Leistungssteigerungen ergeben sich hauptsächlich aus guten Daten.
- Early Stopping: Wenn die Tinker API dies anbietet, aktivieren Sie es. Es ist das "Sind wir schon da?" des maschinellen Lernens, das gelegentlich "Ja" sagt.
Schritt 5: Überwachen Sie das Training wie ein Falke – aber ein entspannter Falke
Tinker streamt normalerweise Protokolle: Trainingsverlust, Auswertungsverlust und möglicherweise benutzerdefinierte Metriken, die Sie definieren (z. B. exakte Übereinstimmung für Q&A). So lesen Sie die Teeblätter:
- Trainingsverlust sinkt, Auswertungsverlust flach oder steigt? Sie überanpassen – Sie merken sich Ihre Trainingsantworten, vermasseln aber neue.
- Beide zeigen einen Abwärtstrend? Sie sind auf dem richtigen Weg.
- Verlust hüpft wie ein Pogo-Stick? Ihre Lernrate ist möglicherweise zu hoch oder Ihr Datensatz ist inkonsistent.
Überprüfen Sie Teilweise Ausgaben, wenn Tinker Vorschau-Generierungen während des Trainings anbietet. Nehmen Sie Stichproben einiger Prompts aus Ihrem Testdatensatz und beurteilen Sie Ton/Genauigkeit mit den Augen. Ja, es ist qualitativ – aber Sie trainieren Stil, nicht physikalische Beweise.
Schritt 6: Benennen Sie es, stellen Sie es bereit, rufen Sie es auf
Wenn der Job abgeschlossen ist, wird die Tinker API Sie mit einer Modell-ID wie ft:tinker-large-1:support-tone-v1:abc123 segnen. Sie können es dann hinter einem Endpunkt bereitstellen und es genauso aufrufen wie das Basismodell – nur dass es jetzt wie Ihr Team spricht.
Beispiel für einen Generierungsaufruf:
curl -X POST -H "Authorization: Bearer YOUR_TINKER_KEY" -H "Content-Type: application/json" -d '{
"model": "ft:tinker-large-1:support-tone-v1:abc123",
"messages": [
{"role": "system", "content": "Sie sind ein prägnanter, freundlicher Support-Mitarbeiter."},
{"role": "user", "content": "Meine Rückerstattung ist verspätet und ich bin verärgert."}
],
"temperature": 0.4
}'
Sie können auch eine höhere "presence_penalty" oder eine niedrigere "temperature" einstellen, wenn Ihr Modell zu gesprächig oder zu kurz angebunden wird. Die Dokumente von Tinker erläutern die Knöpfe – scheuen Sie sich nicht, zu experimentieren.
Schritt 7: Bewerten Sie wie ein Trainer, nicht wie ein Richter
Sie benötigen eine automatische Scorecard und eine menschliche. Automatische Metriken (BLEU, ROUGE, Genauigkeit) sind ordentlich, aber blind für den Ton. Menschen erkennen das Problem "das klingt schnippisch".
Richten Sie eine kleine Rubrik ein:
- Befolgung von Anweisungen (1–5)
- Sicherheit/Compliance (1–5)
Nehmen Sie Stichproben von 50–100 Ausgaben aus Ihrem zurückgehaltenen Datensatz. Bitten Sie zwei Personen, diese unabhängig voneinander zu bewerten. Wenn eine Kategorie im Durchschnitt unter 3 liegt, verfolgen Sie sie zurück zu Ihrem Datensatz und fügen Sie weitere Beispiele hinzu, die das gewünschte Verhalten demonstrieren.
Schritt 8: Kosten und Leistung: Was Ihren CFO und Ihren Server interessiert
Das Fine-Tuning mit der Tinker API kostet an zwei Stellen Geld: Training und Inferenz. Das Training ist ein einmaliger Sprint; die Inferenz ist der Marathon.
- Reduzieren Sie die Tokenlänge. Kürzere Prompts und Ausgaben = kleinere Rechnungen.
- Verwenden Sie einen System-Prompt, der Ihren Stil umrahmt, aber wiederholen Sie nicht bei jedem Aufruf riesige Anweisungen, wenn Tinker einen Standard auf Bereitstellungsebene unterstützt.
- Zwischenspeichern Sie gängige Prompts, wo immer dies möglich ist.
- Erwägen Sie eine Routing-Strategie: Verwenden Sie Ihr feinabgestimmtes großes Modell nur bei Bedarf; andernfalls greifen Sie auf ein kleineres, billigeres Modell zurück.
Auch die Latenz ist wichtig. Wenn Ihr feinabgestimmtes Modell langsamer läuft, versuchen Sie es mit kleineren Kontextfenstern oder verwenden Sie das kleine Modell für die Klassifizierung und das große Modell nur für generativen Text.
Schritt 9: Fehlerbehebung: Die größten Hits der Gremlins
- Das Modell wiederholt sich wie eine Schallplatte mit Sprung.
- Senken Sie die Temperatur; fügen Sie Beispiele mit prägnanten, kurzen Antworten hinzu; reduzieren Sie die Strahlbreite, falls dies eine Option ist.
- Es ignoriert Anweisungen.
- Stärken Sie den System-Prompt und fügen Sie Trainingsbeispiele hinzu, die eine strikte Befolgung von Anweisungen zeigen.
- Es halluziniert Fakten mit Angeberei.
- Fügen Sie Beispiele hinzu, die "Ich weiß es nicht" sagen oder auf Quellen verweisen; senken Sie die Temperatur; kombinieren Sie es mit dem Abrufen, um Antworten zu begründen.
- Es ist zu nett. (Ja, das ist eine Sache.)
- Fügen Sie Trainingsbeispiele hinzu, die Grenzen setzen und Richtlinien verdeutlichen – "Wir können X nicht tun, aber hier ist Y."
- Das Training schlägt auf halbem Weg fehl.
- Überprüfen Sie die Datensatzvalidierung, seltsame Zeichen und die maximale Tokenlänge. Versuchen Sie es mit einer kleineren Batch-Größe oder weniger Epochen.
Schritt 10: Wann Fine-Tuning und wann Prompts oder Abruf verwenden
Ich liebe Fine-Tuning, aber es ist nicht der einzige Hammer. Drei gängige Strategien:
- Nur Prompt Engineering: Am billigsten, am schnellsten. Ideal, wenn Sie nur eine Tonanpassung oder einfache Konsistenz benötigen.
- Retrieval-Augmented Generation (RAG): Ideal für aktuelle Fakten und große Wissensdatenbanken. Das Modell liest Ihre Dokumente zur Laufzeit.
- Fine-Tuning: Am besten für Stil, Struktur und Domänenmuster, die sich nicht täglich ändern.
Oft ist das Erfolgsrezept eine Mischung aus allem: Verwenden Sie RAG, um Fakten abzurufen, und geben Sie diese dann an Ihr feinabgestimmtes Modell weiter, damit es in Ihrer typischen Stimme antwortet.
Ein kurzes Tinker API-Tutorial, das Sie kopieren und einfügen können
Hier ist eine konsolidierte, fiktive exemplarische Vorgehensweise, die viele Plattformen im Tinker-Stil widerspiegelt. Ersetzen Sie Endpunkte und IDs durch Ihre echten.
- Datensätze erstellen und hochladen
curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=finetune" curl -X POST -H "Authorization: Bearer $TINKER_KEY" -F "[email protected]" -F "purpose=eval" curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{
"base_model": "tinker-medium-1",
"dataset_id": "ds_train",
"eval_dataset_id": "ds_eval",
"epochs": 4,
"learning_rate": 2e-5,
"suffix": "email-summarizer-v1"
}'
curl -N -H "Authorization: Bearer $TINKER_KEY"
- Das feinabgestimmte Modell verwenden
curl -X POST -H "Authorization: Bearer $TINKER_KEY" -H "Content-Type: application/json" -d '{
"model": "ft:tinker-medium-1:email-summarizer-v1:xyz",
"prompt": "Fassen Sie die folgende E-Mail in zwei Aufzählungspunkten zusammen, freundlicher Ton:\n\n[E-MAIL EINFÜGEN]",
"max_tokens": 160,
"temperature": 0.4
}'
Szenarien aus dem echten Leben: Was passiert, wenn…
- Sie mit Ihren Support-Makros fine-tunen
- Plötzlich antwortet Ihre KI in der gleichen Struktur, die Ihre Agenten verwenden: Entschuldigung, Aktion, Follow-up. CSAT steigt oft, weil die Leute Konsistenz mehr mögen als Überraschungen.
- Sie mit Ihrer Markenstimme fine-tunen
- Das Modell trifft Ihren Stil "Wir sind hilfsbereit, aber nicht anhänglich". Es vermeidet 17-Ausrufezeichen-Enthusiasmus. Das Marketing schläft besser.
- Sie für Code-Vorschläge fine-tunen
- Fügen Sie Paare von Aufgabenbeschreibungen und idealen Code-Snippets ein. Halten Sie die Beispiele kurz und fokussiert; verrauschter Code führt zu verrauschten Vervollständigungen.
- Sie für die Klassifizierung fine-tunen
- Ja, das können Sie. Stellen Sie beschriftete Beispiele bereit und rufen Sie das Modell mit kurzen Prompts auf. Stellen Sie für strikte Beschriftungen die Temperatur auf Null.
Sicherheit geht vor, immer und überall
Wenn Ihr Anwendungsfall regulierte oder sensible Bereiche berührt, ziehen Sie klare Linien in Ihrem System-Prompt und Ihren Trainingsdaten. Fügen Sie Beispiele hinzu, die Ablehnungen auf elegante Weise demonstrieren. Protokollieren Sie Ausgaben und lassen Sie Benutzer Probleme melden. Feinabgestimmte Modelle können selbstbewusst sein – trainieren Sie sie, selbstbewusst vorsichtig zu sein.
Wo Sider.AI hineinpasst (und wo nicht)
Hier ist eine Überraschung: Sider.AI kann ein großartiger Begleiter sein, während Sie herausfinden, wie Sie die Tinker API verwenden. Es ist, als hätten Sie einen sorgfältigen Co-Piloten, der die Dokumente liest, ohne sich zu beschweren. Sie können Datensatzbeispiele in der Seitenleiste von Sider entwerfen, während Sie Ihre vorhandenen E-Mails oder Ihre Wissensdatenbank durchsuchen, und dann saubere, konsistente JSONL exportieren. Es wird den Trainingsjob nicht für Sie ausführen – das ist TINKERs Aufgabe – aber für das Entwerfen, Refaktorieren und QS Ihrer Beispiele ist es wunderbar praktisch. Versuchen Sie, es zu fragen: "Schreiben Sie diese Antwort in einer ruhigen, leicht verständlichen Support-Stimme in zwei Sätzen um" und beobachten Sie, wie die Qualität Ihres Datensatzes steigt. Die Fallstricke, von denen ich mir gewünscht hätte, dass sie mir jemand gesagt hätte
- Mehr Daten sind nicht immer besser – mehr repräsentative Daten sind es.
- Übertreiben Sie es nicht mit dem Ton. Behalten Sie ein paar Jokerbeispiele bei, damit das Modell improvisieren kann, wenn Benutzer kreativ werden.
- Versionieren Sie alles: Datensatz v1.1, Modell v1.2, Prompt-Vorlage v3.0. Ihr zukünftiges Ich wird Ihnen einen Dankeskuchen schicken.
- Behalten Sie eine Rollback-Taste. Wenn ein neues Fine-Tune aus dem Ruder läuft, stellen Sie das vorherige Modell schnell wieder bereit.
- Bewerten Sie mit echten Benutzer-Prompts, nicht nur mit Ihren schönsten Beispielen. Benutzer sind Dichter des Chaos.
Noch eine Sache…
Beim Fine-Tuning mit der Tinker API geht es nicht darum, Skynet zu bauen. Es geht darum, die rauen Kanten zu glätten, damit sich Ihre KI wie ein Teil Ihres Teams anfühlt. Beginnen Sie klein, messen Sie schonungslos und scheuen Sie sich nicht, zuzugeben, wenn ein einfacherer Trick (wie bessere Prompts) die Aufgabe erledigt.
Denn wenn Ihre KI endlich so antwortet, wie Sie es tun würden? Das ist nicht nur Effizienz. Das ist Vernunft.
Spickzettel
- So verwenden Sie die Tinker API, um Ihr eigenes KI-Modell zu fine-tunen: Bereiten Sie saubere, konsistente JSONL-Paare vor; laden Sie sie hoch; starten Sie ein Fine-Tune mit vernünftigen Standardwerten; bewerten Sie mit Menschen und Metriken; stellen Sie es bereit und iterieren Sie.
- Verwenden Sie Fine-Tuning für Stil und stabile Muster; verwenden Sie den Abruf für aktuelle Fakten.
- Kontrollieren Sie die Kosten mit kürzeren Prompts, kleineren Modellen und Routing.
- Machen Sie Sicherheit zu einem expliziten Bestandteil Ihres Datensatzes.
- Lassen Sie Tools wie Sider.AI Ihnen helfen, bessere Beispiele zu erstellen, bevor Sie jemals auf "Trainieren" klicken.
FAQ
F1:Wie bereite ich Daten vor, um mein eigenes KI-Modell mit der Tinker API zu fine-tunen?
Verwenden Sie JSONL mit klaren Anweisungs-Antwort- oder Chat-Stil-Paaren. Halten Sie den Ton konsistent, anonymisieren Sie sensible Informationen und halten Sie 10–20 % für Tests zurück, damit Sie sich nicht mit überhöhten Werten selbst täuschen.
F2: Ist Feinabstimmung mit der Tinker API besser als Prompt-Engineering?
Verwenden Sie Prompts für schnelle Tonanpassungen und einfache Verhaltensweisen; verwenden Sie Feinabstimmung, wenn Sie einen dauerhaften Stil, Struktur oder Bereichsmuster benötigen. Viele Teams kombinieren beides – RAG für Fakten, Feinabstimmung für den Tonfall.
F3: Wie viele Daten benötige ich, um ein Modell mit der Tinker API feinabzustimmen?
Qualität schlägt Quantität. Einige wenige, aussagekräftige Beispiele können Tausende von verrauschten Beispielen übertreffen. Beginnen Sie klein, evaluieren Sie und fügen Sie dann gezielte Beispiele hinzu, bei denen das Modell Schwierigkeiten hat.
F4: Wie implementiere ich ein feinabgestimmtes Modell in der Tinker API?
Nach dem Training gibt Tinker eine Modell-ID zurück, die Sie über die Standard-Completions- oder Chat-Endpunkte aufrufen können. Legen Sie einen hilfreichen System-Prompt fest, optimieren Sie die Temperatur und überwachen Sie die Ausgaben im laufenden Betrieb.
F5: Wie verhindere ich, dass mein feinabgestimmtes Modell halluziniert?
Trainieren Sie mit Beispielen, die Unsicherheit zulassen, senken Sie die Temperatur und kombinieren Sie es zur Faktenfindung mit Retrieval. Machen Sie "Quellen zitieren" oder "Sagen Sie, dass Sie es nicht wissen" zum Bestandteil der Anweisung und der Trainingsdaten.