Sider.ai
  • Pokalbis
  • Wisebase
  • Įrankiai
  • Pratęsimas
  • Klientai
  • Kainodara
Parsisiųsti dabar
Prisijungti

Mokykitės greičiau, mąstykite giliau ir augkite protingiau su Sider.

Produktai
Programėlės
  • Plėtiniai
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Įrankiai
  • Interneto kūrėjasNew
  • AI skaidrėsNew
  • AI esė rašytojas
  • Nano Banana Pro
  • Nano Banana Infographic
  • AI vaizdų generatorius
  • Italų smegenų puvimo generatorius
  • Fono šalinimas
  • Fono keitiklis
  • Nuotraukų trintukas
  • Teksto šalinimas
  • Inpaint
  • Vaizdo didinimas
  • Sukurti
  • AI vertėjas
  • Vaizdo vertėjas
  • PDF vertėjas
Sider
  • Susisiekite su mumis
  • Pagalbos centras
  • Atsisiųsti
  • Kainodara
  • Švietimo planas
  • Kas naujo
  • Tinklaraštis
  • Bendruomenė
  • Partneriai
  • Partnerystė
  • Pakviesti
©2026 Visos teisės saugomos
Naudojimo sąlygos
Privatumo politika
  • Pagrindinis puslapis
  • Dienoraštis
  • AI Įrankiai
  • Žingsnis po žingsnio: YouTube tyrimų agento kūrimas su Claude Code

Žingsnis po žingsnio: YouTube tyrimų agento kūrimas su Claude Code

Atnaujinta 2025 m. rugsėjo 19 d.

8 min


Žingsnis po žingsnio: YouTube tyrimų agento kūrimas su Claude Code

Jei kada nors praleidote popietę naršydami YouTube ir pamiršote, kuriuos vaizdo įrašus verta išsaugoti, nesate vieni. Dabar įsivaizduokite nenuilstantį asistentą, kuris gali greitai rasti geriausius vaizdo įrašus, ištraukti santraukas, paimti pagrindines citatas, pažymėti įžvalgas laiko žymomis ir pagal pareikalavimą grąžinti šaltinius. Būtent tai gali padaryti YouTube tyrimų agentas. Šiame žingsnis po žingsnio vadove sukursime praktišką YouTube tyrimų agentą su Claude Code, skirtą kūrėjams, analitikams, studentams ir apsėstiems besimokantiesiems, kurie nori signalo, o ne triukšmo.
Pasirinksime praktišką ir tiesioginį kelią: architektūra, kodas, raginimai ir apsaugos priemonės. Pakeliui priimsime kategoriškus sprendimus, kuriuos vėliau galėsite pakeisti. Iki galo turėsite veikiantį agentą, kuris gali ieškoti YouTube, rinkti nuorašus, apibendrinti kelis vaizdo įrašus ir pateikti aiškias tyrimų ataskaitas.

Ką kuriame (ir kodėl tai svarbu)

  • Tikslas: YouTube tyrimų agentas, kuris gali:
  • Ieškoti YouTube pagal užklausą
  • Rūšiuoti rezultatus pagal aktualumą / įtraukimą
  • Gauti nuorašus (automatinius subtitrus arba trečiųjų šalių)
  • Suskirstyti ir įterpti turinį, kad būtų galima jį atgauti
  • Naudoti Claude Code kelių vaizdo įrašų įžvalgoms sintezuoti
  • Pateikti struktūrizuotas pastabas: santrauka, teiginiai, laiko žymos, citatos ir citatos
  • Pagrindinis raktinis žodis: "YouTube tyrimų agento kūrimas su Claude Code"
  • Formatas: Žingsnis po žingsnio vadovas su vykdomu kodu ir raginimais
  • Rezultatai: Markdown tyrimo ataskaita + JSON programiniam naudojimui
Kodėl tai svarbu: YouTube yra didžiausia vieša pokalbių, pamokų, demonstracijų ir debatų žinių bazė. Bet ji triukšminga. YouTube tyrimų agento kūrimas su Claude Code suteikia jums pranašumą: galite apibendrinti įžvalgas iš dešimčių vaizdo įrašų per kelias minutes, o ne valandas.

Architektūra trumpai

Pirmąją versiją padarysime paprastą ir patikimą.
  • Įvestys: tyrimo užklausa (pvz., "LLM agentų architektūros 2025"), pasirenkami apribojimai (datos intervalas, kanalas, trukmė)
  • YouTube paieška: YouTube Data API v3 (arba SerpAPI atsarginis variantas)
  • Nuorašai: YouTube Transcript API; atsarginis variantas ASR (pvz., Whisper), kai negalimas
  • Skaidymas: Sakiniais pagrįstas segmentavimas (apytiksliai 800–1 200 žetonų)
  • Įterpimai: Naudokite vietinį arba priglobtą įterpimo modelį (pvz., text-embedding-3-large, nomic-embed-text arba bge-large)
  • Vektorinė saugykla: Vietinis FAISS greičiui; galima pakeisti į Pinecone, Weaviate arba Qdrant
  • Samprotavimas: Claude Code orkestravimui, įrankių naudojimui, sintezei ir kodo vykdymui kontroliuojamoje kilpoje
  • Išvestys: Markdown ataskaita + JSON indeksas su citatomis, laiko žymomis ir balais
Duomenų srautas: Užklausa → Paieška → Metaduomenų gavimas → Nuorašas → Skaidymas → Įterpimas → Geriausių K atgavimas → Claude Code sintezė → Ataskaita.

Būtinos sąlygos ir sąranka

  • Python 3.10+
  • API raktai: YOUTUBE_API_KEY, ANTHROPIC_API_KEY (Claude Code)
  • Neprivaloma: OPENAI_API_KEY arba vietiniai įterpimai
  • Bibliotekos:
  • google-api-python-client, youtube-transcript-api
  • faiss-cpu, numpy, pandas, tiktoken (arba sentencepiece)
  • requests, pydantic, tenacity
  • anthropic (Claude API)
pip install google-api-python-client youtube-transcript-api faiss-cpu numpy pandas requests pydantic tenacity anthropic tiktoken
Aplinkos kintamieji:
export YOUTUBE_API_KEY=YOUR_YT_KEY
export ANTHROPIC_API_KEY=YOUR_ANTHROPIC_KEY

1 žingsnis: YouTube paieška su filtrais

Ieškosime YouTube ir grąžinsime struktūrizuotus metaduomenis: pavadinimą, kanalą, paskelbimo datą, trukmę, peržiūras (jei yra) ir videoId.
# failas: yt_search.py
from googleapiclient.discovery import build
import os
YOUTUBE_API_KEY = os.environ — channel, date\n\n"
"---\n"
"JSON schema: {\"claims\":[{\"claim\":str,\"support\":[{\"video_id\":str,\"start\":float,\"end\":float}]}]}\n"
)
def call_claude(goal: str, passages: list[dict]):
passages_str = "\n\n".join(
f"[rank {p['rank']} | score {p['score']:.3f}] (vID={p.get('video_id','?')}, {p.get('start',0):.1f}-{p.get('end',0):.1f})\n{p['text']}"
for p in passages
)
msg = client.messages.create(
model="claude-3-5-sonnet-20240620",
max_tokens=1800,
temperature=0.2,
system=SYSTEM_PROMPT,
messages=[
{"role": "user", "content": USER_TEMPLATE.format(goal=goal, passages=passages_str)}
])
return msg.content[0].text
Patarimai dėl raginimų kuriant YouTube tyrimų agentą su Claude Code:
  • Prašykite struktūrizuotų išvesčių tiek žmonėms suprantamu, tiek mašinoms nuskaitomu formatu
  • Užtikrinkite citatas su laiko žymomis
  • Skatinkite neapibrėžtumo atskleidimą ir prieštaravimus

6 žingsnis: Viską sudėjus į vieną vietą

Sujunkime užklausą → paiešką → nuorašus → skaidymą → įterpimą → atgavimą → sintezę.
# failas: run_agent.py
from yt_search import search_youtube
from transcripts import fetch_transcript
from chunking import transcript_to_docs
from embeddings import VectorStore
from orchestrator import call_claude
from datetime import datetime
def build_corpus(query: str, max_videos=8):
results = search_youtube(query, max_results=max_videos)
corpus_docs = []
for r in results:
tx = fetch_transcript(r["video_id"]) or []
if not tx:
continue
docs = transcript_to_docs(tx)
for d in docs:
d.update({
"video_id": r["video_id"],
"title": r["title"],
"channel": r["channel"],
"url": r["url"],
})
corpus_docs.extend(docs)
return corpus_docs
def research(query: str, k=12):
corpus = build_corpus(query)
if not corpus:
return "No transcripts available."
vs = VectorStore
vs.add(corpus)
passages = vs.search(query, k=k)
md = call_claude(query, passages)
timestamp = datetime.utcnow.isoformat
return f"<!-- generated {timestamp} UTC -->\n\n" + md
if __name__ == "__main__":
print(research("LLM agents for YouTube research"))
Ši bazinė YouTube tyrimų agento su Claude Code versija ieškos, atgaus ir susintetins kelių vaizdo įrašų įžvalgas su citatomis. Atnaujinkite įterpimus ir pridėkite talpyklą, kad ji būtų paruošta gamybai.

Septyni atnaujinimai, kad jis būtų puikus

  1. Geresni įterpimai ir hibridinė paieška
  • Pakeiskite aukštos kokybės įterpimus ir pridėkite BM25 raktinių žodžių paiešką. Hibridinė paieška geriau atsimena nišinius terminus ir geriau tiksliai nustato abstrakčias temas.
  1. Išplėskite įrankius, kad gautumėte daugiau metaduomenų
  • Paimkite komentarus, patinka / nepatinka santykį ir kanalo autoritetą. Pridėkite perrūšiuotoją (kryžminį koduotuvą) 100 geriausių kandidatų.
  1. Kelių etapų tyrimo planavimas
  • Naudokite Claude Code tyrimo planui pasiūlyti: antrinius klausimus, hipotezes ir aprėpties patikrinimus. Vykdykite iteratyviai, kol bus pasiektos aprėpties ribos.
  1. Įrodymų sekimas ir priešingi įrodymai
  • Kiekvienam teiginiui registruokite pagrindžiančius ir prieštaraujančius fragmentus. Pateikite abu ataskaitose; pridėkite patikimumo balus.
  1. Ilgų vaizdo įrašų strategijos
  • Naudokite scenų aptikimą per subtitrus arba Whisper žodžių laikus. Apibendrinkite kiekvieną skyrių prieš visuotinę sintezę, kad išvengtumėte konteksto praskiedimo.
  1. Talpykla ir išsaugojimas
  • Saugokite nuorašus, įterpimus ir ataskaitas pagal užklausą. Pakartotinai naudokite, kai vartotojai patikslina filtrus. Pridėkite dubliavimą pagal vaizdo įrašo ID.
  1. Eksporto formatai ir pristatymas
  • Eksportuokite Markdown, PDF ir JSON. Pristatymas el. paštu arba Slack. Atvaizduokite laiko žymas kaip spustelėjamas ?t=mmss nuorodas.

Ragminai, kuriuos galite pakartotinai naudoti

Naudokite šiuos šablonus kurdami YouTube tyrimų agentą su Claude Code.
Sistema: Jūs esate kruopštus tyrimų agentas. Sintetinkite kelis YouTube nuorašus. Cituokite eilutėje su [vID @ mm:ss] ir įtraukite šaltinių skyrių su URL. Grąžinkite tiek Markdown ataskaitą, tiek JSON teiginių su laiko žymomis naudingąją apkrovą.
Vartotojas: Tyrimo tikslas: {tema}
Apribojimai: sutelkti dėmesį į {auditoriją arba apimtį}; pirmenybę teikti šaltiniams per {datos intervalą}; įtraukti nesutarimus.
Kandidatų ištraukos (reitinguojamos):
{atgautos_ištraukos}
Išvestis: Santrauka → Pagrindinės įžvalgos (ženkleliai) → Žymios citatos (su laiko žymomis) → Prieštaravimai ir spragos → Šaltiniai. Tada JSON {"claims": ...}

Apsaugos priemonės ir etika

  • Gerbkite kūrėjų teises: Pateikite nuorodą į originalius vaizdo įrašus ir venkite skelbti didelius pažodinius nuorašus.
  • Būkite skaidrūs: Parodykite, iš kur atsiranda teiginiai, naudodami laiko žymas ir vaizdo įrašų ID.
  • Neviršykite santraukos: Išsaugokite niuansus; pažymėkite, kai subtitrai yra sugeneruoti automatiškai ir tikėtina, kad jie triukšmingi.
  • Atsargiai elkitės su opomis temomis: Pabrėžkite neapibrėžtumą ir ieškokite įvairių šaltinių.

Trikčių šalinimas: dažnos problemos ir pataisymai

  • "Nuorašas nerastas"
  • Grįžkite prie Whisper; išbandykite skirtingas kalbas; patikrinkite, ar vaizdo įrašas nėra užblokuotas regione.
  • Bloga atgavimo kokybė
  • Atnaujinkite įterpimus; pridėkite BM25; padidinkite fragmentų persidengimą; sureguliuokite K viršūnių parametrą.
  • Haliucinacijos citatos
  • Priversti griežtą citavimo schemą; nubausti nepalaikomus teiginius; reikalauti, kad atgautuose fragmentuose būtų tikslios laiko žymos.
  • API kvotų apribojimai
  • Agresyviai talpyklinkite; sumažinkite max_results; užklauskite paketais; pridėkite atsarginę kopiją su tenacity.
  • Ilgos formos dreifas
  • Apibendrinkite kiekvieną skyrių; apribokite didžiausius žetonus; naudokite planavimo raginimus su aiškiu kontūru.

Kokybės matavimas

  • Atgautų fragmentų tikslumas@K, palyginti su pažymėtu rinkiniu
  • Patikimumo rodiklis: teiginių, turinčių patvirtinamą laiko žymą, dalis
  • Aprėptis: unikalių aktualių vaizdo įrašų, cituotų vaizdo įrašų skaičius
  • Delstumas: laikas nuo užklausos iki ataskaitos

Pavyzdys: „Vektorinių duomenų bazių paaiškinimas“ tyrimas

  • Užklausa: „vektorinės duomenų bazės, paaiškintos kūrėjams 2025 m.“
  • Filtrai: vaizdo įrašai po 2023 m., trukmė 6–30 minučių
  • Rezultatas: agentas cituoja 6 vaizdo įrašus, pabrėžia HNSW ir IVF-PQ kompromisus, aptaria išlaidas / atšaukimą ir pateikia nuorodas į etalonus. Prieštaravimų skyriuje lyginami pardavėjų teiginiai ir atvirojo kodo rezultatai.

Beje: šio proceso automatizavimas jūsų darbo eigoje

Jei dirbate su dokumentais ir kodu, verta automatizuoti paskutinį etapą. Maža CLI gali vykdyti naktines užklausas ir įterpti Markdown ataskaitas į jūsų žinių bazę. Taip pat galite įtraukti ją į problemų šablonus sprinto tyrimams.
Verta paminėti: jei jūsų darbo eiga jau vyksta naršyklės šoninėje juostoje arba AI asistente, tokie įrankiai kaip Sider.AI gali supaprastinti tyrimo ciklą – pasirinkite temą, paleiskite paiešką, užfiksuokite nuorašus ir parengkite Claude pagrįstą santrauką tiesiogiai ten, kur dirbate. Tai gali sutaupyti konteksto perjungimo ir padaryti YouTube tyrimų agento kūrimą su Claude Code dar praktiškesnį komandoms.

Pagrindinės išvados

  • YouTube tyrimų agento kūrimas su Claude Code yra didelė svertas, leidžianti vaizdo įrašus paversti veiksmingomis ataskaitomis.
  • Minimalus rinkinys: YouTube API + nuorašai + skaidymas + įterpimai + FAISS + Claude sintezė.
  • Atnaujinimo keliai: hibridinė paieška, perrūšiavimas, planavimo kilpos ir griežtas citatų sekimas.
  • Pradėkite paprastai, išmatuokite patikimumą ir siekite patikimumo.

Kiti žingsniai

  • Įdiekite tikrą įterpimo modelį ir hibridinį atgavimą
  • Pridėkite perrūšiavimo etapą ir kokybės metrikas
  • Sukurkite suplanuotą užduotį, kad kas savaitę atnaujintumėte temas
  • Supakuokite kaip CLI ir lengvą žiniatinklio vartotojo sąsają

DUK

Q1:Kaip pradėti kurti YouTube tyrimų agentą su Claude Code? Pradėkite nuo YouTube paieškos, gaukite nuorašus, suskaidykite turinį, įterpkite į vektorinę saugyklą ir naudokite Claude Code rezultatams susintetinti. Aukščiau esančiame vadove pateiktas žingsnis po žingsnio kodas, skirtas surinkti veikiantį vamzdyną.
Q2:Kokios bibliotekos geriausiai tinka YouTube tyrimų agentui? Naudokite YouTube Data API paieškai, youtube-transcript-api subtitrams, FAISS vektorinei paieškai ir Anthropic SDK Claude Code iškviesti. Galite pakeisti įterpimus su OpenAI, Nomic arba BGE.
Q3:Kaip užtikrinti tikslias citatas ir laiko žymas? Skaidydami išsaugokite pradžios / pabaigos laiko žymas ir reikalaukite, kad Claude Code cituotų [video_id @ mm:ss]. Prieš skelbdami patikrinkite, ar cituojamos laiko žymos egzistuoja atgautuose fragmentuose.
Q4:Ar galiu naudoti šį agentą privatiems arba neįtrauktiems vaizdo įrašams? Taip, jei turite prieigą ir galite gauti nuorašus arba paleisti vietinį ASR (pvz., Whisper). Visada gerbkite leidimus ir venkite platinti autorių teisėmis saugomą turinį.
Q5:Kaip galiu padidinti šio YouTube tyrimų agento mastelį komandoms? Pridėkite talpyklą, bendrą vektorinę saugyklą, užduočių eiles ir suplanuotus vykdymus. Integruokite su Slack arba wiki ir apsvarstykite galimybę naudoti naršyklės pagrindu veikiantį asistentą, pvz., Sider.AI, kad supaprastintumėte tyrėjų darbo eigas.

Naujausi straipsniai
Kaip įvaldyti ChatPDF: Greitesnės įžvalgos iš sudėtingų dokumentų

Kaip įvaldyti ChatPDF: Greitesnės įžvalgos iš sudėtingų dokumentų

Geriausia X automatinio vertimo alternatyva greitiems ir tiksliems dokumentams

Geriausia X automatinio vertimo alternatyva greitiems ir tiksliems dokumentams

„Samsung“ AI vertimas neprieinamas Irane? Praktiniai sprendimai

„Samsung“ AI vertimas neprieinamas Irane? Praktiniai sprendimai

Persų kalbos vertimo įrankiai: praktiškas vadovas greitesniam ir tikslesniam darbui

Persų kalbos vertimo įrankiai: praktiškas vadovas greitesniam ir tikslesniam darbui

Geriausia Grok alternatyva giluminiams, cituojamiems tyrimams

Geriausia Grok alternatyva giluminiams, cituojamiems tyrimams

15 geriausių AI vaizdų generatoriaus funkcijų, kurias iš tikrųjų naudosite

15 geriausių AI vaizdų generatoriaus funkcijų, kurias iš tikrųjų naudosite