Sider.ai
  • Klepet
  • Wisebase
  • Orodja
  • Razširitev
  • Stranke
  • Cenitev
Prenesi zdaj
Vpiši se

Učite se hitreje, razmišljajte globlje in rastite pametneje s Sider.

Izdelki
Aplikacije
  • Razširitve
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Orodja
  • Ustvarjalec spletnih straniNew
  • AI DiapozitiviNew
  • AI pisec esejev
  • Nano Banana Pro
  • Nano Banana Infographic
  • AI generator slik
  • Italijanski generator možganske zmešnjave
  • Odstranjevalec ozadja
  • Menjalnik ozadja
  • Brisalo za fotografije
  • Odstranjevalec besedila
  • Inpaint
  • Povečevalnik slik
  • Ustvari
  • AI prevajalnik
  • Prevajalnik slik
  • PDF prevajalnik
Sider
  • Kontaktirajte nas
  • Center za pomoč
  • Prenesi
  • Cenik
  • Izobraževalni načrt
  • Kaj je novega
  • Blog
  • Skupnost
  • Partnerji
  • Partnerski program
  • Povabi
©2026 Vse pravice pridržane
Pogoji uporabe
Politika zasebnosti
  • Domača stran
  • Blog
  • AI Orodja
  • Korak za korakom: Izdelava agenta za raziskovanje YouTube z uporabo kode Claude

Korak za korakom: Izdelava agenta za raziskovanje YouTube z uporabo kode Claude

Posodobljeno 19. sep. 2025

8 min


Korak za korakom: Izdelava YouTube raziskovalnega agenta s kodo Claude

Če ste že kdaj preživeli popoldne v neskončnem brskanju po YouTubu in nato pozabili, kateri videoposnetki so vredni shranjevanja, niste edini. Zdaj si predstavljajte neutrudljivega pomočnika, ki lahko najde najboljše videoposnetke, izlušči povzetke, pridobi ključne citate, časovno označi vpoglede in na zahtevo vrne vire – hitro. Točno to lahko stori YouTube raziskovalni agent. V tem vodniku po korakih bomo zgradili praktičnega YouTube raziskovalnega agenta s kodo Claude, zasnovanega za ustvarjalce, analitike, študente in obsedene učence, ki želijo signal namesto šuma.
Ubrali bomo praktično in neposredno pot: arhitektura, koda, pozivi in varovala. Med potjo bomo sprejeli izrazite odločitve, ki jih lahko pozneje zamenjate. Na koncu boste imeli delujočega agenta, ki lahko išče po YouTubu, zbira prepise, sklepa na podlagi več videoposnetkov in ustvari čiste raziskovalne povzetke.

Kaj gradimo (in zakaj je to pomembno)

  • Cilj: YouTube raziskovalni agent, ki lahko:
  • Išče po YouTubu glede na poizvedbo
  • Razvršča rezultate po relevantnosti/angažiranosti
  • Pridobiva prepise (samodejni podnapisi ali tretje osebe)
  • Razdeli in vloži vsebino za iskanje
  • Uporablja kodo Claude za sintetiziranje vpogledov iz več videoposnetkov
  • Ustvari strukturirane zapiske: povzetek, trditve, časovne oznake, citate in navedbe virov
  • Primarna ključna beseda: "Izdelava YouTube raziskovalnega agenta s kodo Claude"
  • Format: Vadnica po korakih z izvedljivo kodo in pozivi
  • Izhodi: Povzetek raziskave v Markdownu + JSON za programsko uporabo
Zakaj je to pomembno: YouTube je največja javna baza znanja s predavanji, lekcijami, predstavitvami in razpravami. Ampak je preglasen. Izdelava YouTube raziskovalnega agenta s kodo Claude vam daje prednost: v nekaj minutah lahko zberete vpoglede iz ducatov videoposnetkov, ne pa v urah.

Arhitektura na kratko

Prvo različico bomo ohranili preprosto in robustno.
  • Vhodi: raziskovalna poizvedba (npr. "arhitekture agentov LLM 2025"), izbirne omejitve (časovno obdobje, kanal, trajanje)
  • Iskanje po YouTubu: YouTube Data API v3 (ali SerpAPI kot rezerva)
  • Prepisi: YouTube Transcript API; rezerva ASR (npr. Whisper), ko ni na voljo
  • Razkosanje: Segmentacija, ki upošteva stavke (približno 800–1.200 žetonov)
  • Vlaganje: Uporabite lokalni ali gostujoči model za vlaganje (npr. text-embedding-3-large, nomic-embed-text ali bge-large)
  • Vektorska baza: Lokalni FAISS za hitrost; lahko zamenjate s Pinecone, Weaviate ali Qdrant
  • Sklepanje: Koda Claude za orkestracijo, uporabo orodij, sintezo in izvajanje kode znotraj nadzorovane zanke
  • Izhodi: Poročilo v Markdownu + JSON indeks z navedbami, časovnimi oznakami in rezultati
Tok podatkov: Poizvedba → Iskanje → Pridobivanje metapodatkov → Prepis → Razkosanje → Vlaganje → Pridobivanje najboljših K → Sinteza s kodo Claude → Poročilo.

Predpogoji in nastavitev

  • Python 3.10+
  • API ključi: YOUTUBE_API_KEY, ANTHROPIC_API_KEY (za kodo Claude)
  • Izbirno: OPENAI_API_KEY ali lokalno vlaganje
  • Knjižnice:
  • google-api-python-client, youtube-transcript-api
  • faiss-cpu, numpy, pandas, tiktoken (ali sentencepiece)
  • requests, pydantic, tenacity
  • anthropic (Claude API)
pip install google-api-python-client youtube-transcript-api faiss-cpu numpy pandas requests pydantic tenacity anthropic tiktoken
Spremenljivke okolja:
export YOUTUBE_API_KEY=YOUR_YT_KEY
export ANTHROPIC_API_KEY=YOUR_ANTHROPIC_KEY

1. korak: Iskanje po YouTubu s filtri

Iskali bomo po YouTubu in vrnili strukturirane metapodatke: naslov, kanal, datum objave, trajanje, ogledi (če so na voljo) in videoId.
# datoteka: yt_search.py
from googleapiclient.discovery import build
import os
YOUTUBE_API_KEY = os.environ — kanal, datum\n\n"
"---\n"
"JSON schema: {\"claims\":[{\"claim\":str,\"support\":[{\"video_id\":str,\"start\":float,\"end\":float}]}]}\n"
)
def call_claude(goal: str, passages: list[dict]):
passages_str = "\n\n".join(
f"[rank {p['rank']} | score {p['score']:.3f}] (vID={p.get('video_id','?')}, {p.get('start',0):.1f}-{p.get('end',0):.1f})\n{p['text']}"
for p in passages
)
msg = client.messages.create(
model="claude-3-5-sonnet-20240620",
max_tokens=1800,
temperature=0.2,
system=SYSTEM_PROMPT,
messages=[
{"role": "user", "content": USER_TEMPLATE.format(goal=goal, passages=passages_str)}
])
return msg.content[0].text
Nasveti za pozive pri izdelavi YouTube raziskovalnega agenta s kodo Claude:
  • Zahtevajte strukturirane izhode v človeku berljivi in strojno berljivi obliki
  • Uveljavite časovno označene navedbe virov
  • Spodbujajte razkritje negotovosti in protislovij

6. korak: Sestavljanje vsega skupaj

Povežimo poizvedbo → iskanje → prepise → kose → vlaganje → pridobivanje → sintezo.
# datoteka: run_agent.py
from yt_search import search_youtube
from transcripts import fetch_transcript
from chunking import transcript_to_docs
from embeddings import VectorStore
from orchestrator import call_claude
from datetime import datetime
def build_corpus(query: str, max_videos=8):
results = search_youtube(query, max_results=max_videos)
corpus_docs = []
for r in results:
tx = fetch_transcript(r["video_id"]) or []
if not tx:
continue
docs = transcript_to_docs(tx)
for d in docs:
d.update({
"video_id": r["video_id"],
"title": r["title"],
"channel": r["channel"],
"url": r["url"],
})
corpus_docs.extend(docs)
return corpus_docs
def research(query: str, k=12):
corpus = build_corpus(query)
if not corpus:
return "No transcripts available."
vs = VectorStore
vs.add(corpus)
passages = vs.search(query, k=k)
md = call_claude(query, passages)
timestamp = datetime.utcnow.isoformat
return f"<!-- generated {timestamp} UTC -->\n\n" + md
if __name__ == "__main__":
print(research("LLM agents for YouTube research"))
Ta osnovna različica YouTube raziskovalnega agenta s kodo Claude bo iskala, pridobivala in sintetizirala vpoglede iz več videoposnetkov z navedbami virov. Nadgradite vlaganje in dodajte predpomnjenje, da bo pripravljen za produkcijo.

Sedem nadgradenj za izboljšanje

  1. Boljše vlaganje in hibridno iskanje
  • Zamenjajte z visokokakovostnim vlaganjem in dodajte iskanje ključnih besed BM25. Hibridno iskanje omogoča boljši priklic pri nišnih izrazih in boljšo natančnost pri abstraktnih temah.
  1. Razširite orodja za bogatejše metapodatke
  • Pridobite komentarje, razmerje med všečki/nevšečki in avtoriteto kanala. Dodajte ponovno razvrščanje (navzkrižni kodirnik) za 100 najboljših kandidatov.
  1. Večkratno raziskovalno načrtovanje
  • Uporabite kodo Claude za predlaganje raziskovalnega načrta: podvprašanja, hipoteze in preverjanje pokritosti. Izvajajte iterativno, dokler niso doseženi pragovi pokritosti.
  1. Sledenje dokazom in protidokazi
  • Za vsako trditev zabeležite podporne in protislovne izrezke. Predstavite oboje v poročilih; dodajte ocene zaupanja.
  1. Strategije za dolge videoposnetke
  • Uporabite zaznavanje prizorov prek podnapisov ali časovnih podatkov besed Whisper. Povzemite po odsekih pred globalno sintezo, da se izognete redčenju konteksta.
  1. Predpomnjenje in vztrajnost
  • Shranite prepise, vlaganje in poročila na poizvedbo. Ponovno uporabite, ko uporabniki prilagodijo filtre. Dodajte odstranjevanje podvojenih vnosov po ID-ju videoposnetka.
  1. Formati izvoza in dostava
  • Izvozite Markdown, PDF in JSON. E-poštna ali Slack dostava. Upodobite časovne oznake kot povezave, na katere je mogoče klikniti, ?t=mmss.

Pozivi, ki jih lahko ponovno uporabite

Uporabite te predloge pri izdelavi YouTube raziskovalnega agenta s kodo Claude.
Sistem: Ste natančen raziskovalni agent. Sintetizirajte več YouTube prepisov. Navajajte inline z [vID @ mm:ss] in vključite odsek Viri z URL-ji. Vrnite kratek opis v Markdownu in JSON datoteko trditev s časovno označenimi podporami.
Uporabnik: Raziskovalni cilj: {tema}
Omejitve: osredotočite se na {ciljno skupino ali obseg}; raje imejte vire znotraj {časovno obdobje}; vključite nestrinjanja.
Kandidatni odlomki (razvrščeni):
{retrieved_passages}
Izhod: Povzetek → Ključni vpogledi (točke) → Pomembni citati (s časovnimi oznakami) → Protislovja in vrzeli → Viri. Nato JSON {"claims": ...}

Varovala in etika

  • Spoštujte pravice ustvarjalcev: Povežite se z izvirnimi videoposnetki in se izogibajte objavljanju velikih dobesednih prepisov.
  • Bodite pregledni: Pokažite, od kod izvirajo trditve, s časovnimi oznakami in ID-ji videoposnetkov.
  • Izogibajte se pretiranemu povzemanju: Ohranjajte nianse; označite, kdaj so podnapisi samodejno ustvarjeni in verjetno hrupni.
  • Pazljivo ravnajte z občutljivimi temami: Poudarite negotovost in poiščite različne vire.

Odpravljanje težav: Pogoste težave in popravki

  • "Prepis ni najden"
  • Uporabite Whisper kot rezervo; poskusite z različnimi jeziki; preverite, ali je videoposnetek blokiran za regijo.
  • Slaba kakovost pridobivanja
  • Nadgradite vlaganje; dodajte BM25; povečajte prekrivanje kosov; parameter‑uglasite top‑K.
  • Halucinirane navedbe virov
  • Vsili strogo shemo navajanja virov; kaznujte nepodprte trditve; zahtevajte natančne časovne oznake, prisotne v pridobljenih kosih.
  • Omejitve kvote API-ja
  • Agresivno predpomnite; zmanjšajte max_results; paketne zahteve; dodajte odmik s tenacity.
  • Dolgotrajno odstopanje
  • Povzemite po odsekih; omejite največje število žetonov; uporabite načrtovalne pozive z izrecnim orisom.

Merjenje kakovosti

  • Natančnost@K pridobljenih kosov v primerjavi z označenim naborom
  • Stopnja zanesljivosti: delež trditev s preverljivo časovno označeno podporo
  • Pokritost: število edinstvenih ustreznih navedenih videoposnetkov
  • Latenca: čas od poizvedbe do poročila

Primer: Raziskovanje "Pojasnjene vektorske baze podatkov"

  • Poizvedba: "vektorske baze podatkov, pojasnjene za razvijalce 2025"
  • Filtri: videoposnetki po letu 2023, trajanje 6–30 minut
  • Rezultat: Agent navaja 6 videoposnetkov, poudarja kompromise med HNSW in IVF‑PQ, razpravlja o stroških/priklicu in povezuje z merili uspešnosti. Odsek o protislovjih primerja trditve prodajalcev z rezultati odprte kode.

Mimogrede: Avtomatizacija tega znotraj vašega poteka dela

Če delate z dokumenti in kodo, je vredno avtomatizirati zadnji korak. Majhna CLI lahko izvaja nočne poizvedbe in spusti povzetke v Markdownu v vašo bazo znanja. Lahko jo tudi povežete s predlogami težav za raziskave sprintov.
Omeniti velja: če vaš potek dela že poteka v stranski vrstici brskalnika ali pomočniku AI, lahko orodja, kot je Sider.AI, poenostavijo raziskovalno zanko – izberite temo, zaženite iskanje, zajemite prepise in pripravite povzetek s pomočjo Claude neposredno tam, kjer delate. To lahko prihrani preklapljanje konteksta in naredi izdelavo YouTube raziskovalnega agenta s kodo Claude še bolj praktično za ekipe.

Ključni zaključki

  • Izdelava YouTube raziskovalnega agenta s kodo Claude je način z velikim učinkom, da videoposnetke spremenite v kratke informacije, na podlagi katerih je mogoče ukrepati.
  • Minimalni sklad: YouTube API + prepisi + razkosanje + vlaganje + FAISS + sinteza s Claude.
  • Poti nadgradnje: hibridno iskanje, ponovno razvrščanje, načrtovalne zanke in strogo sledenje navajanju virov.
  • Začnite preprosto, izmerite zanesljivost in ponavljajte proti zanesljivosti.

Naslednji koraki

  • Izvedite pravi model za vlaganje in hibridno pridobivanje
  • Dodajte korak ponovnega razvrščanja in meritve kakovosti
  • Ustvarite načrtovano opravilo za osveževanje tem tedensko
  • Pakirajte kot CLI in lahek spletni uporabniški vmesnik

Pogosta vprašanja

V1: Kako začnem graditi YouTube raziskovalnega agenta s kodo Claude? Začnite z iskanjem po YouTubu, pridobite prepise, razkosajte vsebino, jo vložite v vektorsko bazo in uporabite kodo Claude za sintetiziranje rezultatov. Zgornji vodnik ponuja navodila po korakih za sestavljanje delujočega cevovoda.
V2: Katere knjižnice so najboljše za YouTube raziskovalnega agenta? Uporabite YouTube Data API za iskanje, youtube-transcript-api za podnapise, FAISS za vektorsko iskanje in Anthropic SDK za klic kode Claude. Vlaganje lahko zamenjate z OpenAI, Nomic ali BGE.
V3: Kako zagotovim natančne navedbe virov in časovne oznake? Med razkosanjem ohranite začetne/končne časovne oznake in zahtevajte od kode Claude, da navaja [video_id @ mm:ss]. Pred objavo preverite, ali navedene časovne oznake obstajajo v pridobljenih kosih.
V4: Ali lahko uporabim tega agenta za zasebne ali neuvrščene videoposnetke? Da, če imate dostop in lahko pridobite prepise ali zaženete lokalni ASR (npr. Whisper). Vedno spoštujte dovoljenja in se izogibajte distribuciji vsebine, zaščitene z avtorskimi pravicami.
V5: Kako lahko razširim tega YouTube raziskovalnega agenta za ekipe? Dodajte predpomnjenje, skupno vektorsko bazo, čakalne vrste opravil in načrtovane izvajanja. Integrirajte s Slackom ali wikijem in razmislite o pomočniku, ki temelji na brskalniku, kot je Sider.AI, da poenostavite poteke dela raziskovalcev.

Novi članki
Kako obvladati ChatPDF: Hitrejši vpogledi v obsežne dokumente

Kako obvladati ChatPDF: Hitrejši vpogledi v obsežne dokumente

Najboljša alternativa X samodejnemu prevajanju za hitre in natančne dokumente

Najboljša alternativa X samodejnemu prevajanju za hitre in natančne dokumente

Samsung AI prevajanje ni na voljo v Iranu? Praktične rešitve

Samsung AI prevajanje ni na voljo v Iranu? Praktične rešitve

Orodja za prevajanje v perzijski jezik: praktičen vodnik za hitrejše in natančno delo

Orodja za prevajanje v perzijski jezik: praktičen vodnik za hitrejše in natančno delo

Najboljša alternativa Groku za poglobljene, citirane raziskave

Najboljša alternativa Groku za poglobljene, citirane raziskave

Top 15 funkcij generatorja slik z umetno inteligenco, ki jih boste dejansko uporabljali

Top 15 funkcij generatorja slik z umetno inteligenco, ki jih boste dejansko uporabljali