Sider.ai
  • Chat
  • Wisebase
  • Mga gamit
  • Extension
  • Mga kliyente
  • Pagpepresyo
I-download na ngayon
Mag log in

Matuto nang mas mabilis, mag-isip nang mas malalim, at lumago nang mas matalino kasama ang Sider.

Mga Produkto
Mga App
  • Mga Extension
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Mga Kasangkapan
  • Tagalikha ng WebsiteNew
  • AI SlidesNew
  • AI Manunulat ng Sanaysay
  • Nano Banana Pro
  • Nano Banana Infographic
  • AI Tagalikha ng Larawan
  • Italian Brainrot Generator
  • Tagapag-alis ng Background
  • Tagapagpalit ng Background
  • Pambura ng Larawan
  • Tagapag-alis ng Teksto
  • Inpaint
  • Tagapagpataas ng Kalidad ng Larawan
  • Lumikha
  • AI Tagasalin
  • Tagasalin ng Larawan
  • Tagasalin ng PDF
Sider
  • Makipag-ugnayan sa Amin
  • Sentro ng Tulong
  • I-download
  • Pagpepresyo
  • Plano ng Edukasyon
  • Ano'ng Bago
  • Blog
  • Komunidad
  • Mga Kasosyo
  • Affiliate
  • Imbitahan
©2026 Lahat ng Karapatan ay Nakalaan
Mga Tuntunin ng Paggamit
Patakaran sa Privacy
  • Home Page
  • Blog
  • Mga Kasangkapan ng AI
  • Sunud-sunod na Hakbang: Pagbuo ng YouTube Research Agent gamit ang Claude Code

Sunud-sunod na Hakbang: Pagbuo ng YouTube Research Agent gamit ang Claude Code

Na-update noong Sep 19, 2025

8 min


Step‑by‑Step: Pagbuo ng YouTube Research Agent gamit ang Claude Code

Kung naglaan ka na ng isang hapon sa paglalakbay sa YouTube, para lang makalimutan kung aling mga video ang dapat i-save, hindi ka nag-iisa. Ngayon isipin ang isang walang pagod na katulong na makakahanap ng pinakamahusay na mga video, kukuha ng mga buod, maglalabas ng mga pangunahing sipi, mga timestamp na pananaw, at magbabalik ng mga mapagkukunan on demand—nang mabilis. Iyan mismo ang kayang gawin ng isang YouTube research agent. Sa step‑by‑step na gabay na ito, bubuo tayo ng isang praktikal na YouTube research agent gamit ang Claude Code, na idinisenyo para sa mga creator, analyst, estudyante, at mga nahuhumaling na nag-aaral na gusto ang signal kaysa ingay.
Gagamit tayo ng isang praktikal at direktang ruta: arkitektura, code, prompts, at guardrails. Sa daan, gagawa tayo ng mga opinionated na pagpipilian na maaari mong palitan sa ibang pagkakataon. Sa pagtatapos, magkakaroon ka ng isang gumaganang agent na maaaring maghanap sa YouTube, mangalap ng mga transcript, mag-isip sa maraming video, at gumawa ng malinis na mga research brief.

Ano ang Ating Binubuo (at Bakit Ito Mahalaga)

  • Layunin: Isang YouTube research agent na maaaring:
  • Maghanap sa YouTube sa pamamagitan ng query
  • I-rank ang mga resulta ayon sa relevance/engagement
  • Kumuha ng mga transcript (auto‑captions o third‑party)
  • I-chunk at i-embed ang content para sa pagkuha
  • Gumamit ng Claude Code upang i-synthesize ang mga pananaw mula sa maraming video
  • Maglabas ng mga structured na tala: buod, mga claim, mga timestamp, mga sipi, at mga citation
  • Pangunahing keyword: "Pagbuo ng YouTube research agent gamit ang Claude Code"
  • Format: Step‑by‑step na tutorial na may tumatakbong code at mga prompt
  • Mga Output: Markdown research brief + JSON para sa programmatic na paggamit
Bakit ito mahalaga: Ang YouTube ay ang pinakamalaking pampublikong knowledge base ng mga talks, lessons, demos, at debates. Ngunit ito ay maingay. Ang pagbuo ng isang YouTube research agent gamit ang Claude Code ay nagbibigay sa iyo ng kalamangan: maaari mong pagsamahin ang mga pananaw sa dose-dosenang mga video sa ilang minuto, hindi oras.

Arkitektura sa Isang Sulyap

Pananatilihin nating simple at matatag ang unang bersyon.
  • Mga Input: isang research query (hal., "LLM agent architectures 2025"), mga opsyonal na paghihigpit (saklaw ng petsa, channel, tagal)
  • YouTube Search: YouTube Data API v3 (o SerpAPI fallback)
  • Mga Transcript: YouTube Transcript API; fallback sa ASR (hal., Whisper) kapag hindi available
  • Chunking: Sentence‑aware segmentation (tinatayang 800–1,200 tokens)
  • Mga Embedding: Gumamit ng isang lokal o hosted na embedding model (hal., text-embedding-3-large, nomic-embed-text, o bge-large)
  • Vector Store: Lokal na FAISS para sa bilis; maaaring palitan sa Pinecone, Weaviate, o Qdrant
  • Pangangatwiran: Claude Code para sa orchestration, tool use, synthesis, at pagpapatupad ng code sa loob ng isang kontroladong loop
  • Mga Output: Markdown report + JSON index na may mga citation, timestamp, at mga score
Data flow: Query → Search → Kumuha ng metadata → Transcript → Chunk → Embed → Kunin ang top‑K → Claude Code synthesis → Report.

Mga Kinakailangan at Setup

  • Python 3.10+
  • Mga API key: YOUTUBE_API_KEY, ANTHROPIC_API_KEY (para sa Claude Code)
  • Opsyonal: OPENAI_API_KEY o mga lokal na embedding
  • Mga Library:
  • google-api-python-client, youtube-transcript-api
  • faiss-cpu, numpy, pandas, tiktoken (o sentencepiece)
  • requests, pydantic, tenacity
  • anthropic (Claude API)
pip install google-api-python-client youtube-transcript-api faiss-cpu numpy pandas requests pydantic tenacity anthropic tiktoken
Mga variable ng environment:
export YOUTUBE_API_KEY=YOUR_YT_KEY
export ANTHROPIC_API_KEY=YOUR_ANTHROPIC_KEY

Hakbang 1: YouTube Search na may mga Filter

Maghahanap tayo sa YouTube at magbabalik ng structured metadata: pamagat, channel, petsa ng pag-publish, tagal, mga view (kung available), at videoId.
# file: yt_search.py
from googleapiclient.discovery import build
import os
YOUTUBE_API_KEY = os.environ — channel, date\n\n"
"---\n"
"JSON schema: {\"claims\":[{\"claim\":str,\"support\":[{\"video_id\":str,\"start\":float,\"end\":float}]}]}\n"
)
def call_claude(goal: str, passages: list[dict]):
passages_str = "\n\n".join(
f"[rank {p['rank']} | score {p['score']:.3f}] (vID={p.get('video_id','?')}, {p.get('start',0):.1f}-{p.get('end',0):.1f})\n{p['text']}"
for p in passages
)
msg = client.messages.create(
model="claude-3-5-sonnet-20240620",
max_tokens=1800,
temperature=0.2,
system=SYSTEM_PROMPT,
messages=[
{"role": "user", "content": USER_TEMPLATE.format(goal=goal, passages=passages_str)}
])
return msg.content[0].text
Mga tip sa prompt kapag bumubuo ng isang YouTube research agent gamit ang Claude Code:
  • Humingi ng mga structured na output sa parehong format na nababasa ng tao at nababasa ng machine
  • Ipatupad ang mga timestamped na citation
  • Hikayatin ang mga pagbubunyag ng kawalan ng katiyakan at mga kontradiksyon

Hakbang 6: Pinagsasama-sama ang Lahat

Ikonekta natin ang query → search → transcripts → chunks → embeddings → retrieve → synthesize.
# file: run_agent.py
from yt_search import search_youtube
from transcripts import fetch_transcript
from chunking import transcript_to_docs
from embeddings import VectorStore
from orchestrator import call_claude
from datetime import datetime
def build_corpus(query: str, max_videos=8):
results = search_youtube(query, max_results=max_videos)
corpus_docs = []
for r in results:
tx = fetch_transcript(r["video_id"]) or []
if not tx:
continue
docs = transcript_to_docs(tx)
for d in docs:
d.update({
"video_id": r["video_id"]
"title": r["title"]
"channel": r["channel"]
"url": r["url"]
})
corpus_docs.extend(docs)
return corpus_docs
def research(query: str, k=12):
corpus = build_corpus(query)
if not corpus:
return "No transcripts available."
vs = VectorStore
vs.add(corpus)
passages = vs.search(query, k=k)
md = call_claude(query, passages)
timestamp = datetime.utcnow.isoformat
return f"<!-- generated {timestamp} UTC -->\n\n" + md
if __name__ == "__main__":
print(research("LLM agents for YouTube research"))
Ang baseline na bersyon na ito ng isang YouTube research agent gamit ang Claude Code ay maghahanap, kukuha, at mag-synthesize ng mga pananaw mula sa maraming video na may mga citation. I-upgrade ang mga embedding at magdagdag ng caching upang gawin itong handa na para sa produksyon.

Pitong Pag-upgrade Para Gawin Itong Mahusay

  1. Mas mahusay na mga embedding at hybrid na paghahanap
  • Magpalit ng mga de-kalidad na embedding at magdagdag ng BM25 keyword search. Ang hybrid ay nagbibigay ng mas maraming recall sa mga niche na termino at mas mahusay na precision sa mga abstract na paksa.
  1. Palawakin ang mga tool para sa mas mayaman na metadata
  • Kumuha ng mga komento, ratio ng likes/dislikes, at channel authority. Magdagdag ng isang re‑ranker (cross‑encoder) para sa nangungunang 100 kandidato.
  1. Multi‑turn na pagpaplano ng pananaliksik
  • Gumamit ng Claude Code upang magmungkahi ng isang plano ng pananaliksik: mga sub‑question, mga hypothesis, at mga coverage check. Ipatupad nang paulit-ulit hanggang sa maabot ang mga threshold ng coverage.
  1. Pagsubaybay sa ebidensya at counter‑evidence
  • Para sa bawat claim, i-log ang sumusuporta at sumasalungat na mga snippet. Ipakita ang pareho sa mga report; magdagdag ng mga confidence score.
  1. Mga estratehiya para sa mahabang video
  • Gumamit ng scene detection sa pamamagitan ng mga subtitle o mga timing ng salita ng Whisper. Ibuod bawat seksyon bago ang global synthesis upang maiwasan ang context dilution.
  1. Caching at persistence
  • Mag-imbak ng mga transcript, embedding, at mga report bawat query. Muling gamitin kapag binago ng mga user ang mga filter. Magdagdag ng deduplication sa pamamagitan ng video ID.
  1. Mga format ng pag-export at paghahatid
  • Mag-export ng Markdown, PDF, at JSON. Paghahatid sa pamamagitan ng email o Slack. I-render ang mga timestamp bilang mga clickable na ?t=mmss na mga link.

Mga Prompt na Maaari Mong Muling Gamitin

Gamitin ang mga template na ito habang bumubuo ng isang YouTube research agent gamit ang Claude Code.
System: Ikaw ay isang metikuloso na research agent. I-synthesize ang mga transcript mula sa maraming YouTube. Mag-cite inline gamit ang [vID @ mm:ss], at isama ang isang seksyon ng Mga Pinagmulan na may mga URL. Ibalik ang parehong Markdown brief at isang JSON payload ng mga claim na may timestamped na suporta.
User: Layunin ng pananaliksik: {topic}
Mga paghihigpit: tumuon sa {audience or scope}; mas gusto ang mga pinagmulan sa loob ng {date range}; isama ang mga hindi pagkakasundo.
Mga kandidatong passage (na-rank):
{retrieved_passages}
Output: Buod → Mga Pangunahing Pananaw (mga bullet) → Mga Kapansin-pansing Sipi (na may mga timestamp) → Mga Kontradiksyon at mga Puwang → Mga Pinagmulan. Pagkatapos JSON {\"claims\": ...}

Mga Guardrail at Etika

  • Igalang ang mga karapatan ng creator: Mag-link sa mga orihinal na video at iwasang mag-publish ng malalaking verbatim na mga transcript.
  • Maging transparent: Ipakita kung saan nagmula ang mga claim gamit ang mga timestamp at mga video ID.
  • Iwasan ang labis na pagsasa-buod: Panatilihin ang nuance; i-flag kapag ang mga caption ay auto‑generated at malamang na maingay.
  • Pangasiwaan nang maingat ang mga sensitibong paksa: I-highlight ang kawalan ng katiyakan at humanap ng iba't ibang mga pinagmulan.

Pag-troubleshoot: Mga Karaniwang Isyu at Mga Pag-aayos

  • "Walang transcript na natagpuan"
  • Fallback sa Whisper; subukan ang iba't ibang mga wika; suriin kung ang video ay naka‑block sa rehiyon.
  • Hindi magandang kalidad ng pagkuha
  • I-upgrade ang mga embedding; magdagdag ng BM25; dagdagan ang chunk overlap; parameter‑tune top‑K.
  • Mga hallucinated citation
  • Pilitin ang mahigpit na citation schema; parusahan ang mga hindi suportadong claim; kailanganin ang eksaktong mga timestamp na naroroon sa mga nakuha na chunk.
  • Mga limitasyon ng API quota
  • Mag-cache nang agresibo; bawasan ang max_results; batch requests; magdagdag ng back‑off gamit ang tenacity.
  • Long‑form drift
  • Ibuod bawat seksyon; paghigpitan ang max tokens; gumamit ng mga planning prompt na may malinaw na outline.

Pagsukat ng Kalidad

  • Precision@K ng mga nakuha na chunk kumpara sa isang labeled na set
  • Faithfulness rate: proporsyon ng mga claim na may nabe-verify na timestamped na suporta
  • Coverage: bilang ng mga natatanging nauugnay na video na binanggit
  • Latency: oras mula sa query hanggang sa report

Halimbawa: Pagsasaliksik ng "Vector Databases Explained"

  • Query: "vector databases explained for developers 2025"
  • Mga Filter: mga video pagkatapos ng 2023, tagal 6–30 minuto
  • Kinalabasan: Ang Agent ay nagbanggit ng 6 na video, nagha-highlight ng mga trade‑off ng HNSW kumpara sa IVF‑PQ, tinatalakay ang cost/recall, at nagli-link sa mga benchmark. Inihahambing ng seksyon ng Mga Kontradiksyon ang mga claim ng vendor kumpara sa mga open‑source na resulta.

Sa Daan: Pag-automate Nito sa Loob ng Iyong Workflow

Kung nagtatrabaho ka sa mga doc at code, sulit na i-automate ang huling milya. Ang isang maliit na CLI ay maaaring magpatakbo ng mga nightly query at mag-drop ng mga Markdown brief sa iyong knowledge base. Maaari mo rin itong ikonekta sa mga issue template para sa sprint research.
Sulit na banggitin: kung ang iyong workflow ay nakatira na sa isang browser sidebar o AI assistant, ang mga tool tulad ng Sider.AI ay maaaring i-streamline ang research loop—pumili ng isang paksa, magpatakbo ng isang paghahanap, kumuha ng mga transcript, at mag-draft ng isang Claude‑powered na buod mismo kung saan ka nagtatrabaho. Ito ay maaaring makatipid ng context switching at gawing mas praktikal para sa mga team ang pagbuo ng isang YouTube research agent gamit ang Claude Code.

Mga Pangunahing Takeaway

  • Ang pagbuo ng isang YouTube research agent gamit ang Claude Code ay isang high‑leverage na paraan upang gawing actionable brief ang mga video.
  • Ang minimal na stack: YouTube API + mga transcript + chunking + mga embedding + FAISS + Claude synthesis.
  • Mga upgrade path: hybrid na paghahanap, re‑ranking, mga planning loop, at mahigpit na pagsubaybay sa citation.
  • Magsimula nang simple, sukatin ang faithfulness, at umulit patungo sa pagiging maaasahan.

Mga Susunod na Hakbang

  • Ipatupad ang isang tunay na embedding model at hybrid na pagkuha
  • Magdagdag ng isang re‑ranking na hakbang at mga sukatan ng kalidad
  • Lumikha ng isang naka-iskedyul na trabaho upang i-refresh ang mga paksa linggu-linggo
  • I-package bilang isang CLI at isang lightweight na web UI

FAQ

Q1:Paano ako magsisimulang bumuo ng isang YouTube research agent gamit ang Claude Code? Magsimula sa paghahanap sa YouTube, kumuha ng mga transcript, i-chunk ang content, i-embed sa isang vector store, at gumamit ng Claude Code upang i-synthesize ang mga resulta. Ang gabay sa itaas ay nagbibigay ng step-by-step na code upang tipunin ang isang gumaganang pipeline.
Q2:Anong mga library ang pinakamahusay para sa isang YouTube research agent? Gamitin ang YouTube Data API para sa paghahanap, youtube-transcript-api para sa mga caption, FAISS para sa vector search, at ang Anthropic SDK upang tawagan ang Claude Code. Maaari mong palitan ang mga embedding sa OpenAI, Nomic, o BGE.
Q3:Paano ko masisiguro ang mga tumpak na citation at mga timestamp? Panatilihin ang start/end na mga timestamp sa panahon ng chunking at kailanganin ang Claude Code na mag-cite ng [video_id @ mm:ss]. Patunayan na ang mga binanggit na timestamp ay umiiral sa mga nakuha na chunk bago i-publish.
Q4:Maaari ko bang gamitin ang agent na ito para sa mga pribado o hindi nakalistang video? Oo, kung mayroon kang access at maaaring kumuha ng mga transcript o magpatakbo ng lokal na ASR (hal., Whisper). Palaging igalang ang mga pahintulot at iwasan ang pamamahagi ng naka-copyright na content.
Q5:Paano ko ma-scale ang YouTube research agent na ito para sa mga team? Magdagdag ng caching, isang shared na vector store, mga job queue, at mga naka-iskedyul na pagpapatakbo. Isama sa Slack o isang wiki, at isaalang-alang ang isang browser-based na assistant tulad ng Sider.AI upang i-streamline ang mga workflow ng researcher.

Mga Kamakailang Artikulo
Paano Maging Eksperto sa ChatPDF: Mas Mabilis na Pagkuha ng Impormasyon mula sa Makakapal na Dokumento

Paano Maging Eksperto sa ChatPDF: Mas Mabilis na Pagkuha ng Impormasyon mula sa Makakapal na Dokumento

Ang Pinakamahusay na Alternatibo sa X Auto-Translation para sa Mabilis at Tumpak na Mga Dokumento

Ang Pinakamahusay na Alternatibo sa X Auto-Translation para sa Mabilis at Tumpak na Mga Dokumento

Hindi Available ang Samsung AI Translation sa Iran? Mga Praktikal na Solusyon

Hindi Available ang Samsung AI Translation sa Iran? Mga Praktikal na Solusyon

Mga Kasangkapan sa Pagsasalin ng Persian: Isang Praktikal na Gabay para sa Mas Mabilis at Tumpak na Trabaho

Mga Kasangkapan sa Pagsasalin ng Persian: Isang Praktikal na Gabay para sa Mas Mabilis at Tumpak na Trabaho

Ang Pinakamahusay na Alternatibo sa Grok para sa Malalim at May Sanggunian na Pananaliksik

Ang Pinakamahusay na Alternatibo sa Grok para sa Malalim at May Sanggunian na Pananaliksik

Top 15 Features ng AI Image Generator na Talagang Magagamit Mo

Top 15 Features ng AI Image Generator na Talagang Magagamit Mo