How do I start building a YouTube research agent with Claude Code?

Begin with YouTube search, fetch transcripts, chunk content, embed into a vector store, and use Claude Code to synthesize results. The guide above provides step-by-step code to assemble a working pipeline.

What libraries are best for a YouTube research agent?

Use the YouTube Data API for search, youtube-transcript-api for captions, FAISS for vector search, and the Anthropic SDK to call Claude Code. You can swap embeddings with OpenAI, Nomic, or BGE.

How do I ensure accurate citations and timestamps?

Keep start/end timestamps during chunking and require Claude Code to cite [video_id @ mm:ss]. Validate that cited timestamps exist in retrieved chunks before publishing.

Can I use this agent for private or unlisted videos?

Yes, if you have access and can fetch transcripts or run local ASR (e.g., Whisper). Always respect permissions and avoid distributing copyrighted content.

How can I scale this YouTube research agent for teams?

Add caching, a shared vector store, job queues, and scheduled runs. Integrate with Slack or a wiki, and consider a browser-based assistant like Sider.AI to streamline researcher workflows.

Step‑by‑Step: Pagbuo ng YouTube Research Agent gamit ang Claude Code

Kung naglaan ka na ng isang hapon sa paglalakbay sa YouTube, para lang makalimutan kung aling mga video ang dapat i-save, hindi ka nag-iisa. Ngayon isipin ang isang walang pagod na katulong na makakahanap ng pinakamahusay na mga video, kukuha ng mga buod, maglalabas ng mga pangunahing sipi, mga timestamp na pananaw, at magbabalik ng mga mapagkukunan on demand—nang mabilis. Iyan mismo ang kayang gawin ng isang YouTube research agent. Sa step‑by‑step na gabay na ito, bubuo tayo ng isang praktikal na YouTube research agent gamit ang Claude Code, na idinisenyo para sa mga creator, analyst, estudyante, at mga nahuhumaling na nag-aaral na gusto ang signal kaysa ingay.

Gagamit tayo ng isang praktikal at direktang ruta: arkitektura, code, prompts, at guardrails. Sa daan, gagawa tayo ng mga opinionated na pagpipilian na maaari mong palitan sa ibang pagkakataon. Sa pagtatapos, magkakaroon ka ng isang gumaganang agent na maaaring maghanap sa YouTube, mangalap ng mga transcript, mag-isip sa maraming video, at gumawa ng malinis na mga research brief.

Ano ang Ating Binubuo (at Bakit Ito Mahalaga)

Layunin: Isang YouTube research agent na maaaring:

Maghanap sa YouTube sa pamamagitan ng query

I-rank ang mga resulta ayon sa relevance/engagement

Kumuha ng mga transcript (auto‑captions o third‑party)

I-chunk at i-embed ang content para sa pagkuha

Gumamit ng Claude Code upang i-synthesize ang mga pananaw mula sa maraming video

Maglabas ng mga structured na tala: buod, mga claim, mga timestamp, mga sipi, at mga citation

Pangunahing keyword: "Pagbuo ng YouTube research agent gamit ang Claude Code"

Format: Step‑by‑step na tutorial na may tumatakbong code at mga prompt

Mga Output: Markdown research brief + JSON para sa programmatic na paggamit

Bakit ito mahalaga: Ang YouTube ay ang pinakamalaking pampublikong knowledge base ng mga talks, lessons, demos, at debates. Ngunit ito ay maingay. Ang pagbuo ng isang YouTube research agent gamit ang Claude Code ay nagbibigay sa iyo ng kalamangan: maaari mong pagsamahin ang mga pananaw sa dose-dosenang mga video sa ilang minuto, hindi oras.

Arkitektura sa Isang Sulyap

Pananatilihin nating simple at matatag ang unang bersyon.

Mga Input: isang research query (hal., "LLM agent architectures 2025"), mga opsyonal na paghihigpit (saklaw ng petsa, channel, tagal)

YouTube Search: YouTube Data API v3 (o SerpAPI fallback)

Mga Transcript: YouTube Transcript API; fallback sa ASR (hal., Whisper) kapag hindi available

Chunking: Sentence‑aware segmentation (tinatayang 800–1,200 tokens)

Mga Embedding: Gumamit ng isang lokal o hosted na embedding model (hal., text-embedding-3-large, nomic-embed-text, o bge-large)

Vector Store: Lokal na FAISS para sa bilis; maaaring palitan sa Pinecone, Weaviate, o Qdrant

Pangangatwiran: Claude Code para sa orchestration, tool use, synthesis, at pagpapatupad ng code sa loob ng isang kontroladong loop

Mga Output: Markdown report + JSON index na may mga citation, timestamp, at mga score

Data flow: Query → Search → Kumuha ng metadata → Transcript → Chunk → Embed → Kunin ang top‑K → Claude Code synthesis → Report.

Mga Kinakailangan at Setup

Python 3.10+

Mga API key: YOUTUBE_API_KEY, ANTHROPIC_API_KEY (para sa Claude Code)

Opsyonal: OPENAI_API_KEY o mga lokal na embedding

Mga Library:

google-api-python-client, youtube-transcript-api

faiss-cpu, numpy, pandas, tiktoken (o sentencepiece)

requests, pydantic, tenacity

anthropic (Claude API)

pip install google-api-python-client youtube-transcript-api faiss-cpu numpy pandas requests pydantic tenacity anthropic tiktoken

Mga variable ng environment:

export YOUTUBE_API_KEY=YOUR_YT_KEY
export ANTHROPIC_API_KEY=YOUR_ANTHROPIC_KEY

Hakbang 1: YouTube Search na may mga Filter

Maghahanap tayo sa YouTube at magbabalik ng structured metadata: pamagat, channel, petsa ng pag-publish, tagal, mga view (kung available), at videoId.

# file: yt_search.py
from googleapiclient.discovery import build
import os
YOUTUBE_API_KEY = os.environ — channel, date\n\n"
"---\n"
"JSON schema: {\"claims\":[{\"claim\":str,\"support\":[{\"video_id\":str,\"start\":float,\"end\":float}]}]}\n"
)
def call_claude(goal: str, passages: list[dict]):
passages_str = "\n\n".join(
f"[rank {p['rank']} | score {p['score']:.3f}] (vID={p.get('video_id','?')}, {p.get('start',0):.1f}-{p.get('end',0):.1f})\n{p['text']}"
for p in passages
)
msg = client.messages.create(
model="claude-3-5-sonnet-20240620",
max_tokens=1800,
temperature=0.2,
system=SYSTEM_PROMPT,
messages=[
{"role": "user", "content": USER_TEMPLATE.format(goal=goal, passages=passages_str)}
])
return msg.content[0].text

Mga tip sa prompt kapag bumubuo ng isang YouTube research agent gamit ang Claude Code:

Humingi ng mga structured na output sa parehong format na nababasa ng tao at nababasa ng machine

Ipatupad ang mga timestamped na citation

Hikayatin ang mga pagbubunyag ng kawalan ng katiyakan at mga kontradiksyon

Hakbang 6: Pinagsasama-sama ang Lahat

Ikonekta natin ang query → search → transcripts → chunks → embeddings → retrieve → synthesize.

# file: run_agent.py
from yt_search import search_youtube
from transcripts import fetch_transcript
from chunking import transcript_to_docs
from embeddings import VectorStore
from orchestrator import call_claude
from datetime import datetime
def build_corpus(query: str, max_videos=8):
results = search_youtube(query, max_results=max_videos)
corpus_docs = []
for r in results:
tx = fetch_transcript(r["video_id"]) or []
if not tx:
continue
docs = transcript_to_docs(tx)
for d in docs:
d.update({
"video_id": r["video_id"]
"title": r["title"]
"channel": r["channel"]
"url": r["url"]
})
corpus_docs.extend(docs)
return corpus_docs
def research(query: str, k=12):
corpus = build_corpus(query)
if not corpus:
return "No transcripts available."
vs = VectorStore
vs.add(corpus)
passages = vs.search(query, k=k)
md = call_claude(query, passages)
timestamp = datetime.utcnow.isoformat
return f"<!-- generated {timestamp} UTC -->\n\n" + md
if __name__ == "__main__":
print(research("LLM agents for YouTube research"))

Ang baseline na bersyon na ito ng isang YouTube research agent gamit ang Claude Code ay maghahanap, kukuha, at mag-synthesize ng mga pananaw mula sa maraming video na may mga citation. I-upgrade ang mga embedding at magdagdag ng caching upang gawin itong handa na para sa produksyon.

Pitong Pag-upgrade Para Gawin Itong Mahusay

Mas mahusay na mga embedding at hybrid na paghahanap

Magpalit ng mga de-kalidad na embedding at magdagdag ng BM25 keyword search. Ang hybrid ay nagbibigay ng mas maraming recall sa mga niche na termino at mas mahusay na precision sa mga abstract na paksa.

Palawakin ang mga tool para sa mas mayaman na metadata

Kumuha ng mga komento, ratio ng likes/dislikes, at channel authority. Magdagdag ng isang re‑ranker (cross‑encoder) para sa nangungunang 100 kandidato.

Multi‑turn na pagpaplano ng pananaliksik

Gumamit ng Claude Code upang magmungkahi ng isang plano ng pananaliksik: mga sub‑question, mga hypothesis, at mga coverage check. Ipatupad nang paulit-ulit hanggang sa maabot ang mga threshold ng coverage.

Pagsubaybay sa ebidensya at counter‑evidence

Para sa bawat claim, i-log ang sumusuporta at sumasalungat na mga snippet. Ipakita ang pareho sa mga report; magdagdag ng mga confidence score.

Mga estratehiya para sa mahabang video

Gumamit ng scene detection sa pamamagitan ng mga subtitle o mga timing ng salita ng Whisper. Ibuod bawat seksyon bago ang global synthesis upang maiwasan ang context dilution.

Caching at persistence

Mag-imbak ng mga transcript, embedding, at mga report bawat query. Muling gamitin kapag binago ng mga user ang mga filter. Magdagdag ng deduplication sa pamamagitan ng video ID.

Mga format ng pag-export at paghahatid

Mag-export ng Markdown, PDF, at JSON. Paghahatid sa pamamagitan ng email o Slack. I-render ang mga timestamp bilang mga clickable na ?t=mmss na mga link.

Mga Prompt na Maaari Mong Muling Gamitin

Gamitin ang mga template na ito habang bumubuo ng isang YouTube research agent gamit ang Claude Code.

System: Ikaw ay isang metikuloso na research agent. I-synthesize ang mga transcript mula sa maraming YouTube. Mag-cite inline gamit ang [vID @ mm:ss], at isama ang isang seksyon ng Mga Pinagmulan na may mga URL. Ibalik ang parehong Markdown brief at isang JSON payload ng mga claim na may timestamped na suporta.

User: Layunin ng pananaliksik: {topic}
Mga paghihigpit: tumuon sa {audience or scope}; mas gusto ang mga pinagmulan sa loob ng {date range}; isama ang mga hindi pagkakasundo.
Mga kandidatong passage (na-rank):
{retrieved_passages}
Output: Buod → Mga Pangunahing Pananaw (mga bullet) → Mga Kapansin-pansing Sipi (na may mga timestamp) → Mga Kontradiksyon at mga Puwang → Mga Pinagmulan. Pagkatapos JSON {\"claims\": ...}

Mga Guardrail at Etika

Igalang ang mga karapatan ng creator: Mag-link sa mga orihinal na video at iwasang mag-publish ng malalaking verbatim na mga transcript.

Maging transparent: Ipakita kung saan nagmula ang mga claim gamit ang mga timestamp at mga video ID.

Iwasan ang labis na pagsasa-buod: Panatilihin ang nuance; i-flag kapag ang mga caption ay auto‑generated at malamang na maingay.

Pangasiwaan nang maingat ang mga sensitibong paksa: I-highlight ang kawalan ng katiyakan at humanap ng iba't ibang mga pinagmulan.

Pag-troubleshoot: Mga Karaniwang Isyu at Mga Pag-aayos

"Walang transcript na natagpuan"

Fallback sa Whisper; subukan ang iba't ibang mga wika; suriin kung ang video ay naka‑block sa rehiyon.

Hindi magandang kalidad ng pagkuha

I-upgrade ang mga embedding; magdagdag ng BM25; dagdagan ang chunk overlap; parameter‑tune top‑K.

Mga hallucinated citation

Pilitin ang mahigpit na citation schema; parusahan ang mga hindi suportadong claim; kailanganin ang eksaktong mga timestamp na naroroon sa mga nakuha na chunk.

Mga limitasyon ng API quota

Mag-cache nang agresibo; bawasan ang max_results; batch requests; magdagdag ng back‑off gamit ang tenacity.

Long‑form drift

Ibuod bawat seksyon; paghigpitan ang max tokens; gumamit ng mga planning prompt na may malinaw na outline.

Pagsukat ng Kalidad

Precision@K ng mga nakuha na chunk kumpara sa isang labeled na set

Faithfulness rate: proporsyon ng mga claim na may nabe-verify na timestamped na suporta

Coverage: bilang ng mga natatanging nauugnay na video na binanggit

Latency: oras mula sa query hanggang sa report

Halimbawa: Pagsasaliksik ng "Vector Databases Explained"

Query: "vector databases explained for developers 2025"

Mga Filter: mga video pagkatapos ng 2023, tagal 6–30 minuto

Kinalabasan: Ang Agent ay nagbanggit ng 6 na video, nagha-highlight ng mga trade‑off ng HNSW kumpara sa IVF‑PQ, tinatalakay ang cost/recall, at nagli-link sa mga benchmark. Inihahambing ng seksyon ng Mga Kontradiksyon ang mga claim ng vendor kumpara sa mga open‑source na resulta.

Sa Daan: Pag-automate Nito sa Loob ng Iyong Workflow

Kung nagtatrabaho ka sa mga doc at code, sulit na i-automate ang huling milya. Ang isang maliit na CLI ay maaaring magpatakbo ng mga nightly query at mag-drop ng mga Markdown brief sa iyong knowledge base. Maaari mo rin itong ikonekta sa mga issue template para sa sprint research.

Sulit na banggitin: kung ang iyong workflow ay nakatira na sa isang browser sidebar o AI assistant, ang mga tool tulad ng Sider.AI ay maaaring i-streamline ang research loop—pumili ng isang paksa, magpatakbo ng isang paghahanap, kumuha ng mga transcript, at mag-draft ng isang Claude‑powered na buod mismo kung saan ka nagtatrabaho. Ito ay maaaring makatipid ng context switching at gawing mas praktikal para sa mga team ang pagbuo ng isang YouTube research agent gamit ang Claude Code.

Mga Pangunahing Takeaway

Ang pagbuo ng isang YouTube research agent gamit ang Claude Code ay isang high‑leverage na paraan upang gawing actionable brief ang mga video.

Ang minimal na stack: YouTube API + mga transcript + chunking + mga embedding + FAISS + Claude synthesis.

Mga upgrade path: hybrid na paghahanap, re‑ranking, mga planning loop, at mahigpit na pagsubaybay sa citation.

Magsimula nang simple, sukatin ang faithfulness, at umulit patungo sa pagiging maaasahan.

Mga Susunod na Hakbang

Ipatupad ang isang tunay na embedding model at hybrid na pagkuha

Magdagdag ng isang re‑ranking na hakbang at mga sukatan ng kalidad

Lumikha ng isang naka-iskedyul na trabaho upang i-refresh ang mga paksa linggu-linggo

I-package bilang isang CLI at isang lightweight na web UI

FAQ

Q1:Paano ako magsisimulang bumuo ng isang YouTube research agent gamit ang Claude Code? Magsimula sa paghahanap sa YouTube, kumuha ng mga transcript, i-chunk ang content, i-embed sa isang vector store, at gumamit ng Claude Code upang i-synthesize ang mga resulta. Ang gabay sa itaas ay nagbibigay ng step-by-step na code upang tipunin ang isang gumaganang pipeline.

Q2:Anong mga library ang pinakamahusay para sa isang YouTube research agent? Gamitin ang YouTube Data API para sa paghahanap, youtube-transcript-api para sa mga caption, FAISS para sa vector search, at ang Anthropic SDK upang tawagan ang Claude Code. Maaari mong palitan ang mga embedding sa OpenAI, Nomic, o BGE.

Q3:Paano ko masisiguro ang mga tumpak na citation at mga timestamp? Panatilihin ang start/end na mga timestamp sa panahon ng chunking at kailanganin ang Claude Code na mag-cite ng [video_id @ mm:ss]. Patunayan na ang mga binanggit na timestamp ay umiiral sa mga nakuha na chunk bago i-publish.

Q4:Maaari ko bang gamitin ang agent na ito para sa mga pribado o hindi nakalistang video? Oo, kung mayroon kang access at maaaring kumuha ng mga transcript o magpatakbo ng lokal na ASR (hal., Whisper). Palaging igalang ang mga pahintulot at iwasan ang pamamahagi ng naka-copyright na content.

Q5:Paano ko ma-scale ang YouTube research agent na ito para sa mga team? Magdagdag ng caching, isang shared na vector store, mga job queue, at mga naka-iskedyul na pagpapatakbo. Isama sa Slack o isang wiki, at isaalang-alang ang isang browser-based na assistant tulad ng Sider.AI upang i-streamline ang mga workflow ng researcher.