How do I start building a YouTube research agent with Claude Code?

Begin with YouTube search, fetch transcripts, chunk content, embed into a vector store, and use Claude Code to synthesize results. The guide above provides step-by-step code to assemble a working pipeline.

What libraries are best for a YouTube research agent?

Use the YouTube Data API for search, youtube-transcript-api for captions, FAISS for vector search, and the Anthropic SDK to call Claude Code. You can swap embeddings with OpenAI, Nomic, or BGE.

How do I ensure accurate citations and timestamps?

Keep start/end timestamps during chunking and require Claude Code to cite [video_id @ mm:ss]. Validate that cited timestamps exist in retrieved chunks before publishing.

Can I use this agent for private or unlisted videos?

Yes, if you have access and can fetch transcripts or run local ASR (e.g., Whisper). Always respect permissions and avoid distributing copyrighted content.

How can I scale this YouTube research agent for teams?

Add caching, a shared vector store, job queues, and scheduled runs. Integrate with Slack or a wiki, and consider a browser-based assistant like Sider.AI to streamline researcher workflows.

ಹಂತ-ಹಂತವಾಗಿ: Claude Code ಬಳಸಿ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದು

ನೀವು ಎಂದಾದರೂ YouTubeನಲ್ಲಿ ಮಧ್ಯಾಹ್ನವನ್ನು ಕಳೆದು, ಯಾವ ವೀಡಿಯೊಗಳನ್ನು ಉಳಿಸಬೇಕೆಂದು ಮರೆತಿದ್ದರೆ, ನೀವು ಒಬ್ಬಂಟಿಯಲ್ಲ. ಈಗ ಅತ್ಯುತ್ತಮ ವೀಡಿಯೊಗಳನ್ನು ಹುಡುಕುವ, ಸಾರಾಂಶಗಳನ್ನು ಹೊರತೆಗೆಯುವ, ಪ್ರಮುಖ ಉಲ್ಲೇಖಗಳನ್ನು ಪಡೆಯುವ, ಸಮಯದ ಗುರುತುಗಳನ್ನು (timestamp) ಒಳನೋಟಗಳನ್ನು ನೀಡುವ ಮತ್ತು ಬೇಡಿಕೆಯ ಮೇರೆಗೆ ಮೂಲಗಳನ್ನು ಹಿಂತಿರುಗಿಸುವ ದಣಿವಿಲ್ಲದ ಸಹಾಯಕರನ್ನು ಕಲ್ಪಿಸಿಕೊಳ್ಳಿ - ಬೇಗನೆ. YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ನಿಖರವಾಗಿ ಏನು ಮಾಡಬಹುದು. ಈ ಹಂತ-ಹಂತದ ಮಾರ್ಗದರ್ಶಿಯಲ್ಲಿ, ಸೃಷ್ಟಿಕರ್ತರು, ವಿಶ್ಲೇಷಕರು, ವಿದ್ಯಾರ್ಥಿಗಳು ಮತ್ತು ಶಬ್ದಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ ಸಂಕೇತವನ್ನು (signal) ಬಯಸುವ ಗೀಳು ಕಲಿಕೆಗೆ ಒಳಗಾದವರಿಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ Claude Codeನೊಂದಿಗೆ ಪ್ರಾಯೋಗಿಕ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಾವು ನಿರ್ಮಿಸುತ್ತೇವೆ.

ನಾವು ಪ್ರಾಯೋಗಿಕ ಮತ್ತು ನೇರ ಮಾರ್ಗವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತೇವೆ: ವಾಸ್ತುಶಿಲ್ಪ, ಕೋಡ್, ಪ್ರಾಂಪ್ಟ್‌ಗಳು (prompts) ಮತ್ತು ಗಾರ್ಡ್‌ರೈಲ್‌ಗಳು (guardrails). ದಾರಿಯುದ್ದಕ್ಕೂ, ನೀವು ನಂತರ ಬದಲಾಯಿಸಬಹುದಾದ ಅಭಿಪ್ರಾಯದ ಆಯ್ಕೆಗಳನ್ನು ಮಾಡುತ್ತೇವೆ. ಕೊನೆಯಲ್ಲಿ, ನೀವು YouTube ಅನ್ನು ಹುಡುಕುವ, ಪ್ರತಿಲೇಖನಗಳನ್ನು (transcripts) ಸಂಗ್ರಹಿಸುವ, ಅನೇಕ ವೀಡಿಯೊಗಳಲ್ಲಿ ತರ್ಕಿಸುವ ಮತ್ತು ಸ್ಪಷ್ಟ ಸಂಶೋಧನಾ ಸಾರಾಂಶಗಳನ್ನು ಉತ್ಪಾದಿಸುವ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಏಜೆಂಟ್ ಅನ್ನು ಹೊಂದಿರುತ್ತೀರಿ.

ನಾವು ಏನು ನಿರ್ಮಿಸುತ್ತಿದ್ದೇವೆ (ಮತ್ತು ಅದು ಏಕೆ ಮುಖ್ಯ)

ಗುರಿ: YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್, ಅದು:

ಪ್ರಶ್ನೆಯ ಮೂಲಕ YouTube ಅನ್ನು ಹುಡುಕುವುದು

ಪ್ರಸ್ತುತತೆ/ಕಾರ್ಯನಿರತತೆಯಿಂದ (relevance/engagement) ಫಲಿತಾಂಶಗಳನ್ನು ಶ್ರೇಣೀಕರಿಸುವುದು

ಪ್ರತಿಲೇಖನಗಳನ್ನು (ಸ್ವಯಂ-ಶೀರ್ಷಿಕೆಗಳು ಅಥವಾ ಮೂರನೇ ವ್ಯಕ್ತಿ) ಪಡೆದುಕೊಳ್ಳುವುದು

ಹಿಂಪಡೆಯುವಿಕೆಗಾಗಿ (retrieval) ವಿಷಯವನ್ನು ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸಿ ಹುದುಗಿಸುವುದು

ಬಹು-ವೀಡಿಯೊ ಒಳನೋಟಗಳನ್ನು ಸಂಶ್ಲೇಷಿಸಲು Claude Code ಅನ್ನು ಬಳಸುವುದು

ರಚಿತವಾದ ಟಿಪ್ಪಣಿಗಳನ್ನು ಔಟ್‌ಪುಟ್ ಮಾಡಿ: ಸಾರಾಂಶ, ಪ್ರತಿಪಾದನೆಗಳು, ಸಮಯದ ಗುರುತುಗಳು, ಉಲ್ಲೇಖಗಳು ಮತ್ತು ಉಲ್ಲೇಖಗಳು

ಪ್ರಾಥಮಿಕ ಕೀವರ್ಡ್: "Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದು"

ಫಾರ್ಮ್ಯಾಟ್: ಕಾರ್ಯಗತಗೊಳಿಸಬಹುದಾದ ಕೋಡ್ ಮತ್ತು ಪ್ರಾಂಪ್ಟ್‌ಗಳೊಂದಿಗೆ ಹಂತ-ಹಂತದ ಟ್ಯುಟೋರಿಯಲ್

ಔಟ್‌ಪುಟ್‌ಗಳು: ಪ್ರೋಗ್ರಾಮಿಕ್ ಬಳಕೆಗಾಗಿ ಮಾರ್ಕ್‌ಡೌನ್ ಸಂಶೋಧನಾ ಸಾರಾಂಶ + JSON

ಇದು ಏಕೆ ಮುಖ್ಯ: YouTube ಮಾತುಕತೆಗಳು, ಪಾಠಗಳು, ಡೆಮೊಗಳು ಮತ್ತು ಚರ್ಚೆಗಳ ಅತಿದೊಡ್ಡ ಸಾರ್ವಜನಿಕ ಜ್ಞಾನದ ನೆಲೆಯಾಗಿದೆ. ಆದರೆ ಇದು ಗದ್ದಲದಂತಿದೆ. Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದು ನಿಮಗೆ ಒಂದು ಅಂಚನ್ನು ನೀಡುತ್ತದೆ: ನೀವು ಗಂಟೆಗಳಲ್ಲಿ ಅಲ್ಲ, ನಿಮಿಷಗಳಲ್ಲಿ ಡಜನ್ಗಟ್ಟಲೆ ವೀಡಿಯೊಗಳಲ್ಲಿ ಒಳನೋಟಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಬಹುದು.

ಒಂದು ನೋಟದಲ್ಲಿ ವಾಸ್ತುಶಿಲ್ಪ

ನಾವು ಮೊದಲ ಆವೃತ್ತಿಯನ್ನು ಸರಳ ಮತ್ತು ದೃಢವಾಗಿ ಇರಿಸುತ್ತೇವೆ.

ಇನ್‌ಪುಟ್‌ಗಳು: ಸಂಶೋಧನಾ ಪ್ರಶ್ನೆ (ಉದಾ., "LLM ಏಜೆಂಟ್ ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳು 2025"), ಐಚ್ಛಿಕ ನಿರ್ಬಂಧಗಳು (ದಿನಾಂಕ ಶ್ರೇಣಿ, ಚಾನಲ್, ಅವಧಿ)

YouTube ಹುಡುಕಾಟ: YouTube Data API v3 (ಅಥವಾ SerpAPI ಫಾಲ್‌ಬ್ಯಾಕ್)

ಪ್ರತಿಲೇಖನಗಳು: YouTube Transcript API; ಲಭ್ಯವಿಲ್ಲದಿದ್ದಾಗ ASR ಗೆ ಫಾಲ್‌ಬ್ಯಾಕ್ (ಉದಾ., Whisper)

ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸುವುದು: ವಾಕ್ಯ-ಅರಿವಿನ ವಿಭಾಗೀಕರಣ (ಸುಮಾರು 800-1,200 ಟೋಕನ್‌ಗಳು)

ಎಂಬೆಡಿಂಗ್‌ಗಳು: ಸ್ಥಳೀಯ ಅಥವಾ ಹೋಸ್ಟ್ ಮಾಡಿದ ಎಂಬೆಡಿಂಗ್ ಮಾದರಿಯನ್ನು ಬಳಸಿ (ಉದಾ., text-embedding-3-large, nomic-embed-text, ಅಥವಾ bge-large)

ವೆಕ್ಟರ್ ಸ್ಟೋರ್: ವೇಗಕ್ಕಾಗಿ ಸ್ಥಳೀಯ FAISS; Pinecone, Weaviate, ಅಥವಾ Qdrant ಗೆ ಬದಲಾಯಿಸಬಹುದು

ತಾರ್ಕಿಕ ಕ್ರಿಯೆ: ನಿಯಂತ್ರಿತ ಲೂಪ್‌ನಲ್ಲಿ ಆರ್ಕೆಸ್ಟ್ರೇಶನ್, ಟೂಲ್ ಬಳಕೆ, ಸಂಶ್ಲೇಷಣೆ ಮತ್ತು ಕೋಡ್ ಕಾರ್ಯಗತಗೊಳಿಸಲು Claude Code

ಔಟ್‌ಪುಟ್‌ಗಳು: ಉಲ್ಲೇಖಗಳು, ಸಮಯದ ಗುರುತುಗಳು ಮತ್ತು ಸ್ಕೋರ್‌ಗಳೊಂದಿಗೆ ಮಾರ್ಕ್‌ಡೌನ್ ವರದಿ + JSON ಸೂಚ್ಯಂಕ

ಡೇಟಾ ಹರಿವು: ಪ್ರಶ್ನೆ → ಹುಡುಕಾಟ → ಮೆಟಾಡೇಟಾವನ್ನು (metadata) ಪಡೆದುಕೊಳ್ಳಿ → ಪ್ರತಿಲೇಖನ → ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸಿ → ಹುದುಗಿಸು → ಟಾಪ್-K ಅನ್ನು ಹಿಂಪಡೆಯಿರಿ → Claude Code ಸಂಶ್ಲೇಷಣೆ → ವರದಿ.

ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳು ಮತ್ತು ಸೆಟಪ್

Python 3.10+

API ಕೀಗಳು: YOUTUBE_API_KEY, ANTHROPIC_API_KEY (Claude Code ಗಾಗಿ)

ಐಚ್ಛಿಕ: OPENAI_API_KEY ಅಥವಾ ಸ್ಥಳೀಯ ಎಂಬೆಡಿಂಗ್‌ಗಳು

ಲೈಬ್ರರಿಗಳು:

google-api-python-client, youtube-transcript-api

faiss-cpu, numpy, pandas, tiktoken (ಅಥವಾ sentencepiece)

requests, pydantic, tenacity

anthropic (Claude API)

pip install google-api-python-client youtube-transcript-api faiss-cpu numpy pandas requests pydantic tenacity anthropic tiktoken

ಪರಿಸರ ವೇರಿಯೇಬಲ್‌ಗಳು:

export YOUTUBE_API_KEY=YOUR_YT_KEY
export ANTHROPIC_API_KEY=YOUR_ANTHROPIC_KEY

ಹಂತ 1: ಫಿಲ್ಟರ್‌ಗಳೊಂದಿಗೆ YouTube ಹುಡುಕಾಟ

ನಾವು YouTube ಅನ್ನು ಹುಡುಕುತ್ತೇವೆ ಮತ್ತು ರಚಿತವಾದ ಮೆಟಾಡೇಟಾವನ್ನು (metadata) ಹಿಂತಿರುಗಿಸುತ್ತೇವೆ: ಶೀರ್ಷಿಕೆ, ಚಾನಲ್, ಪ್ರಕಟಣೆ ದಿನಾಂಕ, ಅವಧಿ, ವೀಕ್ಷಣೆಗಳು (ಲಭ್ಯವಿದ್ದರೆ) ಮತ್ತು ವೀಡಿಯೊ ಐಡಿ.

# file: yt_search.py
from googleapiclient.discovery import build
import os
YOUTUBE_API_KEY = os.environ — channel, date\n\n"
"---\n"
"JSON schema: {\"claims\":[{\"claim\":str,\"support\":[{\"video_id\":str,\"start\":float,\"end\":float}]}]}\n"
)
def call_claude(goal: str, passages: list[dict]):
passages_str = "\n\n".join(
f"[rank {p['rank']} | score {p['score']:.3f}] (vID={p.get('video_id','?')}, {p.get('start',0):.1f}-{p.get('end',0):.1f})\n{p['text']}"
for p in passages
)
msg = client.messages.create(
model="claude-3-5-sonnet-20240620",
max_tokens=1800,
temperature=0.2,
system=SYSTEM_PROMPT,
messages=[
{"role": "user", "content": USER_TEMPLATE.format(goal=goal, passages=passages_str)}
])
return msg.content[0].text

Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವಾಗ ಪ್ರಾಂಪ್ಟ್ ಸಲಹೆಗಳು:

ಮಾನವ-ಓದಬಲ್ಲ ಮತ್ತು ಯಂತ್ರ-ಓದಬಲ್ಲ ಸ್ವರೂಪಗಳಲ್ಲಿ ರಚಿತವಾದ ಔಟ್‌ಪುಟ್‌ಗಳನ್ನು ಕೇಳಿ

ಸಮಯದ ಗುರುತಿಸಲಾದ ಉಲ್ಲೇಖಗಳನ್ನು ಜಾರಿಗೊಳಿಸಿ

ಅನಿಶ್ಚಿತತೆ ಬಹಿರಂಗಪಡಿಸುವಿಕೆ ಮತ್ತು ವಿರೋಧಾಭಾಸಗಳನ್ನು ಪ್ರೋತ್ಸಾಹಿಸಿ

ಹಂತ 6: ಎಲ್ಲವನ್ನೂ ಒಟ್ಟಿಗೆ ಸೇರಿಸುವುದು

ಪ್ರಶ್ನೆ → ಹುಡುಕಾಟ → ಪ್ರತಿಲೇಖನಗಳು → ಭಾಗಗಳು → ಎಂಬೆಡಿಂಗ್‌ಗಳು → ಹಿಂಪಡೆಯಿರಿ → ಸಂಶ್ಲೇಷಣೆ ಮಾಡುವಂತೆ ಮಾಡೋಣ.

# file: run_agent.py
from yt_search import search_youtube
from transcripts import fetch_transcript
from chunking import transcript_to_docs
from embeddings import VectorStore
from orchestrator import call_claude
from datetime import datetime
def build_corpus(query: str, max_videos=8):
results = search_youtube(query, max_results=max_videos)
corpus_docs = []
for r in results:
tx = fetch_transcript(r["video_id"]) or []
if not tx:
continue
docs = transcript_to_docs(tx)
for d in docs:
d.update({
"video_id": r["video_id"],
"title": r["title"],
"channel": r["channel"],
"url": r["url"],
})
corpus_docs.extend(docs)
return corpus_docs
def research(query: str, k=12):
corpus = build_corpus(query)
if not corpus:
return "No transcripts available."
vs = VectorStore
vs.add(corpus)
passages = vs.search(query, k=k)
md = call_claude(query, passages)
timestamp = datetime.utcnow.isoformat
return f"<!-- generated {timestamp} UTC -->\n\n" + md
if __name__ == "__main__":
print(research("LLM agents for YouTube research"))

Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್‌ನ ಈ ಮೂಲ ಆವೃತ್ತಿಯು ಉಲ್ಲೇಖಗಳೊಂದಿಗೆ ಬಹು-ವೀಡಿಯೊ ಒಳನೋಟಗಳನ್ನು ಹುಡುಕುತ್ತದೆ, ಹಿಂಪಡೆಯುತ್ತದೆ ಮತ್ತು ಸಂಶ್ಲೇಷಿಸುತ್ತದೆ. ಎಂಬೆಡಿಂಗ್‌ಗಳನ್ನು ಅಪ್‌ಗ್ರೇಡ್ ಮಾಡಿ ಮತ್ತು ಅದನ್ನು ಉತ್ಪಾದನೆಗೆ ಸಿದ್ಧಗೊಳಿಸಲು ಕ್ಯಾಶಿಂಗ್ (caching) ಅನ್ನು ಸೇರಿಸಿ.

ಅದನ್ನು ಉತ್ತಮಗೊಳಿಸಲು ಏಳು ನವೀಕರಣಗಳು

ಉತ್ತಮ ಎಂಬೆಡಿಂಗ್‌ಗಳು ಮತ್ತು ಹೈಬ್ರಿಡ್ ಹುಡುಕಾಟ

ಉತ್ತಮ-ಗುಣಮಟ್ಟದ ಎಂಬೆಡಿಂಗ್‌ಗಳನ್ನು ಬದಲಾಯಿಸಿ ಮತ್ತು BM25 ಕೀವರ್ಡ್ ಹುಡುಕಾಟವನ್ನು ಸೇರಿಸಿ. ಹೈಬ್ರಿಡ್ ನಿರ್ದಿಷ್ಟ ಪದಗಳ ಮೇಲೆ ಹೆಚ್ಚಿನ ಮರುಸ್ಥಾಪನೆ ಮತ್ತು ಅಮೂರ್ತ ವಿಷಯಗಳ ಮೇಲೆ ಉತ್ತಮ ನಿಖರತೆಯನ್ನು ನೀಡುತ್ತದೆ.

ಸಮೃದ್ಧ ಮೆಟಾಡೇಟಾಕ್ಕಾಗಿ (metadata) ಪರಿಕರಗಳನ್ನು ವಿಸ್ತರಿಸಿ

ಕಾಮೆಂಟ್‌ಗಳು, ಇಷ್ಟ/ಇಷ್ಟವಿಲ್ಲ ಅನುಪಾತ ಮತ್ತು ಚಾನಲ್ ಪ್ರಾಧಿಕಾರವನ್ನು ಎಳೆಯಿರಿ. ಟಾಪ್ 100 ಅಭ್ಯರ್ಥಿಗಳಿಗೆ ಮರು-ಶ್ರೇಣಿಕರ್ತನನ್ನು (cross-encoder) ಸೇರಿಸಿ.

ಬಹು-ಹಂತದ ಸಂಶೋಧನಾ ಯೋಜನೆ

ಸಂಶೋಧನಾ ಯೋಜನೆಯನ್ನು ಪ್ರಸ್ತಾಪಿಸಲು Claude Code ಅನ್ನು ಬಳಸಿ: ಉಪ-ಪ್ರಶ್ನೆಗಳು, ಊಹೆಗಳು ಮತ್ತು ವ್ಯಾಪ್ತಿ ಪರಿಶೀಲನೆಗಳು. ವ್ಯಾಪ್ತಿ ಮಿತಿಗಳನ್ನು ತಲುಪುವವರೆಗೆ ಪುನರಾವರ್ತಿತವಾಗಿ ಕಾರ್ಯಗತಗೊಳಿಸಿ.

ಪುರಾವೆ ಟ್ರ್ಯಾಕಿಂಗ್ ಮತ್ತು ಪ್ರತಿ-ಪುರಾವೆ

ಪ್ರತಿ ಹಕ್ಕುಗೆ, ಬೆಂಬಲಿಸುವ ಮತ್ತು ವಿರೋಧಿಸುವ ತುಣುಕುಗಳನ್ನು ಲಾಗ್ ಮಾಡಿ. ವರದಿಗಳಲ್ಲಿ ಎರಡನ್ನೂ ಪ್ರಸ್ತುತಪಡಿಸಿ; ವಿಶ್ವಾಸದ ಸ್ಕೋರ್‌ಗಳನ್ನು ಸೇರಿಸಿ.

ದೀರ್ಘ-ವೀಡಿಯೊ ತಂತ್ರಗಳು

ಉಪಶೀರ್ಷಿಕೆಗಳು ಅಥವಾ Whisper ಪದ ಸಮಯಗಳ ಮೂಲಕ ದೃಶ್ಯ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯನ್ನು ಬಳಸಿ. ಸಂದರ್ಭ ದುರ್ಬಲಗೊಳಿಸುವಿಕೆಯನ್ನು ತಪ್ಪಿಸಲು ಜಾಗತಿಕ ಸಂಶ್ಲೇಷಣೆಯ ಮೊದಲು ಪ್ರತಿ-ವಿಭಾಗಕ್ಕೆ ಸಾರಾಂಶ ನೀಡಿ.

ಕ್ಯಾಶಿಂಗ್ ಮತ್ತು ನಿರಂತರತೆ

ಪ್ರತಿ ಪ್ರಶ್ನೆಗೆ ಪ್ರತಿಲೇಖನಗಳು, ಎಂಬೆಡಿಂಗ್‌ಗಳು ಮತ್ತು ವರದಿಗಳನ್ನು ಸಂಗ್ರಹಿಸಿ. ಬಳಕೆದಾರರು ಫಿಲ್ಟರ್‌ಗಳನ್ನು ಬದಲಾಯಿಸಿದಾಗ ಮರುಬಳಕೆ ಮಾಡಿ. ವೀಡಿಯೊ ಐಡಿಯಿಂದ ಡಿಡ್ಯೂಪ್ಲಿಕೇಶನ್ (deduplication) ಅನ್ನು ಸೇರಿಸಿ.

ಫಾರ್ಮ್ಯಾಟ್‌ಗಳು ಮತ್ತು ವಿತರಣೆಯನ್ನು ರಫ್ತು ಮಾಡಿ

ಮಾರ್ಕ್‌ಡೌನ್, PDF ಮತ್ತು JSON ಅನ್ನು ರಫ್ತು ಮಾಡಿ. ಇಮೇಲ್ ಅಥವಾ ಸ್ಲಾಕ್ ವಿತರಣೆ. ಸಮಯದ ಗುರುತುಗಳನ್ನು ಕ್ಲಿಕ್ ಮಾಡಬಹುದಾದ ?t=mmss ಲಿಂಕ್‌ಗಳಾಗಿ ರೆಂಡರ್ ಮಾಡಿ.

ನೀವು ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ ಪ್ರಾಂಪ್ಟ್‌ಗಳು

Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವಾಗ ಈ ಟೆಂಪ್ಲೇಟ್‌ಗಳನ್ನು ಬಳಸಿ.

ಸಿಸ್ಟಮ್: ನೀವು ನಿಖರವಾದ ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಆಗಿದ್ದೀರಿ. ಬಹು YouTube ಪ್ರತಿಲೇಖನಗಳಾದ್ಯಂತ ಸಂಶ್ಲೇಷಿಸಿ. [vID @ mm:ss] ನೊಂದಿಗೆ ಇನ್‌ಲೈನ್ ಅನ್ನು ಉಲ್ಲೇಖಿಸಿ ಮತ್ತು URLಗಳೊಂದಿಗೆ ಮೂಲಗಳ ವಿಭಾಗವನ್ನು ಸೇರಿಸಿ. ಸಮಯದ ಗುರುತಿಸಲಾದ ಬೆಂಬಲದೊಂದಿಗೆ ಮಾರ್ಕ್‌ಡೌನ್ ಸಾರಾಂಶ ಮತ್ತು ಹಕ್ಕುಗಳ JSON ಪೇಲೋಡ್ ಎರಡನ್ನೂ ಹಿಂತಿರುಗಿಸಿ.

ಬಳಕೆದಾರ: ಸಂಶೋಧನಾ ಗುರಿ: {ವಿಷಯ}
ನಿರ್ಬಂಧಗಳು: {ಪ್ರೇಕ್ಷಕರು ಅಥವಾ ವ್ಯಾಪ್ತಿ} ಮೇಲೆ ಗಮನಹರಿಸಿ; {ದಿನಾಂಕ ಶ್ರೇಣಿಯ} ಒಳಗೆ ಮೂಲಗಳನ್ನು ಆದ್ಯತೆ ನೀಡಿ; ಭಿನ್ನಾಭಿಪ್ರಾಯಗಳನ್ನು ಸೇರಿಸಿ.
ಅಭ್ಯರ್ಥಿ ಭಾಗಗಳು (ಶ್ರೇಣೀಕರಿಸಲಾಗಿದೆ):
{ಹಿಂಪಡೆದ_ಭಾಗಗಳು}
ಔಟ್‌ಪುಟ್: ಸಾರಾಂಶ → ಪ್ರಮುಖ ಒಳನೋಟಗಳು (ಗುಂಡುಗಳು) → ಗಮನಾರ್ಹ ಉಲ್ಲೇಖಗಳು (ಸಮಯದ ಗುರುತುಗಳೊಂದಿಗೆ) → ವಿರೋಧಾಭಾಸಗಳು ಮತ್ತು ಅಂತರಗಳು → ಮೂಲಗಳು. ನಂತರ JSON {"claims": ...}

ಗಾರ್ಡ್‌ರೈಲ್‌ಗಳು ಮತ್ತು ನೀತಿಶಾಸ್ತ್ರ

ಸೃಷ್ಟಿಕರ್ತರ ಹಕ್ಕುಗಳನ್ನು ಗೌರವಿಸಿ: ಮೂಲ ವೀಡಿಯೊಗಳಿಗೆ ಲಿಂಕ್ ಮಾಡಿ ಮತ್ತು ದೊಡ್ಡ ಪದಶಃ ಪ್ರತಿಲೇಖನಗಳನ್ನು ಪ್ರಕಟಿಸುವುದನ್ನು ತಪ್ಪಿಸಿ.

ಪಾರದರ್ಶಕವಾಗಿರಿ: ಸಮಯದ ಗುರುತುಗಳು ಮತ್ತು ವೀಡಿಯೊ ಐಡಿಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಹಕ್ಕುಗಳು ಎಲ್ಲಿಂದ ಬಂದಿವೆ ಎಂಬುದನ್ನು ತೋರಿಸಿ.

ಅತಿಯಾಗಿ-ಸಾರಾಂಶ ಮಾಡುವುದನ್ನು ತಪ್ಪಿಸಿ: ಸೂಕ್ಷ್ಮ ವ್ಯತ್ಯಾಸವನ್ನು ಕಾಪಾಡಿಕೊಳ್ಳಿ; ಶೀರ್ಷಿಕೆಗಳನ್ನು ಸ್ವಯಂ-ರಚಿತವಾಗಿಸಿದಾಗ ಮತ್ತು ಗದ್ದಲದಂತಿರುವಾಗ ಫ್ಲ್ಯಾಗ್ ಮಾಡಿ.

ಸೂಕ್ಷ್ಮ ವಿಷಯಗಳನ್ನು ಎಚ್ಚರಿಕೆಯಿಂದ ನಿರ್ವಹಿಸಿ: ಅನಿಶ್ಚಿತತೆಯನ್ನು ಹೈಲೈಟ್ ಮಾಡಿ ಮತ್ತು ವೈವಿಧ್ಯಮಯ ಮೂಲಗಳನ್ನು ಹುಡುಕಿ.

ನಿವಾರಣೆ: ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳು ಮತ್ತು ಪರಿಹಾರಗಳು

"ಯಾವುದೇ ಪ್ರತಿಲೇಖನ ಕಂಡುಬಂದಿಲ್ಲ"

Whisper ಗೆ ಫಾಲ್‌ಬ್ಯಾಕ್; ವಿಭಿನ್ನ ಭಾಷೆಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ; ವೀಡಿಯೊ ಪ್ರದೇಶ-ನಿರ್ಬಂಧಿತವಾಗಿದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ.

ಕಳಪೆ ಹಿಂಪಡೆಯುವಿಕೆಯ ಗುಣಮಟ್ಟ

ಎಂಬೆಡಿಂಗ್‌ಗಳನ್ನು ಅಪ್‌ಗ್ರೇಡ್ ಮಾಡಿ; BM25 ಅನ್ನು ಸೇರಿಸಿ; ಭಾಗದ ಅತಿಕ್ರಮಣವನ್ನು ಹೆಚ್ಚಿಸಿ; ಟಾಪ್-K ಅನ್ನು ಪ್ಯಾರಾಮೀಟರ್-ಟ್ಯೂನ್ ಮಾಡಿ.

ಭ್ರಮೆಯ ಉಲ್ಲೇಖಗಳು

ಕಟ್ಟುನಿಟ್ಟಾದ ಉಲ್ಲೇಖ ಯೋಜನೆಯನ್ನು ಬಲವಂತವಾಗಿ ಜಾರಿಗೊಳಿಸಿ; ಬೆಂಬಲಿಸದ ಹಕ್ಕುಗಳನ್ನು ಶಿಕ್ಷಿಸಿ; ಹಿಂಪಡೆದ ಭಾಗಗಳಲ್ಲಿ ನಿಖರವಾದ ಸಮಯದ ಗುರುತುಗಳು ಇರಬೇಕೆಂದು ಒತ್ತಾಯಿಸಿ.

API ಕೋಟಾ ಮಿತಿಗಳು

ಆಕ್ರಮಣಕಾರಿಯಾಗಿ ಸಂಗ್ರಹಿಸಿ; max_results ಅನ್ನು ಕಡಿಮೆ ಮಾಡಿ; ಬ್ಯಾಚ್ ವಿನಂತಿಗಳು; tenacity ನೊಂದಿಗೆ ಬ್ಯಾಕ್-ಆಫ್ ಅನ್ನು ಸೇರಿಸಿ.

ದೀರ್ಘ-ರೂಪದ ಡ್ರಿಫ್ಟ್

ಪ್ರತಿ-ವಿಭಾಗಕ್ಕೆ ಸಾರಾಂಶ ನೀಡಿ; ಗರಿಷ್ಠ ಟೋಕನ್‌ಗಳನ್ನು ನಿರ್ಬಂಧಿಸಿ; ಸ್ಪಷ್ಟ ರೂಪರೇಖೆಯೊಂದಿಗೆ ಯೋಜನಾ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಬಳಸಿ.

ಗುಣಮಟ್ಟವನ್ನು ಅಳೆಯುವುದು

ಗುಣಮಟ್ಟದ ಸೆಟ್ ವಿರುದ್ಧ ಹಿಂಪಡೆದ ಭಾಗಗಳ ನಿಖರತೆ@K

ವಿಶ್ವಾಸಾರ್ಹತೆ ದರ: ಪರಿಶೀಲಿಸಬಹುದಾದ ಸಮಯದ ಗುರುತಿಸಲಾದ ಬೆಂಬಲದೊಂದಿಗೆ ಹಕ್ಕುಗಳ ಪ್ರಮಾಣ

ವ್ಯಾಪ್ತಿ: ಉಲ್ಲೇಖಿಸಲಾದ ವಿಶಿಷ್ಟ ಸಂಬಂಧಿತ ವೀಡಿಯೊಗಳ ಸಂಖ್ಯೆ

ವಿಳಂಬ: ಪ್ರಶ್ನೆಯಿಂದ ವರದಿಗೆ ಸಮಯ

ಉದಾಹರಣೆ: "ವೆಕ್ಟರ್ ಡೇಟಾಬೇಸ್‌ಗಳನ್ನು ವಿವರಿಸಲಾಗಿದೆ" ಕುರಿತು ಸಂಶೋಧನೆ

ಪ್ರಶ್ನೆ: "ಡೆವಲಪರ್‌ಗಳಿಗಾಗಿ 2025 ವೆಕ್ಟರ್ ಡೇಟಾಬೇಸ್‌ಗಳನ್ನು ವಿವರಿಸಲಾಗಿದೆ"

ಫಿಲ್ಟರ್‌ಗಳು: 2023 ರ ನಂತರದ ವೀಡಿಯೊಗಳು, ಅವಧಿ 6-30 ನಿಮಿಷಗಳು

ಫಲಿತಾಂಶ: ಏಜೆಂಟ್ 6 ವೀಡಿಯೊಗಳನ್ನು ಉಲ್ಲೇಖಿಸುತ್ತದೆ, HNSW vs IVF-PQ ಯ ವಿನಿಮಯವನ್ನು ಹೈಲೈಟ್ ಮಾಡುತ್ತದೆ, ವೆಚ್ಚ/ಮರುಸ್ಥಾಪನೆಯ ಬಗ್ಗೆ ಚರ್ಚಿಸುತ್ತದೆ ಮತ್ತು ಬೆಂಚ್‌ಮಾರ್ಕ್‌ಗಳಿಗೆ ಲಿಂಕ್ ಮಾಡುತ್ತದೆ. ವಿರೋಧಾಭಾಸಗಳ ವಿಭಾಗವು ಮಾರಾಟಗಾರರ ಹಕ್ಕುಗಳನ್ನು ಮುಕ್ತ-ಮೂಲ ಫಲಿತಾಂಶಗಳಿಗೆ ಹೋಲಿಸುತ್ತದೆ.

ಮೂಲಕ: ನಿಮ್ಮ ಕಾರ್ಯವಿಧಾನದ ಒಳಗೆ ಇದನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುವುದು

ನೀವು ಡಾಕ್ಸ್ ಮತ್ತು ಕೋಡ್‌ನಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದರೆ, ಕೊನೆಯ ಮೈಲಿಯನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುವುದು ಯೋಗ್ಯವಾಗಿದೆ. ಒಂದು ಸಣ್ಣ CLI ರಾತ್ರಿಯ ಪ್ರಶ್ನೆಗಳನ್ನು ಚಲಾಯಿಸಬಹುದು ಮತ್ತು ಮಾರ್ಕ್‌ಡೌನ್ ಸಾರಾಂಶಗಳನ್ನು ನಿಮ್ಮ ಜ್ಞಾನದ ನೆಲೆಯಲ್ಲಿ ಬಿಡಬಹುದು. ಸ್ಪ್ರಿಂಟ್ ಸಂಶೋಧನೆಗಾಗಿ ನೀವು ಅದನ್ನು ಸಮಸ್ಯೆಯ ಟೆಂಪ್ಲೇಟ್‌ಗಳಿಗೆ ವೈರ್ ಮಾಡಬಹುದು.

ಗಮನಿಸಬೇಕಾದ ಅಂಶ: ನಿಮ್ಮ ಕಾರ್ಯವಿಧಾನವು ಈಗಾಗಲೇ ಬ್ರೌಸರ್ ಸೈಡ್‌ಬಾರ್ ಅಥವಾ AI ಸಹಾಯಕರಲ್ಲಿದ್ದರೆ, Sider.AI ನಂತಹ ಪರಿಕರಗಳು ಸಂಶೋಧನಾ ಲೂಪ್ ಅನ್ನು ಸುವ್ಯವಸ್ಥಿತಗೊಳಿಸಬಹುದು - ವಿಷಯವನ್ನು ಆಯ್ಕೆಮಾಡಿ, ಹುಡುಕಾಟವನ್ನು ಚಲಾಯಿಸಿ, ಪ್ರತಿಲೇಖನಗಳನ್ನು ಸೆರೆಹಿಡಿಯಿರಿ ಮತ್ತು ನೀವು ಕೆಲಸ ಮಾಡುವ ಸ್ಥಳದಲ್ಲಿಯೇ Claude-ಚಾಲಿತ ಸಾರಾಂಶವನ್ನು ರಚಿಸಿ. ಇದು ಸಂದರ್ಭ ಬದಲಾವಣೆಯನ್ನು ಉಳಿಸಬಹುದು ಮತ್ತು Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದನ್ನು ತಂಡಗಳಿಗೆ ಇನ್ನಷ್ಟು ಪ್ರಾಯೋಗಿಕವಾಗಿಸಬಹುದು.

ಪ್ರಮುಖ ಅಂಶಗಳು

Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದು ವೀಡಿಯೊಗಳನ್ನು ಕಾರ್ಯಸಾಧ್ಯವಾದ ಸಾರಾಂಶಗಳಾಗಿ ಪರಿವರ್ತಿಸಲು ಹೆಚ್ಚಿನ ಸಾಮರ್ಥ್ಯದ ಮಾರ್ಗವಾಗಿದೆ.

ಕನಿಷ್ಠ ಸ್ಟಾಕ್: YouTube API + ಪ್ರತಿಲೇಖನಗಳು + ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸುವುದು + ಎಂಬೆಡಿಂಗ್‌ಗಳು + FAISS + Claude ಸಂಶ್ಲೇಷಣೆ.

ಅಪ್‌ಗ್ರೇಡ್ ಮಾರ್ಗಗಳು: ಹೈಬ್ರಿಡ್ ಹುಡುಕಾಟ, ಮರು-ಶ್ರೇಣೀಕರಣ, ಯೋಜನಾ ಲೂಪ್‌ಗಳು ಮತ್ತು ಕಟ್ಟುನಿಟ್ಟಾದ ಉಲ್ಲೇಖ ಟ್ರ್ಯಾಕಿಂಗ್.

ಸರಳವಾಗಿ ಪ್ರಾರಂಭಿಸಿ, ವಿಶ್ವಾಸಾರ್ಹತೆಯನ್ನು ಅಳೆಯಿರಿ ಮತ್ತು ವಿಶ್ವಾಸಾರ್ಹತೆಯ ಕಡೆಗೆ ಪುನರಾವರ್ತಿಸಿ.

ಮುಂದಿನ ಹಂತಗಳು

ನೈಜ ಎಂಬೆಡಿಂಗ್ ಮಾದರಿ ಮತ್ತು ಹೈಬ್ರಿಡ್ ಹಿಂಪಡೆಯುವಿಕೆಯನ್ನು ಅನುಷ್ಠಾನಗೊಳಿಸಿ

ಮರು-ಶ್ರೇಣೀಕರಣ ಹಂತ ಮತ್ತು ಗುಣಮಟ್ಟದ ಮೆಟ್ರಿಕ್‌ಗಳನ್ನು ಸೇರಿಸಿ

ವಾರಕ್ಕೊಮ್ಮೆ ವಿಷಯಗಳನ್ನು ರಿಫ್ರೆಶ್ ಮಾಡಲು ನಿಗದಿತ ಕೆಲಸವನ್ನು ರಚಿಸಿ

CLI ಮತ್ತು ಹಗುರವಾದ ವೆಬ್ UI ಆಗಿ ಪ್ಯಾಕೇಜ್ ಮಾಡಿ

FAQ

Q1: Claude Code ನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸಲು ನಾನು ಹೇಗೆ ಪ್ರಾರಂಭಿಸುವುದು? YouTube ಹುಡುಕಾಟದೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ, ಪ್ರತಿಲೇಖನಗಳನ್ನು ಪಡೆದುಕೊಳ್ಳಿ, ವಿಷಯವನ್ನು ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸಿ, ವೆಕ್ಟರ್ ಸ್ಟೋರ್‌ಗೆ ಎಂಬೆಡ್ ಮಾಡಿ ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ಸಂಶ್ಲೇಷಿಸಲು Claude Code ಅನ್ನು ಬಳಸಿ. ಕೆಲಸ ಮಾಡುವ ಪೈಪ್‌ಲೈನ್ ಅನ್ನು ಜೋಡಿಸಲು ಮೇಲಿನ ಮಾರ್ಗದರ್ಶಿ ಹಂತ-ಹಂತದ ಕೋಡ್ ಅನ್ನು ಒದಗಿಸುತ್ತದೆ.

Q2: YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್‌ಗೆ ಯಾವ ಲೈಬ್ರರಿಗಳು ಉತ್ತಮವಾಗಿವೆ? ಹುಡುಕಾಟಕ್ಕಾಗಿ YouTube Data API, ಶೀರ್ಷಿಕೆಗಳಿಗಾಗಿ youtube-transcript-api, ವೆಕ್ಟರ್ ಹುಡುಕಾಟಕ್ಕಾಗಿ FAISS ಮತ್ತು Claude Code ಅನ್ನು ಕರೆಯಲು Anthropic SDK ಅನ್ನು ಬಳಸಿ. ನೀವು OpenAI, Nomic ಅಥವಾ BGE ನೊಂದಿಗೆ ಎಂಬೆಡಿಂಗ್‌ಗಳನ್ನು ಬದಲಾಯಿಸಬಹುದು.

Q3: ನಿಖರವಾದ ಉಲ್ಲೇಖಗಳು ಮತ್ತು ಸಮಯದ ಗುರುತುಗಳನ್ನು ನಾನು ಹೇಗೆ ಖಚಿತಪಡಿಸಿಕೊಳ್ಳುವುದು? ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸುವ ಸಮಯದಲ್ಲಿ ಪ್ರಾರಂಭ/ಅಂತ್ಯ ಸಮಯದ ಗುರುತುಗಳನ್ನು ಇರಿಸಿ ಮತ್ತು Claude Code [video_id @ mm:ss] ಅನ್ನು ಉಲ್ಲೇಖಿಸಲು ಅಗತ್ಯವಿರುತ್ತದೆ. ಪ್ರಕಟಿಸುವ ಮೊದಲು ಹಿಂಪಡೆದ ಭಾಗಗಳಲ್ಲಿ ಉಲ್ಲೇಖಿಸಲಾದ ಸಮಯದ ಗುರುತುಗಳು ಅಸ್ತಿತ್ವದಲ್ಲಿವೆಯೇ ಎಂದು ಮೌಲ್ಯೀಕರಿಸಿ.

Q4: ನಾನು ಈ ಏಜೆಂಟ್ ಅನ್ನು ಖಾಸಗಿ ಅಥವಾ ಪಟ್ಟಿ ಮಾಡದ ವೀಡಿಯೊಗಳಿಗಾಗಿ ಬಳಸಬಹುದೇ? ಹೌದು, ನಿಮಗೆ ಪ್ರವೇಶವಿದ್ದರೆ ಮತ್ತು ಪ್ರತಿಲೇಖನಗಳನ್ನು ಪಡೆದುಕೊಳ್ಳಲು ಅಥವಾ ಸ್ಥಳೀಯ ASR ಅನ್ನು ಚಲಾಯಿಸಲು ಸಾಧ್ಯವಾದರೆ (ಉದಾ., Whisper). ಯಾವಾಗಲೂ ಅನುಮತಿಗಳನ್ನು ಗೌರವಿಸಿ ಮತ್ತು ಹಕ್ಕುಸ್ವಾಮ್ಯ ಪಡೆದ ವಿಷಯವನ್ನು ವಿತರಿಸುವುದನ್ನು ತಪ್ಪಿಸಿ.

Q5: ತಂಡಗಳಿಗಾಗಿ ನಾನು ಈ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ಹೇಗೆ ಅಳೆಯಬಹುದು? ಕ್ಯಾಶಿಂಗ್, ಹಂಚಿಕೆಯ ವೆಕ್ಟರ್ ಸ್ಟೋರ್, ಕೆಲಸದ ಸರತಿ ಸಾಲುಗಳು ಮತ್ತು ನಿಗದಿತ ರನ್‌ಗಳನ್ನು ಸೇರಿಸಿ. ಸ್ಲಾಕ್ ಅಥವಾ ವಿಕಿಯೊಂದಿಗೆ ಸಂಯೋಜಿಸಿ ಮತ್ತು ಸಂಶೋಧಕರ ಕಾರ್ಯವಿಧಾನಗಳನ್ನು ಸುವ್ಯವಸ್ಥಿತಗೊಳಿಸಲು Sider.AI ನಂತಹ ಬ್ರೌಸರ್ ಆಧಾರಿತ ಸಹಾಯಕವನ್ನು ಪರಿಗಣಿಸಿ.