ಹಂತ-ಹಂತವಾಗಿ: Claude Code ಬಳಸಿ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದು
ನೀವು ಎಂದಾದರೂ YouTubeನಲ್ಲಿ ಮಧ್ಯಾಹ್ನವನ್ನು ಕಳೆದು, ಯಾವ ವೀಡಿಯೊಗಳನ್ನು ಉಳಿಸಬೇಕೆಂದು ಮರೆತಿದ್ದರೆ, ನೀವು ಒಬ್ಬಂಟಿಯಲ್ಲ. ಈಗ ಅತ್ಯುತ್ತಮ ವೀಡಿಯೊಗಳನ್ನು ಹುಡುಕುವ, ಸಾರಾಂಶಗಳನ್ನು ಹೊರತೆಗೆಯುವ, ಪ್ರಮುಖ ಉಲ್ಲೇಖಗಳನ್ನು ಪಡೆಯುವ, ಸಮಯದ ಗುರುತುಗಳನ್ನು (timestamp) ಒಳನೋಟಗಳನ್ನು ನೀಡುವ ಮತ್ತು ಬೇಡಿಕೆಯ ಮೇರೆಗೆ ಮೂಲಗಳನ್ನು ಹಿಂತಿರುಗಿಸುವ ದಣಿವಿಲ್ಲದ ಸಹಾಯಕರನ್ನು ಕಲ್ಪಿಸಿಕೊಳ್ಳಿ - ಬೇಗನೆ. YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ನಿಖರವಾಗಿ ಏನು ಮಾಡಬಹುದು. ಈ ಹಂತ-ಹಂತದ ಮಾರ್ಗದರ್ಶಿಯಲ್ಲಿ, ಸೃಷ್ಟಿಕರ್ತರು, ವಿಶ್ಲೇಷಕರು, ವಿದ್ಯಾರ್ಥಿಗಳು ಮತ್ತು ಶಬ್ದಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ ಸಂಕೇತವನ್ನು (signal) ಬಯಸುವ ಗೀಳು ಕಲಿಕೆಗೆ ಒಳಗಾದವರಿಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ Claude Codeನೊಂದಿಗೆ ಪ್ರಾಯೋಗಿಕ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಾವು ನಿರ್ಮಿಸುತ್ತೇವೆ.
ನಾವು ಪ್ರಾಯೋಗಿಕ ಮತ್ತು ನೇರ ಮಾರ್ಗವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತೇವೆ: ವಾಸ್ತುಶಿಲ್ಪ, ಕೋಡ್, ಪ್ರಾಂಪ್ಟ್ಗಳು (prompts) ಮತ್ತು ಗಾರ್ಡ್ರೈಲ್ಗಳು (guardrails). ದಾರಿಯುದ್ದಕ್ಕೂ, ನೀವು ನಂತರ ಬದಲಾಯಿಸಬಹುದಾದ ಅಭಿಪ್ರಾಯದ ಆಯ್ಕೆಗಳನ್ನು ಮಾಡುತ್ತೇವೆ. ಕೊನೆಯಲ್ಲಿ, ನೀವು YouTube ಅನ್ನು ಹುಡುಕುವ, ಪ್ರತಿಲೇಖನಗಳನ್ನು (transcripts) ಸಂಗ್ರಹಿಸುವ, ಅನೇಕ ವೀಡಿಯೊಗಳಲ್ಲಿ ತರ್ಕಿಸುವ ಮತ್ತು ಸ್ಪಷ್ಟ ಸಂಶೋಧನಾ ಸಾರಾಂಶಗಳನ್ನು ಉತ್ಪಾದಿಸುವ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಏಜೆಂಟ್ ಅನ್ನು ಹೊಂದಿರುತ್ತೀರಿ.
ನಾವು ಏನು ನಿರ್ಮಿಸುತ್ತಿದ್ದೇವೆ (ಮತ್ತು ಅದು ಏಕೆ ಮುಖ್ಯ)
- ಗುರಿ: YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್, ಅದು:
- ಪ್ರಶ್ನೆಯ ಮೂಲಕ YouTube ಅನ್ನು ಹುಡುಕುವುದು
- ಪ್ರಸ್ತುತತೆ/ಕಾರ್ಯನಿರತತೆಯಿಂದ (relevance/engagement) ಫಲಿತಾಂಶಗಳನ್ನು ಶ್ರೇಣೀಕರಿಸುವುದು
- ಪ್ರತಿಲೇಖನಗಳನ್ನು (ಸ್ವಯಂ-ಶೀರ್ಷಿಕೆಗಳು ಅಥವಾ ಮೂರನೇ ವ್ಯಕ್ತಿ) ಪಡೆದುಕೊಳ್ಳುವುದು
- ಹಿಂಪಡೆಯುವಿಕೆಗಾಗಿ (retrieval) ವಿಷಯವನ್ನು ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸಿ ಹುದುಗಿಸುವುದು
- ಬಹು-ವೀಡಿಯೊ ಒಳನೋಟಗಳನ್ನು ಸಂಶ್ಲೇಷಿಸಲು Claude Code ಅನ್ನು ಬಳಸುವುದು
- ರಚಿತವಾದ ಟಿಪ್ಪಣಿಗಳನ್ನು ಔಟ್ಪುಟ್ ಮಾಡಿ: ಸಾರಾಂಶ, ಪ್ರತಿಪಾದನೆಗಳು, ಸಮಯದ ಗುರುತುಗಳು, ಉಲ್ಲೇಖಗಳು ಮತ್ತು ಉಲ್ಲೇಖಗಳು
- ಪ್ರಾಥಮಿಕ ಕೀವರ್ಡ್: "Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದು"
- ಫಾರ್ಮ್ಯಾಟ್: ಕಾರ್ಯಗತಗೊಳಿಸಬಹುದಾದ ಕೋಡ್ ಮತ್ತು ಪ್ರಾಂಪ್ಟ್ಗಳೊಂದಿಗೆ ಹಂತ-ಹಂತದ ಟ್ಯುಟೋರಿಯಲ್
- ಔಟ್ಪುಟ್ಗಳು: ಪ್ರೋಗ್ರಾಮಿಕ್ ಬಳಕೆಗಾಗಿ ಮಾರ್ಕ್ಡೌನ್ ಸಂಶೋಧನಾ ಸಾರಾಂಶ + JSON
ಇದು ಏಕೆ ಮುಖ್ಯ: YouTube ಮಾತುಕತೆಗಳು, ಪಾಠಗಳು, ಡೆಮೊಗಳು ಮತ್ತು ಚರ್ಚೆಗಳ ಅತಿದೊಡ್ಡ ಸಾರ್ವಜನಿಕ ಜ್ಞಾನದ ನೆಲೆಯಾಗಿದೆ. ಆದರೆ ಇದು ಗದ್ದಲದಂತಿದೆ. Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದು ನಿಮಗೆ ಒಂದು ಅಂಚನ್ನು ನೀಡುತ್ತದೆ: ನೀವು ಗಂಟೆಗಳಲ್ಲಿ ಅಲ್ಲ, ನಿಮಿಷಗಳಲ್ಲಿ ಡಜನ್ಗಟ್ಟಲೆ ವೀಡಿಯೊಗಳಲ್ಲಿ ಒಳನೋಟಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಬಹುದು.
ಒಂದು ನೋಟದಲ್ಲಿ ವಾಸ್ತುಶಿಲ್ಪ
ನಾವು ಮೊದಲ ಆವೃತ್ತಿಯನ್ನು ಸರಳ ಮತ್ತು ದೃಢವಾಗಿ ಇರಿಸುತ್ತೇವೆ.
- ಇನ್ಪುಟ್ಗಳು: ಸಂಶೋಧನಾ ಪ್ರಶ್ನೆ (ಉದಾ., "LLM ಏಜೆಂಟ್ ಆರ್ಕಿಟೆಕ್ಚರ್ಗಳು 2025"), ಐಚ್ಛಿಕ ನಿರ್ಬಂಧಗಳು (ದಿನಾಂಕ ಶ್ರೇಣಿ, ಚಾನಲ್, ಅವಧಿ)
- YouTube ಹುಡುಕಾಟ: YouTube Data API v3 (ಅಥವಾ SerpAPI ಫಾಲ್ಬ್ಯಾಕ್)
- ಪ್ರತಿಲೇಖನಗಳು: YouTube Transcript API; ಲಭ್ಯವಿಲ್ಲದಿದ್ದಾಗ ASR ಗೆ ಫಾಲ್ಬ್ಯಾಕ್ (ಉದಾ., Whisper)
- ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸುವುದು: ವಾಕ್ಯ-ಅರಿವಿನ ವಿಭಾಗೀಕರಣ (ಸುಮಾರು 800-1,200 ಟೋಕನ್ಗಳು)
- ಎಂಬೆಡಿಂಗ್ಗಳು: ಸ್ಥಳೀಯ ಅಥವಾ ಹೋಸ್ಟ್ ಮಾಡಿದ ಎಂಬೆಡಿಂಗ್ ಮಾದರಿಯನ್ನು ಬಳಸಿ (ಉದಾ.,
text-embedding-3-large, nomic-embed-text, ಅಥವಾ bge-large)
- ವೆಕ್ಟರ್ ಸ್ಟೋರ್: ವೇಗಕ್ಕಾಗಿ ಸ್ಥಳೀಯ
FAISS; Pinecone, Weaviate, ಅಥವಾ Qdrant ಗೆ ಬದಲಾಯಿಸಬಹುದು
- ತಾರ್ಕಿಕ ಕ್ರಿಯೆ: ನಿಯಂತ್ರಿತ ಲೂಪ್ನಲ್ಲಿ ಆರ್ಕೆಸ್ಟ್ರೇಶನ್, ಟೂಲ್ ಬಳಕೆ, ಸಂಶ್ಲೇಷಣೆ ಮತ್ತು ಕೋಡ್ ಕಾರ್ಯಗತಗೊಳಿಸಲು Claude Code
- ಔಟ್ಪುಟ್ಗಳು: ಉಲ್ಲೇಖಗಳು, ಸಮಯದ ಗುರುತುಗಳು ಮತ್ತು ಸ್ಕೋರ್ಗಳೊಂದಿಗೆ ಮಾರ್ಕ್ಡೌನ್ ವರದಿ + JSON ಸೂಚ್ಯಂಕ
ಡೇಟಾ ಹರಿವು: ಪ್ರಶ್ನೆ → ಹುಡುಕಾಟ → ಮೆಟಾಡೇಟಾವನ್ನು (metadata) ಪಡೆದುಕೊಳ್ಳಿ → ಪ್ರತಿಲೇಖನ → ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸಿ → ಹುದುಗಿಸು → ಟಾಪ್-K ಅನ್ನು ಹಿಂಪಡೆಯಿರಿ → Claude Code ಸಂಶ್ಲೇಷಣೆ → ವರದಿ.
ಪೂರ್ವಾಪೇಕ್ಷಿತಗಳು ಮತ್ತು ಸೆಟಪ್
- API ಕೀಗಳು:
YOUTUBE_API_KEY, ANTHROPIC_API_KEY (Claude Code ಗಾಗಿ)
- ಐಚ್ಛಿಕ:
OPENAI_API_KEY ಅಥವಾ ಸ್ಥಳೀಯ ಎಂಬೆಡಿಂಗ್ಗಳು
google-api-python-client, youtube-transcript-api
faiss-cpu, numpy, pandas, tiktoken (ಅಥವಾ sentencepiece)
requests, pydantic, tenacity
pip install google-api-python-client youtube-transcript-api faiss-cpu numpy pandas requests pydantic tenacity anthropic tiktoken
ಪರಿಸರ ವೇರಿಯೇಬಲ್ಗಳು:
export YOUTUBE_API_KEY=YOUR_YT_KEY
export ANTHROPIC_API_KEY=YOUR_ANTHROPIC_KEY
ಹಂತ 1: ಫಿಲ್ಟರ್ಗಳೊಂದಿಗೆ YouTube ಹುಡುಕಾಟ
ನಾವು YouTube ಅನ್ನು ಹುಡುಕುತ್ತೇವೆ ಮತ್ತು ರಚಿತವಾದ ಮೆಟಾಡೇಟಾವನ್ನು (metadata) ಹಿಂತಿರುಗಿಸುತ್ತೇವೆ: ಶೀರ್ಷಿಕೆ, ಚಾನಲ್, ಪ್ರಕಟಣೆ ದಿನಾಂಕ, ಅವಧಿ, ವೀಕ್ಷಣೆಗಳು (ಲಭ್ಯವಿದ್ದರೆ) ಮತ್ತು ವೀಡಿಯೊ ಐಡಿ.
# file: yt_search.py
from googleapiclient.discovery import build
import os
YOUTUBE_API_KEY = os.environ — channel, date\n\n"
"---\n"
"JSON schema: {\"claims\":[{\"claim\":str,\"support\":[{\"video_id\":str,\"start\":float,\"end\":float}]}]}\n"
)
def call_claude(goal: str, passages: list[dict]):
passages_str = "\n\n".join(
f"[rank {p['rank']} | score {p['score']:.3f}] (vID={p.get('video_id','?')}, {p.get('start',0):.1f}-{p.get('end',0):.1f})\n{p['text']}"
for p in passages
)
msg = client.messages.create(
model="claude-3-5-sonnet-20240620",
max_tokens=1800,
temperature=0.2,
system=SYSTEM_PROMPT,
messages=[
{"role": "user", "content": USER_TEMPLATE.format(goal=goal, passages=passages_str)}
])
return msg.content[0].text
Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವಾಗ ಪ್ರಾಂಪ್ಟ್ ಸಲಹೆಗಳು:
- ಮಾನವ-ಓದಬಲ್ಲ ಮತ್ತು ಯಂತ್ರ-ಓದಬಲ್ಲ ಸ್ವರೂಪಗಳಲ್ಲಿ ರಚಿತವಾದ ಔಟ್ಪುಟ್ಗಳನ್ನು ಕೇಳಿ
- ಸಮಯದ ಗುರುತಿಸಲಾದ ಉಲ್ಲೇಖಗಳನ್ನು ಜಾರಿಗೊಳಿಸಿ
- ಅನಿಶ್ಚಿತತೆ ಬಹಿರಂಗಪಡಿಸುವಿಕೆ ಮತ್ತು ವಿರೋಧಾಭಾಸಗಳನ್ನು ಪ್ರೋತ್ಸಾಹಿಸಿ
ಹಂತ 6: ಎಲ್ಲವನ್ನೂ ಒಟ್ಟಿಗೆ ಸೇರಿಸುವುದು
ಪ್ರಶ್ನೆ → ಹುಡುಕಾಟ → ಪ್ರತಿಲೇಖನಗಳು → ಭಾಗಗಳು → ಎಂಬೆಡಿಂಗ್ಗಳು → ಹಿಂಪಡೆಯಿರಿ → ಸಂಶ್ಲೇಷಣೆ ಮಾಡುವಂತೆ ಮಾಡೋಣ.
# file: run_agent.py
from yt_search import search_youtube
from transcripts import fetch_transcript
from chunking import transcript_to_docs
from embeddings import VectorStore
from orchestrator import call_claude
from datetime import datetime
def build_corpus(query: str, max_videos=8):
results = search_youtube(query, max_results=max_videos)
corpus_docs = []
for r in results:
tx = fetch_transcript(r["video_id"]) or []
if not tx:
continue
docs = transcript_to_docs(tx)
for d in docs:
d.update({
"video_id": r["video_id"],
"title": r["title"],
"channel": r["channel"],
"url": r["url"],
})
corpus_docs.extend(docs)
return corpus_docs
def research(query: str, k=12):
corpus = build_corpus(query)
if not corpus:
return "No transcripts available."
vs = VectorStore
vs.add(corpus)
passages = vs.search(query, k=k)
md = call_claude(query, passages)
timestamp = datetime.utcnow.isoformat
return f"<!-- generated {timestamp} UTC -->\n\n" + md
if __name__ == "__main__":
print(research("LLM agents for YouTube research"))
Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ನ ಈ ಮೂಲ ಆವೃತ್ತಿಯು ಉಲ್ಲೇಖಗಳೊಂದಿಗೆ ಬಹು-ವೀಡಿಯೊ ಒಳನೋಟಗಳನ್ನು ಹುಡುಕುತ್ತದೆ, ಹಿಂಪಡೆಯುತ್ತದೆ ಮತ್ತು ಸಂಶ್ಲೇಷಿಸುತ್ತದೆ. ಎಂಬೆಡಿಂಗ್ಗಳನ್ನು ಅಪ್ಗ್ರೇಡ್ ಮಾಡಿ ಮತ್ತು ಅದನ್ನು ಉತ್ಪಾದನೆಗೆ ಸಿದ್ಧಗೊಳಿಸಲು ಕ್ಯಾಶಿಂಗ್ (caching) ಅನ್ನು ಸೇರಿಸಿ.
ಅದನ್ನು ಉತ್ತಮಗೊಳಿಸಲು ಏಳು ನವೀಕರಣಗಳು
- ಉತ್ತಮ ಎಂಬೆಡಿಂಗ್ಗಳು ಮತ್ತು ಹೈಬ್ರಿಡ್ ಹುಡುಕಾಟ
- ಉತ್ತಮ-ಗುಣಮಟ್ಟದ ಎಂಬೆಡಿಂಗ್ಗಳನ್ನು ಬದಲಾಯಿಸಿ ಮತ್ತು BM25 ಕೀವರ್ಡ್ ಹುಡುಕಾಟವನ್ನು ಸೇರಿಸಿ. ಹೈಬ್ರಿಡ್ ನಿರ್ದಿಷ್ಟ ಪದಗಳ ಮೇಲೆ ಹೆಚ್ಚಿನ ಮರುಸ್ಥಾಪನೆ ಮತ್ತು ಅಮೂರ್ತ ವಿಷಯಗಳ ಮೇಲೆ ಉತ್ತಮ ನಿಖರತೆಯನ್ನು ನೀಡುತ್ತದೆ.
- ಸಮೃದ್ಧ ಮೆಟಾಡೇಟಾಕ್ಕಾಗಿ (metadata) ಪರಿಕರಗಳನ್ನು ವಿಸ್ತರಿಸಿ
- ಕಾಮೆಂಟ್ಗಳು, ಇಷ್ಟ/ಇಷ್ಟವಿಲ್ಲ ಅನುಪಾತ ಮತ್ತು ಚಾನಲ್ ಪ್ರಾಧಿಕಾರವನ್ನು ಎಳೆಯಿರಿ. ಟಾಪ್ 100 ಅಭ್ಯರ್ಥಿಗಳಿಗೆ ಮರು-ಶ್ರೇಣಿಕರ್ತನನ್ನು (cross-encoder) ಸೇರಿಸಿ.
- ಸಂಶೋಧನಾ ಯೋಜನೆಯನ್ನು ಪ್ರಸ್ತಾಪಿಸಲು Claude Code ಅನ್ನು ಬಳಸಿ: ಉಪ-ಪ್ರಶ್ನೆಗಳು, ಊಹೆಗಳು ಮತ್ತು ವ್ಯಾಪ್ತಿ ಪರಿಶೀಲನೆಗಳು. ವ್ಯಾಪ್ತಿ ಮಿತಿಗಳನ್ನು ತಲುಪುವವರೆಗೆ ಪುನರಾವರ್ತಿತವಾಗಿ ಕಾರ್ಯಗತಗೊಳಿಸಿ.
- ಪುರಾವೆ ಟ್ರ್ಯಾಕಿಂಗ್ ಮತ್ತು ಪ್ರತಿ-ಪುರಾವೆ
- ಪ್ರತಿ ಹಕ್ಕುಗೆ, ಬೆಂಬಲಿಸುವ ಮತ್ತು ವಿರೋಧಿಸುವ ತುಣುಕುಗಳನ್ನು ಲಾಗ್ ಮಾಡಿ. ವರದಿಗಳಲ್ಲಿ ಎರಡನ್ನೂ ಪ್ರಸ್ತುತಪಡಿಸಿ; ವಿಶ್ವಾಸದ ಸ್ಕೋರ್ಗಳನ್ನು ಸೇರಿಸಿ.
- ಉಪಶೀರ್ಷಿಕೆಗಳು ಅಥವಾ Whisper ಪದ ಸಮಯಗಳ ಮೂಲಕ ದೃಶ್ಯ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯನ್ನು ಬಳಸಿ. ಸಂದರ್ಭ ದುರ್ಬಲಗೊಳಿಸುವಿಕೆಯನ್ನು ತಪ್ಪಿಸಲು ಜಾಗತಿಕ ಸಂಶ್ಲೇಷಣೆಯ ಮೊದಲು ಪ್ರತಿ-ವಿಭಾಗಕ್ಕೆ ಸಾರಾಂಶ ನೀಡಿ.
- ಪ್ರತಿ ಪ್ರಶ್ನೆಗೆ ಪ್ರತಿಲೇಖನಗಳು, ಎಂಬೆಡಿಂಗ್ಗಳು ಮತ್ತು ವರದಿಗಳನ್ನು ಸಂಗ್ರಹಿಸಿ. ಬಳಕೆದಾರರು ಫಿಲ್ಟರ್ಗಳನ್ನು ಬದಲಾಯಿಸಿದಾಗ ಮರುಬಳಕೆ ಮಾಡಿ. ವೀಡಿಯೊ ಐಡಿಯಿಂದ ಡಿಡ್ಯೂಪ್ಲಿಕೇಶನ್ (deduplication) ಅನ್ನು ಸೇರಿಸಿ.
- ಫಾರ್ಮ್ಯಾಟ್ಗಳು ಮತ್ತು ವಿತರಣೆಯನ್ನು ರಫ್ತು ಮಾಡಿ
- ಮಾರ್ಕ್ಡೌನ್, PDF ಮತ್ತು JSON ಅನ್ನು ರಫ್ತು ಮಾಡಿ. ಇಮೇಲ್ ಅಥವಾ ಸ್ಲಾಕ್ ವಿತರಣೆ. ಸಮಯದ ಗುರುತುಗಳನ್ನು ಕ್ಲಿಕ್ ಮಾಡಬಹುದಾದ
?t=mmss ಲಿಂಕ್ಗಳಾಗಿ ರೆಂಡರ್ ಮಾಡಿ.
ನೀವು ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ ಪ್ರಾಂಪ್ಟ್ಗಳು
Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವಾಗ ಈ ಟೆಂಪ್ಲೇಟ್ಗಳನ್ನು ಬಳಸಿ.
ಸಿಸ್ಟಮ್: ನೀವು ನಿಖರವಾದ ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಆಗಿದ್ದೀರಿ. ಬಹು YouTube ಪ್ರತಿಲೇಖನಗಳಾದ್ಯಂತ ಸಂಶ್ಲೇಷಿಸಿ. [vID @ mm:ss] ನೊಂದಿಗೆ ಇನ್ಲೈನ್ ಅನ್ನು ಉಲ್ಲೇಖಿಸಿ ಮತ್ತು URLಗಳೊಂದಿಗೆ ಮೂಲಗಳ ವಿಭಾಗವನ್ನು ಸೇರಿಸಿ. ಸಮಯದ ಗುರುತಿಸಲಾದ ಬೆಂಬಲದೊಂದಿಗೆ ಮಾರ್ಕ್ಡೌನ್ ಸಾರಾಂಶ ಮತ್ತು ಹಕ್ಕುಗಳ JSON ಪೇಲೋಡ್ ಎರಡನ್ನೂ ಹಿಂತಿರುಗಿಸಿ.
ಬಳಕೆದಾರ: ಸಂಶೋಧನಾ ಗುರಿ: {ವಿಷಯ}
ನಿರ್ಬಂಧಗಳು: {ಪ್ರೇಕ್ಷಕರು ಅಥವಾ ವ್ಯಾಪ್ತಿ} ಮೇಲೆ ಗಮನಹರಿಸಿ; {ದಿನಾಂಕ ಶ್ರೇಣಿಯ} ಒಳಗೆ ಮೂಲಗಳನ್ನು ಆದ್ಯತೆ ನೀಡಿ; ಭಿನ್ನಾಭಿಪ್ರಾಯಗಳನ್ನು ಸೇರಿಸಿ.
ಅಭ್ಯರ್ಥಿ ಭಾಗಗಳು (ಶ್ರೇಣೀಕರಿಸಲಾಗಿದೆ):
{ಹಿಂಪಡೆದ_ಭಾಗಗಳು}
ಔಟ್ಪುಟ್: ಸಾರಾಂಶ → ಪ್ರಮುಖ ಒಳನೋಟಗಳು (ಗುಂಡುಗಳು) → ಗಮನಾರ್ಹ ಉಲ್ಲೇಖಗಳು (ಸಮಯದ ಗುರುತುಗಳೊಂದಿಗೆ) → ವಿರೋಧಾಭಾಸಗಳು ಮತ್ತು ಅಂತರಗಳು → ಮೂಲಗಳು. ನಂತರ JSON {"claims": ...}
ಗಾರ್ಡ್ರೈಲ್ಗಳು ಮತ್ತು ನೀತಿಶಾಸ್ತ್ರ
- ಸೃಷ್ಟಿಕರ್ತರ ಹಕ್ಕುಗಳನ್ನು ಗೌರವಿಸಿ: ಮೂಲ ವೀಡಿಯೊಗಳಿಗೆ ಲಿಂಕ್ ಮಾಡಿ ಮತ್ತು ದೊಡ್ಡ ಪದಶಃ ಪ್ರತಿಲೇಖನಗಳನ್ನು ಪ್ರಕಟಿಸುವುದನ್ನು ತಪ್ಪಿಸಿ.
- ಪಾರದರ್ಶಕವಾಗಿರಿ: ಸಮಯದ ಗುರುತುಗಳು ಮತ್ತು ವೀಡಿಯೊ ಐಡಿಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಹಕ್ಕುಗಳು ಎಲ್ಲಿಂದ ಬಂದಿವೆ ಎಂಬುದನ್ನು ತೋರಿಸಿ.
- ಅತಿಯಾಗಿ-ಸಾರಾಂಶ ಮಾಡುವುದನ್ನು ತಪ್ಪಿಸಿ: ಸೂಕ್ಷ್ಮ ವ್ಯತ್ಯಾಸವನ್ನು ಕಾಪಾಡಿಕೊಳ್ಳಿ; ಶೀರ್ಷಿಕೆಗಳನ್ನು ಸ್ವಯಂ-ರಚಿತವಾಗಿಸಿದಾಗ ಮತ್ತು ಗದ್ದಲದಂತಿರುವಾಗ ಫ್ಲ್ಯಾಗ್ ಮಾಡಿ.
- ಸೂಕ್ಷ್ಮ ವಿಷಯಗಳನ್ನು ಎಚ್ಚರಿಕೆಯಿಂದ ನಿರ್ವಹಿಸಿ: ಅನಿಶ್ಚಿತತೆಯನ್ನು ಹೈಲೈಟ್ ಮಾಡಿ ಮತ್ತು ವೈವಿಧ್ಯಮಯ ಮೂಲಗಳನ್ನು ಹುಡುಕಿ.
ನಿವಾರಣೆ: ಸಾಮಾನ್ಯ ಸಮಸ್ಯೆಗಳು ಮತ್ತು ಪರಿಹಾರಗಳು
- "ಯಾವುದೇ ಪ್ರತಿಲೇಖನ ಕಂಡುಬಂದಿಲ್ಲ"
- Whisper ಗೆ ಫಾಲ್ಬ್ಯಾಕ್; ವಿಭಿನ್ನ ಭಾಷೆಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ; ವೀಡಿಯೊ ಪ್ರದೇಶ-ನಿರ್ಬಂಧಿತವಾಗಿದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ.
- ಕಳಪೆ ಹಿಂಪಡೆಯುವಿಕೆಯ ಗುಣಮಟ್ಟ
- ಎಂಬೆಡಿಂಗ್ಗಳನ್ನು ಅಪ್ಗ್ರೇಡ್ ಮಾಡಿ; BM25 ಅನ್ನು ಸೇರಿಸಿ; ಭಾಗದ ಅತಿಕ್ರಮಣವನ್ನು ಹೆಚ್ಚಿಸಿ; ಟಾಪ್-K ಅನ್ನು ಪ್ಯಾರಾಮೀಟರ್-ಟ್ಯೂನ್ ಮಾಡಿ.
- ಕಟ್ಟುನಿಟ್ಟಾದ ಉಲ್ಲೇಖ ಯೋಜನೆಯನ್ನು ಬಲವಂತವಾಗಿ ಜಾರಿಗೊಳಿಸಿ; ಬೆಂಬಲಿಸದ ಹಕ್ಕುಗಳನ್ನು ಶಿಕ್ಷಿಸಿ; ಹಿಂಪಡೆದ ಭಾಗಗಳಲ್ಲಿ ನಿಖರವಾದ ಸಮಯದ ಗುರುತುಗಳು ಇರಬೇಕೆಂದು ಒತ್ತಾಯಿಸಿ.
- ಆಕ್ರಮಣಕಾರಿಯಾಗಿ ಸಂಗ್ರಹಿಸಿ;
max_results ಅನ್ನು ಕಡಿಮೆ ಮಾಡಿ; ಬ್ಯಾಚ್ ವಿನಂತಿಗಳು; tenacity ನೊಂದಿಗೆ ಬ್ಯಾಕ್-ಆಫ್ ಅನ್ನು ಸೇರಿಸಿ.
- ಪ್ರತಿ-ವಿಭಾಗಕ್ಕೆ ಸಾರಾಂಶ ನೀಡಿ; ಗರಿಷ್ಠ ಟೋಕನ್ಗಳನ್ನು ನಿರ್ಬಂಧಿಸಿ; ಸ್ಪಷ್ಟ ರೂಪರೇಖೆಯೊಂದಿಗೆ ಯೋಜನಾ ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಬಳಸಿ.
ಗುಣಮಟ್ಟವನ್ನು ಅಳೆಯುವುದು
- ಗುಣಮಟ್ಟದ ಸೆಟ್ ವಿರುದ್ಧ ಹಿಂಪಡೆದ ಭಾಗಗಳ ನಿಖರತೆ@K
- ವಿಶ್ವಾಸಾರ್ಹತೆ ದರ: ಪರಿಶೀಲಿಸಬಹುದಾದ ಸಮಯದ ಗುರುತಿಸಲಾದ ಬೆಂಬಲದೊಂದಿಗೆ ಹಕ್ಕುಗಳ ಪ್ರಮಾಣ
- ವ್ಯಾಪ್ತಿ: ಉಲ್ಲೇಖಿಸಲಾದ ವಿಶಿಷ್ಟ ಸಂಬಂಧಿತ ವೀಡಿಯೊಗಳ ಸಂಖ್ಯೆ
- ವಿಳಂಬ: ಪ್ರಶ್ನೆಯಿಂದ ವರದಿಗೆ ಸಮಯ
ಉದಾಹರಣೆ: "ವೆಕ್ಟರ್ ಡೇಟಾಬೇಸ್ಗಳನ್ನು ವಿವರಿಸಲಾಗಿದೆ" ಕುರಿತು ಸಂಶೋಧನೆ
- ಪ್ರಶ್ನೆ: "ಡೆವಲಪರ್ಗಳಿಗಾಗಿ 2025 ವೆಕ್ಟರ್ ಡೇಟಾಬೇಸ್ಗಳನ್ನು ವಿವರಿಸಲಾಗಿದೆ"
- ಫಿಲ್ಟರ್ಗಳು: 2023 ರ ನಂತರದ ವೀಡಿಯೊಗಳು, ಅವಧಿ 6-30 ನಿಮಿಷಗಳು
- ಫಲಿತಾಂಶ: ಏಜೆಂಟ್ 6 ವೀಡಿಯೊಗಳನ್ನು ಉಲ್ಲೇಖಿಸುತ್ತದೆ, HNSW vs IVF-PQ ಯ ವಿನಿಮಯವನ್ನು ಹೈಲೈಟ್ ಮಾಡುತ್ತದೆ, ವೆಚ್ಚ/ಮರುಸ್ಥಾಪನೆಯ ಬಗ್ಗೆ ಚರ್ಚಿಸುತ್ತದೆ ಮತ್ತು ಬೆಂಚ್ಮಾರ್ಕ್ಗಳಿಗೆ ಲಿಂಕ್ ಮಾಡುತ್ತದೆ. ವಿರೋಧಾಭಾಸಗಳ ವಿಭಾಗವು ಮಾರಾಟಗಾರರ ಹಕ್ಕುಗಳನ್ನು ಮುಕ್ತ-ಮೂಲ ಫಲಿತಾಂಶಗಳಿಗೆ ಹೋಲಿಸುತ್ತದೆ.
ಮೂಲಕ: ನಿಮ್ಮ ಕಾರ್ಯವಿಧಾನದ ಒಳಗೆ ಇದನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುವುದು
ನೀವು ಡಾಕ್ಸ್ ಮತ್ತು ಕೋಡ್ನಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದರೆ, ಕೊನೆಯ ಮೈಲಿಯನ್ನು ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸುವುದು ಯೋಗ್ಯವಾಗಿದೆ. ಒಂದು ಸಣ್ಣ CLI ರಾತ್ರಿಯ ಪ್ರಶ್ನೆಗಳನ್ನು ಚಲಾಯಿಸಬಹುದು ಮತ್ತು ಮಾರ್ಕ್ಡೌನ್ ಸಾರಾಂಶಗಳನ್ನು ನಿಮ್ಮ ಜ್ಞಾನದ ನೆಲೆಯಲ್ಲಿ ಬಿಡಬಹುದು. ಸ್ಪ್ರಿಂಟ್ ಸಂಶೋಧನೆಗಾಗಿ ನೀವು ಅದನ್ನು ಸಮಸ್ಯೆಯ ಟೆಂಪ್ಲೇಟ್ಗಳಿಗೆ ವೈರ್ ಮಾಡಬಹುದು.
ಗಮನಿಸಬೇಕಾದ ಅಂಶ: ನಿಮ್ಮ ಕಾರ್ಯವಿಧಾನವು ಈಗಾಗಲೇ ಬ್ರೌಸರ್ ಸೈಡ್ಬಾರ್ ಅಥವಾ AI ಸಹಾಯಕರಲ್ಲಿದ್ದರೆ, Sider.AI ನಂತಹ ಪರಿಕರಗಳು ಸಂಶೋಧನಾ ಲೂಪ್ ಅನ್ನು ಸುವ್ಯವಸ್ಥಿತಗೊಳಿಸಬಹುದು - ವಿಷಯವನ್ನು ಆಯ್ಕೆಮಾಡಿ, ಹುಡುಕಾಟವನ್ನು ಚಲಾಯಿಸಿ, ಪ್ರತಿಲೇಖನಗಳನ್ನು ಸೆರೆಹಿಡಿಯಿರಿ ಮತ್ತು ನೀವು ಕೆಲಸ ಮಾಡುವ ಸ್ಥಳದಲ್ಲಿಯೇ Claude-ಚಾಲಿತ ಸಾರಾಂಶವನ್ನು ರಚಿಸಿ. ಇದು ಸಂದರ್ಭ ಬದಲಾವಣೆಯನ್ನು ಉಳಿಸಬಹುದು ಮತ್ತು Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದನ್ನು ತಂಡಗಳಿಗೆ ಇನ್ನಷ್ಟು ಪ್ರಾಯೋಗಿಕವಾಗಿಸಬಹುದು. ಪ್ರಮುಖ ಅಂಶಗಳು
- Claude Codeನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುವುದು ವೀಡಿಯೊಗಳನ್ನು ಕಾರ್ಯಸಾಧ್ಯವಾದ ಸಾರಾಂಶಗಳಾಗಿ ಪರಿವರ್ತಿಸಲು ಹೆಚ್ಚಿನ ಸಾಮರ್ಥ್ಯದ ಮಾರ್ಗವಾಗಿದೆ.
- ಕನಿಷ್ಠ ಸ್ಟಾಕ್: YouTube API + ಪ್ರತಿಲೇಖನಗಳು + ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸುವುದು + ಎಂಬೆಡಿಂಗ್ಗಳು + FAISS + Claude ಸಂಶ್ಲೇಷಣೆ.
- ಅಪ್ಗ್ರೇಡ್ ಮಾರ್ಗಗಳು: ಹೈಬ್ರಿಡ್ ಹುಡುಕಾಟ, ಮರು-ಶ್ರೇಣೀಕರಣ, ಯೋಜನಾ ಲೂಪ್ಗಳು ಮತ್ತು ಕಟ್ಟುನಿಟ್ಟಾದ ಉಲ್ಲೇಖ ಟ್ರ್ಯಾಕಿಂಗ್.
- ಸರಳವಾಗಿ ಪ್ರಾರಂಭಿಸಿ, ವಿಶ್ವಾಸಾರ್ಹತೆಯನ್ನು ಅಳೆಯಿರಿ ಮತ್ತು ವಿಶ್ವಾಸಾರ್ಹತೆಯ ಕಡೆಗೆ ಪುನರಾವರ್ತಿಸಿ.
ಮುಂದಿನ ಹಂತಗಳು
- ನೈಜ ಎಂಬೆಡಿಂಗ್ ಮಾದರಿ ಮತ್ತು ಹೈಬ್ರಿಡ್ ಹಿಂಪಡೆಯುವಿಕೆಯನ್ನು ಅನುಷ್ಠಾನಗೊಳಿಸಿ
- ಮರು-ಶ್ರೇಣೀಕರಣ ಹಂತ ಮತ್ತು ಗುಣಮಟ್ಟದ ಮೆಟ್ರಿಕ್ಗಳನ್ನು ಸೇರಿಸಿ
- ವಾರಕ್ಕೊಮ್ಮೆ ವಿಷಯಗಳನ್ನು ರಿಫ್ರೆಶ್ ಮಾಡಲು ನಿಗದಿತ ಕೆಲಸವನ್ನು ರಚಿಸಿ
- CLI ಮತ್ತು ಹಗುರವಾದ ವೆಬ್ UI ಆಗಿ ಪ್ಯಾಕೇಜ್ ಮಾಡಿ
FAQ
Q1: Claude Code ನೊಂದಿಗೆ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸಲು ನಾನು ಹೇಗೆ ಪ್ರಾರಂಭಿಸುವುದು?
YouTube ಹುಡುಕಾಟದೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ, ಪ್ರತಿಲೇಖನಗಳನ್ನು ಪಡೆದುಕೊಳ್ಳಿ, ವಿಷಯವನ್ನು ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸಿ, ವೆಕ್ಟರ್ ಸ್ಟೋರ್ಗೆ ಎಂಬೆಡ್ ಮಾಡಿ ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ಸಂಶ್ಲೇಷಿಸಲು Claude Code ಅನ್ನು ಬಳಸಿ. ಕೆಲಸ ಮಾಡುವ ಪೈಪ್ಲೈನ್ ಅನ್ನು ಜೋಡಿಸಲು ಮೇಲಿನ ಮಾರ್ಗದರ್ಶಿ ಹಂತ-ಹಂತದ ಕೋಡ್ ಅನ್ನು ಒದಗಿಸುತ್ತದೆ.
Q2: YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ಗೆ ಯಾವ ಲೈಬ್ರರಿಗಳು ಉತ್ತಮವಾಗಿವೆ?
ಹುಡುಕಾಟಕ್ಕಾಗಿ YouTube Data API, ಶೀರ್ಷಿಕೆಗಳಿಗಾಗಿ youtube-transcript-api, ವೆಕ್ಟರ್ ಹುಡುಕಾಟಕ್ಕಾಗಿ FAISS ಮತ್ತು Claude Code ಅನ್ನು ಕರೆಯಲು Anthropic SDK ಅನ್ನು ಬಳಸಿ. ನೀವು OpenAI, Nomic ಅಥವಾ BGE ನೊಂದಿಗೆ ಎಂಬೆಡಿಂಗ್ಗಳನ್ನು ಬದಲಾಯಿಸಬಹುದು.
Q3: ನಿಖರವಾದ ಉಲ್ಲೇಖಗಳು ಮತ್ತು ಸಮಯದ ಗುರುತುಗಳನ್ನು ನಾನು ಹೇಗೆ ಖಚಿತಪಡಿಸಿಕೊಳ್ಳುವುದು?
ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸುವ ಸಮಯದಲ್ಲಿ ಪ್ರಾರಂಭ/ಅಂತ್ಯ ಸಮಯದ ಗುರುತುಗಳನ್ನು ಇರಿಸಿ ಮತ್ತು Claude Code [video_id @ mm:ss] ಅನ್ನು ಉಲ್ಲೇಖಿಸಲು ಅಗತ್ಯವಿರುತ್ತದೆ. ಪ್ರಕಟಿಸುವ ಮೊದಲು ಹಿಂಪಡೆದ ಭಾಗಗಳಲ್ಲಿ ಉಲ್ಲೇಖಿಸಲಾದ ಸಮಯದ ಗುರುತುಗಳು ಅಸ್ತಿತ್ವದಲ್ಲಿವೆಯೇ ಎಂದು ಮೌಲ್ಯೀಕರಿಸಿ.
Q4: ನಾನು ಈ ಏಜೆಂಟ್ ಅನ್ನು ಖಾಸಗಿ ಅಥವಾ ಪಟ್ಟಿ ಮಾಡದ ವೀಡಿಯೊಗಳಿಗಾಗಿ ಬಳಸಬಹುದೇ?
ಹೌದು, ನಿಮಗೆ ಪ್ರವೇಶವಿದ್ದರೆ ಮತ್ತು ಪ್ರತಿಲೇಖನಗಳನ್ನು ಪಡೆದುಕೊಳ್ಳಲು ಅಥವಾ ಸ್ಥಳೀಯ ASR ಅನ್ನು ಚಲಾಯಿಸಲು ಸಾಧ್ಯವಾದರೆ (ಉದಾ., Whisper). ಯಾವಾಗಲೂ ಅನುಮತಿಗಳನ್ನು ಗೌರವಿಸಿ ಮತ್ತು ಹಕ್ಕುಸ್ವಾಮ್ಯ ಪಡೆದ ವಿಷಯವನ್ನು ವಿತರಿಸುವುದನ್ನು ತಪ್ಪಿಸಿ.
Q5: ತಂಡಗಳಿಗಾಗಿ ನಾನು ಈ YouTube ಸಂಶೋಧನಾ ಏಜೆಂಟ್ ಅನ್ನು ಹೇಗೆ ಅಳೆಯಬಹುದು?
ಕ್ಯಾಶಿಂಗ್, ಹಂಚಿಕೆಯ ವೆಕ್ಟರ್ ಸ್ಟೋರ್, ಕೆಲಸದ ಸರತಿ ಸಾಲುಗಳು ಮತ್ತು ನಿಗದಿತ ರನ್ಗಳನ್ನು ಸೇರಿಸಿ. ಸ್ಲಾಕ್ ಅಥವಾ ವಿಕಿಯೊಂದಿಗೆ ಸಂಯೋಜಿಸಿ ಮತ್ತು ಸಂಶೋಧಕರ ಕಾರ್ಯವಿಧಾನಗಳನ್ನು ಸುವ್ಯವಸ್ಥಿತಗೊಳಿಸಲು Sider.AI ನಂತಹ ಬ್ರೌಸರ್ ಆಧಾರಿತ ಸಹಾಯಕವನ್ನು ಪರಿಗಣಿಸಿ.