Uvod: Agent Kakvog Svi Žele, Bez Hypea
Problem s agentima za kodiranje je taj što većina njih pokušava biti vaš šef, vaš kopilot i vaš terapeut—a onda zaborave samo pisati kod. Pravila igre su sljedeća: dodajte desetak vektorskih spremišta, pospite malo orkestracijske čarobne prašine, ubacite preglednik i smatrajte da je dan gotov. Demo dobro izgleda. Također se raspadne čim ga zamolite da popravi nestabilan integracijski test u 16:52 u petak.
Izgradnja laganog agenta za kodiranje s Claudeom 4.5 je—iznenađenje—zapravo jednostavna ako prestanete loviti san o univerzalnom softverskom batleru i samo izgradite alat koji čita kod, planira, uređuje, pokreće i ponavlja. Bez propovijedi o “AI koji zamjenjuje programere.” Bez Rube Goldbergovih cjevovoda. Samo čvrsta petlja koja dobro radi očite stvari.
Ovo je vodič s uputama kako doći do toga bez uvlačenja cijelog odjela za AI operacije. Koristit ćemo Claude 4.5 za mozak, datotečni sustav i ljusku za ruke te malu memoriju za kratkoročni fokus. To je to. Lagan znači da ga možete razumjeti u jednom sjedenju, pokrenuti lokalno i vjerovati mu jer je svaki korak moguće provjeriti. Što je, ako ste u zadnje vrijeme koristili bilo što u ovom području, gotovo subverzivno.
Zašto Claude 4.5 Funkcionira za Minimalnog Agenta
Claude 4.5 ima temperament kakav zapravo želite za kod: pažljiv s praćenjem uputa, iznenađujuće pristojan u čitanju diffova i nije pretjerano željan halucinirati okvire koje niste tražili. Model je kompetentan u postupnom zaključivanju bez zahtijevanja cijelog novog prompta. Ta kombinacija—razmišljanje plus suzdržanost—čini ga idealnim za petlju agenta za kodiranje:
- Promatraj: Čitajte trenutne datoteke, zapisnike pogrešaka i testove.
- Planiraj: Predloži konkretne izmjene s obrazloženjem.
- Djeluj: Zakrpaj datoteke, pokreni naredbe.
- Razmisli: Procijeni izlaz, ponovi ili zaustavi.
Možete ovo pričvrstiti na bilo koji repo i dobiti vrijednost u jednom poslijepodnevu. Trik je u tome da se oduprete porivu da ga pretvorite u “AI platformu.” Ako agent ostane lagan, Claude 4.5 obavlja teške poslove bez da vam smeta.
Lagan Arhitektura: Pet Dijelova, Bez Drame
Evo cijelog stoga koji vam je potreban:
- Glavna petlja: Jedan proces koji poziva Claude 4.5 i interpretira njegove poruke o korištenju alata.
- Alati: Mali skup—read_file, write_file, list_dir, run_tests (ili run_cmd), search_code.
- Sastavljač konteksta: Sastavite kratak, usmjeren prompt s metapodacima repoa i nedavnim diffovima.
- Kratkoročna memorija: Klizni prozor razgovora plus eksplicitna bilježnica za plan i ograničenja.
- Zaštitne ograde: Ograničenja tokena, vremena i pisanja datoteka; način rada za suho pokretanje; i snimke povrata.
To je to. Možete ga pokrenuti bez glave u terminalu ili ga zamotati u minimalno korisničko sučelje ako morate. Razlog zašto ovo funkcionira je dosadan: svaka se radnja promatra i može se provjeriti. Agent predlaže promjenu, prikazuje diff, pokreće testove, čita izlaz i nastavlja ili zaustavlja. Nema tajanstvenog mesa u sredini.
Kako Izgraditi Agenta (Bez Gubljenja Smisla)
Korak 1: Definirajte Ugovor—Prompt i Alati
Vaš je agent dobar koliko i njegov ugovor s modelom. Neka sistemski prompt bude kratak, strog i neumoljivo praktičan.
Sistemski prompt, destilirano:
- Vi ste agent za kodiranje. Vaš je posao napraviti male, ispravne promjene u repou kako biste zadovoljili korisnički zadatak.
- Razmišljajte naglas u skrivenoj bilježnici; korisniku izlažite samo planove i diffove.
- Preferirajte minimalne diffove, radne testove i inkrementalni napredak.
- Kada niste sigurni, predložite eksperiment i pokrenite ga.
- Nikada nemojte izmišljati datoteke ili naredbe—popišite i pročitajte prije nego što uredite.
Shema alata (nemojte previše razmišljati o tome):
- read_file(path, offset?, length?)
- write_file(path, content, create_if_missing=false)
- run_cmd(command, timeout=60, cwd=repo_root)
- search_code(query, path=repo_root, max_results=50)
Neobavezna poboljšanja: git_diff i git_revert(sha) ako želite povrate bez ruku. Možete preskočiti vektorsku pohranu; većina korisnih zadataka ovisi o šačici datoteka u radnoj memoriji plus brzom pretraživanju.
Korak 2: Održavajte Kontekst Mršavim
Punjenje konteksta je cargo kult dizajna agenta. Nemojte bacati cijeli svoj monorepo u prompt. Umjesto toga:
- Sažetak repoa: Jedan odlomak sažetka README; ulazne točke; naredba za pokretanje testa.
- Aktivne datoteke: Samo datoteke koje agent planira dotaknuti—čitajte ih u dijelovima po potrebi.
- Zadatak: Korisnički cilj, jasno izražen: “Popravi neuspjeli test FooTest.test_bar u tests/foo_test.py.”
- Ograničenja: Ograničenja vremena izvođenja, popis dopuštenih pisanja datoteka, pravila stila i očekivanja semantičkog verziranja ako je primjenjivo.
- Nedavna povijest: Zadnja dva diffa i njihovi rezultati testa. Ništa drugo.
Claude 4.5 savršeno je sposoban dohvatiti više konteksta kada mu je to potrebno putem search_code i read_file. Dajte mu kartu, a ne teritorij.
Korak 3: Petlja (Promatraj → Planiraj → Djeluj → Razmisli)
- Promatraj: Započnite popisivanjem direktorija, čitanjem neuspjelog testa, koda koji se testira i zapisnika pogrešaka. Zamolite Claudea da sažme simptome neuspjeha u dvije ili tri točke.
- Planiraj: Neka Claude predloži plan s:
- Datoteke za pregled ili uređivanje
- Minimalni diffovi za pokušaj
- Naredba za testiranje za validaciju
- Djeluj: Primijeni predloženi diff putem write_file. Prikaži diff doslovno. Pokreni testove.
- Razmisli: Vrati stdout/stderr natrag. Pitaj Claudea: nastavi, vrati ili zaustavi? Ako se plan promijeni, zahtijevaj opravdanje u jednoj rečenici pozivajući se na stvarni izlaz.
- Izlaz: Zaustavi kada testovi prođu, ili nakon N iteracija, što god dođe prvo.
Ovo je veličanstveno programiranje u paru gdje zapravo održavate iskrenost uparivanja.
Korak 4: Zaštitne Ograde Koje Spašavaju Vaš Vikend
- Popis dopuštenih pisanja: Dopustite pisanje samo unutar src/, lib/ ili izričito odobrenih putova.
- Ograničenje veličine diffa: Ograničite izmjene na 200–500 redaka po koraku. Ako je veće, podijelite na potkorake.
- Popis dopuštenih naredbi: pokretači testova, linters i nekoliko razvojnih skripti. Zabranite mrežu. Želite ponovljivost, a ne divlji zapad curl.
- Vremensko ograničenje i ponovni pokušaji: Kratka vremenska ograničenja, jedan ponovni pokušaj max—beskrajne petlje ponovnog pokretanja su mjesta gdje agenti umiru.
- Način rada za suho pokretanje: Ispišite predložene diffove, ali nemojte pisati. Izvrsno za pregled koda.
Claude 4.5 pridržavat će se pravila ako ih učinite eksplicitnima. Ako ne, nemojte se iznenaditi kada pokuša “pomoći” reorganizacijom cijelog vašeg repoa kako bi se uskladio s nekim postom na blogu iz 2017.
Korak 5: Memorija Koja Je Zapravo Korisna
Kratkoročna memorija rješava 80% problema. Zadržite:
- Bilježnica za trenutnu hipotezu i plan.
- Popis datoteka dodirnutih u ovoj sesiji.
- Zadnja dva izlaza naredbi.
To je dovoljno da Claude 4.5 razumno rasuđuje. Dugoročna memorija—zapisnici zadataka, ugrađivanja—može biti korisna za ponavljajuće baze koda, ali je smatrajte neobaveznim šećerom. Ako vaš agent ne može popraviti test bez vektorskog indeksa od 500 MB, to nije agent—to je ovisnost.
Minimalni Nacrt Implementacije
U pseudokodnim uvjetima, ovog agenta možete implementirati u nekoliko stotina redaka:
- inicijaliziraj: učitaj metapodatke repoa, ograničenja i klijenta modela
- promatraj: čitaj neuspjele testove, datoteke, zapisnike
- plan = model.predloži_plan(kontekst)
- dok nije gotovo i koraci < MAX:
- diff = model.predloži_zakrpu(plan)
- prikaži(diff); možda odobri
- izlaz = run_cmd(plan.test_cmd)
- razmisli = model.procijeni(izlaz)
- ako razmisli == prođi: gotovo = istina
- inače ako razmisli == vrati: git_revert(zadnji_commit)
- inače: plan = model.revidiraj_plan(izlaz)
Primijetit ćete dijelove koji nedostaju: nema agenata koji upravljaju agentima, nema “delegata,” nema zasebnog “modela planera” i “modela izvršitelja.” Claude 4.5 može dobro obaviti oba posla ako ga ne sabotirate s Rube Goldbergovim aparatom.
Promptanje Koje Se Ne Trudi Previše
Loši promptovi pokušavaju biti pametni. Dobri promptovi su dosadni i specifični. Evo zdravog kostura za vaš glavni blok uputa:
- Cilj: Navedite točan zadatak kodiranja i kriterije uspjeha.
- Kontekst: Struktura projekta, ulazne točke i naredba za testiranje.
- Ograničenja: Popis dopuštenih pisanja, ograničenje veličine diffa, nema mreže.
- Preferencije stila: Verzija jezika, oblikovatelj, pravila linters.
- Proces: Promatraj → Planiraj → Djeluj → Razmisli; prikaži diffove; pokreni testove; ponavljaj do N koraka; zaustavi kada testovi prođu.
Claude 4.5, s ovom strukturom, neće trebati scenarij igranja uloga od 100 redaka. Jednostavno radi.
Praktični Primjer: Popravi Neuspjeli Test
Recimo da test ne uspijeva u tests/time_test.py jer parse_time("09:00") vraća 5400 umjesto 32400. Petlja agenta trebala bi izgledati ovako:
- Promatraj: Pročitaj time.py i time_test.py; pokreni pytest -k parse_time.
- Planiraj: Hipoteza—matematička pogreška sekundi u odnosu na minute; predloži uređivanje parse_time; dodaj jedinični rubni slučaj.
- Djeluj: Zakrpaj parse_time, dodaj test za sate s vodećom nulom; pokreni testove.
- Razmisli: Ako testovi i dalje ne uspijevaju, pročitaj pogrešku, prilagodi matematiku ili regex, ponovno pokreni.
Minimalna uspješna zakrpa može biti promjena od dva retka. To je poanta. Male izmjene, brzi ciklusi, stvarni napredak.
Gdje Lagan Pobjeđuje Sudoper
- Latencija: Jedan model, jedna petlja, bez orkestracijskog preopterećenja.
- Transparentnost: Svaki je korak moguće revidirati. Možete ga razlikovati, možete ga vratiti, možete ga ponovno pokrenuti.
- Kontrola: Zaštitne ograde drže štetu lokalnom. Agent ne može odlutati u vašu infrastrukturu.
- Trošak: Manje poziva, manje konteksta, predvidljivi tokeni.
- UX: Razumijete ga. Vaši ga suigrači razumiju. Vaš budući ja vas neće mrziti.
I kompromisi:
- Širina: Lagan agent za kodiranje neće refaktorirati vaš monolingvalni monorepo u jednom prolazu. Niti bi trebao.
- Inicijativa: Neće izmisliti višestruke tjedne planove. Vi mu dajete zadatke.
- Stanje: Bez velikog memorijskog sloja, zaboravlja daleku povijest prema dizajnu. To je značajka dok ne postane bug.
Idealno Mjesto Claudea 4.5 za Agente za Kodiranje
Claude 4.5 blista u:
- Čitanju i zaključivanju o diffovima i zapisnicima.
- Proizvodnji koherentnih, minimalnih promjena koda.
- Slijeđenju ograničenja i eksplicitnosti o nesigurnosti.
Manje je izvrstan u:
- Pogađanju ponašanja API-ja koje ne može pročitati.
- Teškoj koreografiji alata (ovdje nije potrebno).
- Dugim refaktorima s više datoteka bez ljudskog vođenja koraka.
Ta je zadnja točka važna. Najbolji način da dobijete snažne rezultate nije da agenta učinite većim—već da zadatak učinite manjim. Koristite svoj mozak za određivanje opsega, a Claude 4.5 za izvršenje unutar tog opsega.
Riječ o Integraciji IDE
Oduprite se porivu da ovo ugradite izravno u IDE okno s pedeset prekidača. Petlji temeljena na terminalu s običnim tekstualnim diffovima lakše je vjerovati i otkloniti pogreške. Ako želite šećer za uređivač, neka bude glup:
- Naredbe za pokretanje/zaustavljanje petlje.
- Prikaži diffove u podijeljenom prikazu.
- Prompt za odobrenje za pisanje (neobavezno, ali mudro).
Možete se integrirati kasnije. Prvo, učinite da radi.
Sider.AI, Korišteno Štedljivo, Zapravo Pomaže Ako želite pragmatično okruženje za pokretanje ove vrste petlje bez ponovnog izmišljanja skele, Sider.AISider zapravo funkcionira—barem kada ga koristite za ono za što je dobar. Održava razgovor i diffove urednima, omogućuje vam pokretanje naredbi i ne nameće vam neki grandiozni “autonomni okvir agenta.” Trik je u tome da se pridržavate vlastitih pravila: kratki promptovi, čvrste petlje, vidljivi diffovi. Sider.AISider se miče s puta, što je rjeđe nego što bi trebalo biti. Uobičajene Zamke (i Kako Izbjeći Da Izgledate Glupo)
- Pretrpani kontekst: Ako vaš prompt zvuči kao ucjenjivačko pismo, radite to pogrešno. Dohvatite datoteke na zahtjev.
- Prerano refaktoriranje: Agent predlaže reorganizaciju modula? Neka prvo prođe testove. Refaktorirajte kasnije.
- Halucinirane datoteke: Zahtijevajte list_dir i read_file prije bilo kakvog write_file na novu putanju.
- Beskonačne petlje ponovnog pokretanja: Ograničite korake. Zahtijevajte opravdanje za svaku novu hipotezu.
- Jedan divovski diff: Podijelite promjene. Manji diffovi brže ne uspijevaju i lakše ih je razumno obrazložiti.
Sigurnost i Zaštita Bez Paranoje
- Lokalno izvršavanje: Pokrenite u zaštićenom direktoriju. Nema mreže prema zadanim postavkama.
- Izolacija ovisnosti: Koristite lokalni venv ili spremnik. Pričvrstite verzije.
- Tajne: Agentu nisu potrebne. Ako naredba zahtijeva token, zaustavite se i pitajte.
- Revizija: Zadržite svaki plan, diff i naredbu u zapisniku.
Kako Znati Da Radi
- Vrijeme isporuke se smanjuje: Ispravci pogrešaka koji su trajali sat vremena sada traju deset minuta.
- Manje pogrešaka pri upisivanju: Diffovi postaju manji, testovi postaju zeleniji.
- Vjerujete mu: Prestajete lebdjeti nad svakom radnjom jer vas nije opekao.
- Suigrači ga koriste: Definicija uspjeha je da ga drugi usvoje bez sastanka.
Pažljivo Povećavanje
Ako stvarno morate povećati, učinite to s disciplinom:
- Paralelni potzadatci, a ne paralelni mozgovi: Podijelite posao, pokrenite više laganih petlji u zasebnim direktorijima i spojite kada su zeleni.
- Epizodna memorija, a ne istovar mozga: Pohranite uspješne zakrpe i mapiranja simptoma na popravke. Kirurški dohvatite.
- Povremeni “veći” prolazi: Rezervirajte sesiju s ljudskim vodstvom za refaktore; agent pomaže, ne vodi.
Minimalna Referentna Implementacija (Nacrt)
Python-ish pseudokod za pokretanje:
- def init(self, repo_root, model):
- self.history = [] # zadnja dva diffa i izlazi testa
- "repo": summarize_repo(self.root),
- "constraints": {"write_whitelist": ["src/", "tests/"], "max_diff_lines": 300, "no_network": True},
- "history": self.history[-2:],
- plan = self.model("propose_plan", self.context(task))
- diff = self.model("propose_patch", {"plan": plan})
- out = run_cmd(plan.test_cmd)
- eval = self.model("evaluate", {"output": out, "plan": plan})
- self.history.append({"diff": diff, "out": tail(out)})
Završetak Ljudske Veličine
Industrija stalno obećava autonomne razvojne agente. Ono što nam zapravo treba je iskren pomoćnik koji čita, planira, uređuje, pokreće i zaustavlja. Claude 4.5 je dobar u tome, pod uvjetom da ga ne zakopate pod okvire koji uglavnom postoje da bi opravdali sami sebe. Lagan nije kompromis—to je poanta. Izgradite petlju, dodajte zaštitne ograde i dopustite alatu da učini ono što su alati oduvijek radili kada ih držite jednostavnima: učinite posao manjim.
Zaključak: Dosadan Prečac Koji Pobjeđuje
Evo vašeg popisa za provjeru za laganog agenta za kodiranje s Claudeom 4.5:
- Jedna petlja, jedan model, mali alati.
- Čvrsti kontekst: zadatak, nekoliko datoteka, zadnji izlazi.
- Minimalni diffovi, česti testovi, tvrdi poklopci.
- Lokalno, zaštićeno izvršavanje; nema mreže.
- Neobavezni šećer za uređivač; nikada nije potreban.
Ako zažmirite, izgleda sumnjivo kao dobro softversko inženjerstvo, samo brže. I to je poanta. Najpametnija stvar koju ovdje možete učiniti nije loviti “autonomiju”—već kodificirati disciplinu. Što manje tražite od agenta, to više dobivate.
FAQ
P1:Kako započeti izgradnju laganog agenta za kodiranje s Claudeom 4.5?
Definirajte mali skup alata (čitaj, piši, pretražuj, pokreni), napišite strogi sistemski prompt i implementirajte petlju Promatraj → Planiraj → Djeluj → Razmisli. Održavajte kontekst malim i unosite stvarne zapisnike i diffove—Claude 4.5 najbolje radi kada je zadatak uzak, a povratna informacija konkretna.
P2:Trebam li vektorsku bazu podataka ili memorijski sloj za Claude 4.5 agenta za kodiranje?
Ne. Za većinu zadataka dovoljna je kratkoročna memorija plus search_code. Dodajte dugoročnu memoriju samo ako više puta posjećujete isti repo i možete dokazati da štedi tokene bez da agenta učini glupljim.
P3:Koje su zaštitne ograde bitne za Claude 4.5 agenta za kodiranje?
Popis dopuštenih putanja za pisanje, ograničite veličine diffova, ograničite naredbe i zabilježite svaku radnju. Ova jednostavna ograničenja održavaju agenta predvidljivim i čine povrate dosadnima—na dobar način.
P4:Može li lagan agent podnijeti refaktore s više datoteka?
Da, ako podijelite posao na male korake i održavate petlju čvrstom. Claude 4.5 može upravljati refaktorima, ali vi vodite opseg; inače ćete dobiti jedan divovski, krhki diff koji nećete htjeti pregledati.
P5:Gdje se Sider.AI uklapa s Claude 4.5 agentom za kodiranje?
Sider.AI je koristan kao uredan radni prostor: razgovori, diffovi i naredbe na jednom mjestu, bez forsiranja teškog okvira agenta. Koristite ga za pokretanje svoje petlje, a ne za ponovno izmišljanje.