Ievads: Aģents, ko ikviens vēlas, bez pārlieku popularizācijas
Problēma ar kodēšanas aģentiem ir tā, ka lielākā daļa no tiem mēģina būt jūsu priekšnieks, pilots un terapeits vienlaikus – un laikā aizmirst vienkārši uzrakstīt kodu. Standarta pieeja ir šāda: pievieno duci vektoru krātuves, pārkaisīt ar orķestrācijas burvju putekļiem, pieslēgt pārlūku un darīt kā ir. Tas labi izskatās demonstrācijā, bet sabrūk, tiklīdz viņam piektdienas pēcpusdienā jālabo nestabila integrācijas testa kļūda.
Vieglas kodēšanas aģenta izveide ar Claude 4.5 ir – pārsteigums – patiesībā vienkārša, ja pārstāj mēģināt radīt universālu programmatūras dēlu, bet vienkārši izstrādā instrumentu, kas lasa kodu, plāno, rediģē, izpilda un atkārto. Nekādu runu par “mākslīgā intelekta aizvietošanu izstrādātājus.” Nekādas Rube Goldberga trikus. Tikai kompakts cikls, kas labi izdara acīmredzamās lietas.
Šis ir praktisks ceļvedis, kā to izdarīt, neiesaistot veselu AI operāciju nodaļu. Izmantosim Claude 4.5 kā smadzenes, failu sistēmu un čaulu kā rokas, un nelielu atmiņu īstermiņa fokusa nodrošināšanai. Tikai to. Vieglums nozīmē, ka to vari saprast vienā sēdē, palaist lokāli un uzticēties, jo katru soli var pārskatīt. Ja pēdējā laikā esi lietojis kaut ko šajā jomā, tas ir gandrīz kā dumpis.
Kāpēc Claude 4.5 ir piemērots minimālam aģentam
Claude 4.5 ir tas temperaments, ko vēlies kodēšanai: rūpīgs instrukciju ievērošanā, patīkami labs diffu lasīšanā un neveicina viltus rāmjus, ko neesi prasījis. Modelis ir prasmīgs pakāpeniskā spriešanā, neprasot garu iepriekšēju promptu. Šī savienība — spriešana kopā ar pašpietiekamību — padara to par ideālu kodēšanas aģenta cilpu:
- Novērošana: lasa pašreizējos failus, kļūdu žurnālus un testus.
- Plānošana: iesaka konkrētas izmaiņas ar pamatojumu.
- Darbība: labojumi failos, komandu izpilde.
- Pārdomas: novērtē rezultātu, atkārto vai pārtrauc.
To vari pielietot jebkuram repo un iegūt vērtību pusdienas laikā. Triks ir nepārvērst to par “AI platformu.” Ja aģents ir viegls, Claude 4.5 veic smago darbu bez traucēšanas.
Viegla arhitektūra: piecas daļas, bez drāmas
Šeit ir viss steks, kas vajadzīgs:
- Kods cikls: viens process, kas aicina Claude 4.5 un tulko tā rīku izmantošanas ziņojumus.
- Rīki: mazi – read_file, write_file, list_dir, run_tests (vai run_cmd), search_code.
- Konteksta veidotājs: sastāda īsu, precīzu promptu ar repo metadatiem un nesenām izmaiņām.
- Īstermiņa atmiņa: ritinošais sarunas logs un skaidra piezīmju lapa plānam un ierobežojumiem.
- Drošības barjeras: ierobežojumi tokeniem, laikam un failu rakstīšanai; sausais režīms; atjaunošanas momentuzņēmumi.
Tik vienkārši. Vari palaist to bezvizuāli terminālī vai iepakot minimālā UI, ja vajag. Šī pieeja strādā, jo katra darbība ir pārskatāma un verificējama. Aģents izplāno izmaiņu, rāda diffu, palaida testus, lasa rezultātu un turpina vai apstādina. Nav nekādas mistērijas.
Kā izveidot aģentu (nepazaudējot galveno domu)
1. solis: noteikt līgumu – promptu un rīkus
Tavs aģents ir tik labs kā tā līgums ar modeli. Saglabā sistēmas promptu īsu, stingru un praktisku.
Sistēmas prompts, konspektēts:
- Tu esi kodēšanas aģents. Tava uzdevuma ir veikt mazus, pareizus repo izmaiņas, lai izpildītu lietotāja uzdevumu.
- Domā skaļi slepenā pierakstā; lietotājam rādi tikai plānus un diffus.
- Dod priekšroku minimāliem difiem, strādājošiem testiem un pakāpeniskām izmaiņām.
- Ja neesi drošs, ierosini eksperimentu un palaid to.
- Nekad neizdomā failus vai komandas – vispirms tos uzskaiti un izlasi pirms rediģēšanas.
Rīku shēma (nepārvērtējiet):
- read_file(path, offset?, length?)
- write_file(path, content, create_if_missing=false)
- run_cmd(command, timeout=60, cwd=repo_root)
- search_code(query, path=repo_root, max_results=50)
Papildus noderīgas funkcijas: git_diff un git_revert(sha) ātrai atjaunošanai. Var iztikt bez vektoru krātuves; lielākā daļa uzdevumu balstās uz dažiem failiem darba atmiņā un ātru meklēšanu.
2. solis: uzturi kontekstu mērenu
Kontexta pārslogošana ir aģenta dizaina stila jautājums. Neiesāc visa monorepo ielādi promptā. Tā vietā:
- Repo kopsavilkums: vienas rindkopas README pārskats; ienākošie punkti; testa komanda.
- Aktīvie faili: tikai tie faili, pie kuriem aģents strādā – nolasīt tos pa gabaliem pēc vajadzības.
- Uzdevums: lietotāja mērķis skaidri noformulēts: “Izlabot neizdotos testus FooTest.test_bar tests/foo_test.py.”
- Ierobežojumi: laika limiti, failu rakstīšanas whitelist, stila noteikumi, semantiskās versijas prasības, ja piemērojams.
- Nesenā vēsture: pēdējie divi diffi un to testa rezultāti. Nekas cits.
Claude 4.5 var pats nolasīt papildu kontekstu ar search_code un read_file, ja vajag. Dod tam karti, nevis teritoriju.
3. solis: cikls (Novērošana → Plānošana → Darbība → Pārdomas)
- Novērošana: uzsāc ar direktoriju uzskaiti, izlasi neizdotos testus, kodu un kļūdu žurnālu. Pajautā Claudem, lai divās vai trīs punktu formā apkopotu neveiksmes simptomus.
- Plānošana: ļauj Claudem izstrādāt plānu ar:
- Hipotēzi par kļūmes cēloni
- Failiem, ko pārbaudīt vai labot
- Minimāliem difiem, ko izmēģināt
- Darbība: pielieto ierosināto diffu ar write_file. Rādi diffu burtiski. Izpildi testus.
- Pārdomas: ievadi stdout/stderr atpakaļ modelim. Pajautā Claudem: turpini, atgriez izmaiņas vai apstājies? Ja plāns mainās, pieprasi vienu teikumu pamatojumu ar atsauci uz faktiskajiem datiem.
- Iziet: apstājies, kad testi ir veiksmīgi vai ir izpildīti N soļi, kas pienāk ātrāk.
Tas ir uzaicinājums strādāt kopā ar godīgu pārbaudi.
4. solis: drošības barjeras, kas pasargā brīvdienas
- Rakstīšanas whitelist: atļauj rakstīt tikai src/, lib/ vai skaidri apstiprinātos ceļos.
- Diffraciju limiti: ierobežo rediģējumus līdz 200–500 rindām katrā solī. Ja vairāk – sadali apakšposmos.
- Atļauto komandu saraksts: testa palaišanas skripti, linterni un daži attīstības skripti. Aizliedz tīklu. Vēlies reproducējamību, nevis haotisku curl.
- Laikošana un atkārtojumi: īsi laika limiti, viena pārstarta iespēja – bezgalīgas atkārtojošas cilpas ir aģentu nāve.
- Sausais režīms: izdrukā ierosinātos difus, bet neraksta tos. Lieliski koda pārskatīšanai.
Claude 4.5 ievēros noteikumus, ja tie skaidri pateikti. Ja nē, nesanāk pārsteigties, ja tas sāk “palīdzēt,” pārorientējot visu repo pēc kāda 2017. gada bloga ieraksta.
5. solis: atmiņa, kas tiešām lieti noder
Īstermiņa atmiņa risina 80% problēmu. Glabā:
- Piezīmju lapu pašreizējai hipotēzei un plānam.
- Sarakstu ar failiem, kas rediģēti šajā sesijā.
- Divu pēdējo komandu izvadus.
Tas ir pietiekami, lai Claude 4.5 saprastu kontekstu. Ilgtermiņa atmiņa – uzdevumu žurnāli, iebūvēšana – var palīdzēt atkārtotos projektos, bet to drīkst uzskatīt par papildus iespēju. Ja aģents nevar izlabot testu bez 500 MB liela vektoru indeksa, tas nav aģents – tas ir atkarīgums.
Minimālais īstenojuma skice
Pseido-kodā šo var ieprogrammēt dažos simtos rindu:
- inicializē: ielādē repo metadatus, ierobežojumus un modeļa klientu
- novēro: izlasa neizdotos testus, failus, žurnālus
- plāns = modelis.ierosina_plānu(konteksts)
- kamēr neizpildīts un soļi < MAKS:
- diffs = modelis.ierosina_labojumu(plāns)
- rādi(diff); varbūt apstiprini
- rezultāts = run_cmd(plāns.testa_komanda)
- vērtējums = modelis.izvērtē(rezultāts)
- ja vērtējums == izpildīts: izpildīts = patiesi
- cita ja vērtējums == atcelšana: git_revert(pēdējais_commit)
- cita: plāns = modelis.koriģē_plānu(rezultāts)
Pamanīsi, ka nav atsevišķu aģentu, nav “delegātu,” nav atsevišķa “plānotāja modeļa” un “izpildītāja modeļa.” Claude 4.5 var veikt abus darbus labi, ja to nesabojā ar Rube Goldberga aparātu.
Promptēšana, kas nenopūlas pārāk daudz
Sliktas promptes mēģina būt asprātīgas. Labas ir vienkāršas un specifiskas. Šeit ir saprātīgs pamats galvenajam instrukciju blokam:
- Mērķis: precīzi norādi kodēšanas uzdevumu un panākumu kritērijus.
- Kontexts: Projekta struktūra, ienākošie punkti un testa komanda.
- Ierobežojumi: rakstīšanas whitelist, diffa lieluma limits, aizliegums tīklam.
- Stila preference: valodas versija, formatētājs, lintera noteikumi.
- Procesa apraksts: Novēro → Plāno → Dari → Pārdomā; parādi difus; palaid testus; atkārto līdz N reizēm; apstājies, kad testi izdodas.
Ar šo struktūru Claude 4.5 bez problēmām izpildīs uzdevumu bez 100 rindu liela lomādas.
Praktisks piemērs: neizdodies tests
Pieņemsim, ka tests tests/time_test.py neizdodas, jo parse_time("09:00") atgriež 5400 nevis 32400. Aģenta cilpa varētu izskatīties šādi:
- Novēro: izlasi time.py un time_test.py; pavadi pytest -k parse_time.
- Plāno: hipotēze – sekundes un minūtes matemātikas kļūda; ierosini rediģēt parse_time; pievieno vienības edge gadījuma testu.
- Dari: labojumprojekts parse_time, pievieno testu ar priekšā esošu nulli stundām; palaid testus.
- Pārdomā: ja testi joprojām neizdodas, izlasi kļūdu, koriģē matemātiku vai regex, palaid atkārtoti.
Minimālais veiksmīgais labojums var būt tikai divas koda rindas. Tieši tas ir mērķis. Mazas izmaiņas, ātras ciklas, reāli panākumi.
Kur vieglums pārspēj pārējo
- Latentums: viens modelis, viena cilpa, nav orķestrācijas režijas.
- Caurspīdīgums: katru darbību var auditēt. Vari salīdzināt, atgriezt, palaist atkārtoti.
- Kontrole: drošības barjeras ierobežo bojājumus lokāli. Aģents nevar aizrasties tavu infrastruktūru.
- Izmaksas: mazāk aicinājumu, mazāks konteksts, prognozējami tokeni.
- UX: Tu saproti to. Tavi kolēģi saprot to. Tavs nākotnes es neienīdēs tevi.
Un kompromisi:
- Platums: viegls kodēšanas aģents neizrefaktorēs tavu piecu valodu monorepo vienā piegājienā. Un tam nevajag.
- Iniciatīva: tas neradīs daudznedēļu ceļkartes. Tu dod tam uzdevumus.
- Stāvokļa saglabāšana: bez plašas atmiņas tā pēc dizaina aizmirst tālu vēsturi. Tas ir pluss, kamēr nav mīnuss.
Claude 4.5 saldā vieta kodēšanas aģentiem
Claude 4.5 īpaši labi darbojas:
- Lasot un spriežot par diffiem un žurnāliem.
- Radot konsekventas, minimālas koda izmaiņas.
- Ievērojot ierobežojumus un skaidri izsakot nenoteiktību.
Tas ir mazāk labs:
- Minot API darbību, ko nespēj izlasīt.
- Smagas rīku orķestrācijas (šeit tas nav vajadzīgs).
- Ilgstošas daudzfailu refaktoringas bez cilvēka virzības.
Šī pēdējā norāde ir svarīga. Labākais veids, kā sasniegt labus rezultātus, nav aģenta palielināšana, bet uzdevuma sašaurināšana. Izmanto smadzenes apjomam, un Claude 4.5 izpildē ietvarā.
Vārds IDE integrācijā
Nepadosies kārdinājumam iecept šo tieši IDE logā ar piecdesmit pārslēgiem. Termināla cilpa ar vienkāršiem diffiem ir vieglāk uzticama un labojama. Ja vajag redaktora pārklājumu, turies vienkārši:
- Komandas cilpas sākšanai/apturēšanai.
- Apstiprināšanas prompte rakstiem (neobligāti, bet gudri).
To vēlāk integrēsi. Vispirms padari to strādājošu.
Sider.AI – lietots saprātīgi, patiešām palīdz Ja vēlies pragmatisku vidi šādas cilpas veikšanai, nenozīmējot visu sistēmu no jauna, Sider.AI patiešām darbojas – vismaz, ja to izmanto tam, kam tas ir radīts. Tas uztur sarunas un diffus kārtībā, ļauj palaist komandas un neuzspiests milzīgu “autonomu aģentu ietvaru.” Triks ir turēt savus noteikumus: īsi prompti, ciešas cilpas, redzami diffi. Sider neiejaucas, kas ir retums. Biežas kļūdas (un kā izskatīties gudram)
- Pārslogots konteksts: ja tavs prompts izskatās kā izpirkuma piezīme, dari nepareizi. Iegūsti failus pēc vajadzības.
- Priekšlaicīga refaktorēšana: aģents iesaka pārkārtot moduļus? Vispirms padari testus izpildāmus. Refaktorē vēlāk.
- Izdomāti faili: pieprasi list_dir un read_file pirms rakstīšanas uz jaunām vietām.
- Bezgalīgas atkārtošanas cilpas: ierobežo soļus. Pieprasi pamatojumu katrai jaunai hipotēzei.
- Viens milzīgs diffs: sadali labojumus mazākos gabalos. Mazāki difi ātrāk izgāžas un ir vieglāk saprotami.
Drošība un aizsardzība bez paranojas
- Lokāla izpilde: darba mape ar smilšu kastīti. Tīkls pēc noklusējuma aizliegts.
- Atkarību izolācija: izmanto vietējo virtuālo vidi vai konteineru. Fiksē versijas.
- Slepenības: aģentam tās nav vajadzīgas. Ja kāda komanda prasa tokenu – apstājies un jautā.
- Audits: glabā katru plānu, diffu un komandu žurnālā.
Kā zināt, ka tas strādā
- Laiks līdz rezultātam samazinās: kļūdu labojumi, kas iepriekš prasīja stundas, tagad 10 minūtes.
- Mazāk nevietā veikto kļūdu: difi kļūst mazāki, testi kļūst zaļāki.
- Uzticies tam: pārstāj sejot katrai darbībai, jo tas nav kļūdījies.
- Kolēģi to izmanto: panākums ir, ja citi pieņem to bez sapulcēm.
Mērošanas palielināšana, uzmanīgi
Ja tiešām vajag mērogot, dari to disciplinēti:
- Paralēli apakšuzdevumi, nevis paralēlas smadzenes: sadali darbu, palaiž vairākas vieglas cilpas atsevišķās mapēs un sapludini, kad viss veiksmīgs.
- Episodiska atmiņa, nevis visa smadzeņu izgāšana: glabā veiksmīgos izlabošanas ierakstus un simptomus. Atrodi precīzi vajadzīgo.
- Periodiskas "lielākas" sesijas: atstāj cilvēkam refaktorēšanu; aģents asistē, nevada.
Minimāls atsauces īstenojuma skice
Python-s līdzīgs pseido-kods, lai sāktu darbu:
- def init(self, repo_root, model):
- self.history = [] # pēdējie divi diffi un testa iznākumi
- "repo": summarize_repo(self.root),
- "constraints": {"write_whitelist": ["src/", "tests/"], "max_diff_lines": 300, "no_network": True},
- "history": self.history[-2:],
- plan = self.model("propose_plan", self.context(task))
- diff = self.model("propose_patch", {"plan": plan})
- out = run_cmd(plan.test_cmd)
- eval = self.model("evaluate", {"output": out, "plan": plan})
- self.history.append({"diff": diff, "out": tail(out)})
Cilvēkam saprotams noslēgums
Industrija solās radīt autonomus izstrādātāju aģentus. Faktiski mums vajag godīgu asistentu, kas lasa, plāno, rediģē, izpilda un apstājas. Claude 4.5 to dara labi, ja vien to nepārslogo ar frameworkiem, kas galvenokārt eksistē paši sev. Vieglums nav kompromiss – tas ir mērķis. Izveido cilpu, pievieno drošības barjeras un ļauj rīkam darīt to, ko rīki vienmēr darījuši, kad tos tur vienkāršus: samazināt darbu.
Secinājums: garlaicīgais īsinājumceļš, kas uzvar
Šeit ir tava kontrolsaraksts vieglam kodēšanas aģentam ar Claude 4.5:
- Viena cilpa, viens modelis, mazi rīki.
- Šaurs konteksts: uzdevums, daži faili, pēdējie rezultāti.
- Minimāli diffi, bieži testi, stingri limiti.
- Lokāla, smilšu kastes izpilde; bez tīkla.
- Neobligāts redaktora pārklājums; nekad obligāts.
Ja ielūkojies, tas izskatās aizdomīgi kā laba programmatūras inženierija, tikai ātrāk. Un tāds ir iznākums. Visgudrākais, ko šeit darīt, nav sekot “autonomijai” – bet ieviest disciplīnu. Jo mazāk tu prasi no aģenta, jo vairāk saņem.
BUJ
J1: Kā sākt veidot vieglu kodēšanas aģentu ar Claude 4.5?
Definē mazu rīku kopumu (lasīt, rakstīt, meklēt, palaist), uzraksti stingru sistēmas promptu un īsteno Novērošana → Plānošana → Darbība → Pārdomas ciklu. Turies pie neliela konteksta un baro reālus žurnālus un difus – Claude 4.5 vislabāk strādā šauram uzdevumam ar konkrētu atgriezenisko saiti.
J2: Vai Claude 4.5 kodēšanas aģentam vajag vektoru datubāzi vai atmiņas slāni?
Nē. Lielākajai daļai uzdevumu īstermiņa atmiņa plus search_code ir pietiekami. Pievieno ilgtermiņa atmiņu tikai tad, ja atkārtoti strādā ar to pašu repo un vari pierādīt, ka tas samazina tokenu patēriņu, nekaitējot aģenta spējām.
J3: Kādas drošības barjeras ir būtiskas Claude 4.5 kodēšanas aģentam?
Atļauto ceļu whitelist, diffa lieluma ierobežojums, komandu ierobežojumi un visas darbības žurnāls. Šie vienkāršie ierobežojumi padara aģentu paredzamu un atjaunošanu garlaicīgu – un tas ir labi.
J4: Vai viegls aģents spēj apstrādāt daudzfailu refaktorēšanu?
Jā, ja sadali darbu mazākos soļos un turpini ciešu cilpu. Claude 4.5 var vadīt refaktorēšanu, bet tu norādi apjomu; pretējā gadījumā saņemsi vienu milzīgu, trauslu diffu, ko nevēlēsies pārskatīt.
J5: Kā Sider.AI iederas Claude 4.5 kodēšanas aģentā?
Sider.AI ir noderīga kā kārtīga darba vide: sarunas, diffi un komandas vienuviet, bez smagas aģentu sistēmas. Izmanto to ciļpas vadīšanai, nevis šūnu izgudrošanai no jauna.