ആമുഖം: എല്ലാവരും ആഗ്രഹിക്കുന്ന ഏജന്റ്, ഹിപ്സിനൊപ്പം De-അധിവാസം
കോഡിംഗ് ഏജന്റുമാരായ അധികവും നിങ്ങളുടെ മേലാളിയാകും, സഹപാഠി, നിങ്ങളുടെ മനശ്ശാസ്ത്രജ്ഞനാകും—അതിനാൽ അവർ കേൾക്കുന്നതും മറക്കുന്നു. കളിപ്പങ്കത്തിൽ ഇത്こう: ഒട്ടേറെ വക്ടർ സ്റ്റോറുകൾ ചേർക്കുക, ചില ഓർക്കസ്ട്രേഷൻ പിക്സി പൊടി ഇരുതലേക്ക് കൊടുക്കുക, ഒരു ബ്രൗസർക്ക് ഉറപ്പായി കൂട്ടുക, അങ്ങനെ ദിവസം വിളിക്കുക. ഇത് ഡെമോകൾക്ക് അംഗീകരിക്കുന്നതുപോലെ പ്രവർത്തിക്കുന്നു. ഇത് വെള്ളിയാഴ്ച 4:52 PM ന് ഒരു പ്രതിഫലനമായ ടെസ്റ്റ് പരിഹരിക്കാൻ നിങ്ങൾ ചോദിക്കുന്നപ്പോൾ ഇടക്കിടയ്ക്ക് തകർന്നുപോകുന്നു.
Claude 4.5 ഉപയോഗിച്ച് ഒരു ലെയ്റ്റ്വെയ്റ്റ് കോഡിംഗ് ഏജന്റ് നിർമ്മിക്കുന്നത്—അഭിനവ്—വാസ്തവത്തിൽ തടസ്സമില്ലാത്തതാണ്, നിങ്ങൾ ഒരു സർവകാല സോഫ്റ്റ്വെയർ ബട്ട്ലറിന്റെ സ്വപ്നം പിന്തുടരാൻ നിൽക്കുമ്പോൾ. ഒരു ഉപാധി നിർമ്മിക്കുക, സൃഷ്ടിക്കുക, പ്രവർത്തിക്കുക, എഡിറ്റുചെയ്യുക, പ്രവർത്തിക്കുക, ആവർത്തിക്കുക. "AI ഡെവലപേഴ്സിന് പകരം" എന്ന പ്രസംഗം ഇല്ല. ആർബ് ഗോൾഡ്ബർഗ് പൈപ്പ്ലൈൻ ഇല്ല. ഉടൻ നന്നാക്കിയ കാര്യങ്ങൾ ചെയ്യുന്നതിനുള്ള സമൃദ്ധമായ മികച്ച സേവനം.
ഈസ്ഥലത്ത് ഒരു AI ഓപ്പറേഷൻ വിഭാഗത്തെനീക്കി ഇല്ലാതെ അവിടേക്കെത്താനായി ഒരു രീതി ഗൈഡ് ആണ്. ഞങ്ങൾ Claude 4.5 നെ നട്ടുമുല്ലാൻ, ഫയൽ സിസ്റ്റവും ഷെല്ലും കൈമുഴങ്ങി, ചെറിയതും കുറിയുമുള്ള മെമ്മറിയും ഉപയോഗിക്കും. ഇതു മാത്രമേ. ലെയ്റ്റ്വെയ്റ്റ് എന്നത് നിങ്ങൾക്ക് ഒരുചക്രത്തിൽ മനസ്സിലാക്കാൻ കഴിയും, അതിനെ স্থানীয়മായി പ്രവർത്തിപ്പിക്കാൻ കഴിയും, അത് പ്രോത്സാഹിപ്പിക്കുന്നത് കാരണം എല്ലാത്തരം വിലയിരുത്താമെന്ന് വിശ്വസിക്കാൻ കഴിയും. നിങ്ങൾ ഈ സ്ഥലത്ത് ഇക്കഴിഞ്ഞാൽ, ഇത് ഏറിയവണ്ണം ദ്രവ്യമായതാണ്.
എന്തിൽ Claude 4.5 ഒരു ലെയ്റ്റ്വെയ്റ്റ് ഏജന്റിന് ഉപയോഗിക്കുന്നു
എനിക്ക് നിങ്ങളുടെ കോഡുമായി Claude 4.5 യുടെ സ്വഭാവം ഇവിടെ തന്നെ ലഭ്യമാണെന്ന് ഞാൻ അസാധാരണമായി വിശ്വസിക്കുന്നു: നിർദ്ദേശങ്ങൾ പാലിക്കുന്നതിൽ നിർദ്ദോഷമായിരിക്കുക, ദ്രവ്യങ്ങൾ വായിച്ചുകൊണ്ടിരിക്കുക, നിങ്ങൾ അഭ്യർത്ഥിച്ച ഫ്രെയിംവർക്കുകൾക്കായുള്ള തീർച്ചക്കുറവുകളും, നിലകൾക്ക് അധിക തിരക്കുള്ളതും കാണാം. ഈ മോഡൽ അഖിൽ പ്രൊംപ്റ്റ് നോവൽ തരും കൂടാതെ നടപ്പിലാക്കലിന്റെ അന്തം അസാധാരണമായും വ്യക്തമാക്കാനുള്ള കഴിവുണ്ട്. ഈ സംയോജനം—വിവേചനവും നിയന്ത്രണമുണ്ടാകുന്നു—മുഖം തൂക്കുന്നതിന് Claude 4.5 ൽ സംവരണം ചെയ്യുന്നതിന് അനുയോജ്യമാണ്:
- നിഗമനം: നിലവിലുള്ള ഫയലുകൾ, പിശക് ലോഗുകൾ, പരീക്ഷണങ്ങൾ വായിക്കുക.
- ശ്രദ്ധിക്കുക: ഉപാധികൾ കൊണ്ടുവരുക, പ്രധാന മാറ്റം നിർദ്ദേശിക്കുക.
- പ്രവർത്തിക്കുക: ഫയലുകൾ പച്ചക്കുന്നിക്ഷണം, ഓർമ്മ പാടിക്കൽ.
- അവലോകനം: ഔട്ട്പുട്ട് വിലയിരുത്തുക, ആവർത്തിക്കുക അല്ലെങ്കിൽ നിർത്തുക.
ഈ ഏജന്റ് കൈമണിയിക്കാൻ താങ്കളുടെ ഒരു(repo) ഫ്രെയിംവർക്കുമായി ചേർക്കാം, ഒരു വൈകുപക്ഷം വ്യത്യാസം കാണുന്നത്. അതിന്റെ പ്രവർത്തനതീവ്രതയെ തടയാൻ നിങ്ങൾ ആകാംക്ഷയിൽ നിന്ന് വിടാവേണ്ട, Claude 4.5 ഇങ്ങനെ തെടുക്കും.
ലെയ്റ്റ്വെയ്റ്റ് ആർക്കിടെക്ചർ: അഞ്ച് അന്തസ്സുകളോടെ, പ്രശ്നമില്ലാതെ
നിങ്ങളുടെ ആവശ്യത്തിന് തലച്ചോറായ്മക്ക് ഇത് മുഴുവൻ ഉണ്ടാക്കുന്നു:
- മൂലധനം: Claude 4.5 നെ വിളിച്ച് അതിന്റെ ഉപദേഷ്ടാവ് സന്ദേശങ്ങൾ വ്യാഖ്യാനിക്കുന്ന ഒരു പ്രക്രിയ.
- ഉപകരണം: ഒരു ചെറു സമുച്ചയം—read_file, write_file, list_dir, run_tests (അല്ലെങ്കിൽ run_cmd), search_code.
- സന്ദർഭം നിർമ്മാതാവ്: പരിചയമുണ്ടാക്കുക, കൂടിയ ഉപേക്ഷിച്ച പ്രാപ്തികൾ കൊഫി അയക്കുക.
- എന്നുമില്ലാത്ത ഓർമ്മ: ഒരു വീണ്ടുമുള്ള സംവാദം കൃത്യമായ കോൺസ്ട്രൈൻറെ ഒരു വിശദീകരണം.
- രക്ഷണവേള: ടോക്കൺ, സമയം, ഫയൽ എഴുതുന്ന പരിധികൾ; ഒരു ഡ്രൈ-റൺ മോഡ്; അനുകൂലങ്ങൾ പേവിദ്യപ്പെടുക.
ഓരോ നടപടിയും നിരീക്ഷിക്കാൻ കഴിയും എന്നതാണ്. ഏജന്റ് ഒരു മാറ്റം നിർദ്ദേശിക്കുന്നു, വ്യത്യാസം കാണിച്ച്, പരീക്ഷണങ്ങൾ നടത്തി, ഔട്ട്പുട്ട് വായിക്കുന്നു, തുടരെക്കണ്ടു പോകുന്നില്ല.
ഏജന്റ് നിർമ്മിക്കുന്നതുമാത്രമല്ല, મેં ഈ പ്രക്രിയയെ നഷ്ടപ്പെടുത്താതെ.
പടിയാരം: കരാർ നിർവ്വചിക്കുക—പ്രൊംപ്റ്റ്, ഉപകരണം
നിങ്ങളുടെ ഏജന്റ് മോഡലിന്റെ കരാറിലേക്ക് എത്രയും നല്ലതുവരെ ആണ്. സിസ്റ്റം പ്രൊംപ്റ്റ് ചെറിയ, കർശനമായ, ഉപകാരപ്രദമായിരിക്കണം.
സിസ്റ്റം പ്രൊംപ്റ്റ്, അകത്താക്കി:
- നിങ്ങൾ ഒരു കോഡിംഗ് ഏജന്റ് ആകുന്നു. നിങ്ങളുടെ ജോലി ഒരു ഉപഭോക്താവിന്റെ പ്രവർത്തനം തൃപ്തിപ്പെടുത്തുന്നതിന് ചെറിയ, ശരിയായ മാറ്റങ്ങൾ repo-യിലെ നിർമ്മിക്കുക.
- ഒരു മറവു scratchpad ൽ ആലോചനയ്ക്കായി; ഉപയോക്താവിനു വെറും പദ്ധതികളും വ്യത്യാസങ്ങളുമാണു പുറത്താക്കുക.
- കുറഞ്ഞ വ്യത്യാസങ്ങൾ, പ്രവർത്തനപരീക്ഷണങ്ങൾ, അഞ്ച് ഉണ്ടായോണം മെച്ചപ്പെടുത്തൽ കേൾപ്പ് ഇൻ നിയമമുണ്ടാകും.
- ശ്രദ്ധയ്ക്കു വിട്ടാൽ, ഒരു പരീക്ഷണം നിർദ്ദേശിക്കണം.
- ഫയലുകൾ അല്ലെങ്കിൽ കമാൻഡുകൾ ഉണ്ടാക്കാൻ ഇല്ല—മാറ്റങ്ങൾ ചെയ്യുന്നതിന് മുൻപ് പട്ടികയും വായിക്കുക.
ഓപ്പ് സ്കീമ (അതിനെ അതിർത്തിയില്ല):
- read_file(path, offset?, length?)
- write_file(path, content, create_if_missing=false)
- run_cmd(command, timeout=60, cwd=repo_root)
- search_code(query, path=repo_root, max_results=50)
ഐച്ഛികമായ വിവിധനിറങ്ങൾ: git_diff, git_revert(sha) നിങ്ങൾക്ക് കൈയ്യിലുള്ള സ്റ്റഞ്ഞത്രങ്ങൾ സാധിക്കണം. നിങ്ങളുടെ സമാനമായ പ്രവർത്തനങ്ങൾ കൂടുതൽ ഗംഭീരമായ ഫയലുകൾക്കായുള്ളതാണ്.
പടി 2: സാഹചര്യത്തെ കുറച്ചു സുഖത്തെ കൈപ്പിടിക്കുന്നു
സന്ദർഭം പൂരിപ്പിക്കൽ ഏജന്റ് രൂപകല്പനയിലെ കാറോ കൾക്കായുള്ളതാ.
- പ്രീ്റെക്കുകൾ: ഒരു പാരഗ്രാഫ് README ചുരുക്കം; പ്രവേശന ബിന്ദുക്കൾ;പരീക്ഷണ ചക്രണ പദ്ധതിയ.
- സജീവമായ ഫയലുകൾ: ഏജന്റ് സ്പർശിക്കാൻ പണിയുന്ന ഫയലുകൾ - ആവശ്യത്തിനു വകവരുത്തുക.
- പ്രവൃത്തി: ഉപയോക്താക്കളുടെ ലക്ഷ്യം, സൂക്ഷ്മമായ ഒരു രീതിയിൽ: "tests/foo_test.py" ൽ ഫെയ്ലിങ് ടെസ്റ്റ് FooTest.test_bar നല്കുക.
- ആവശ്യമായ നിയന്ത്രണങ്ങൾ: പ്രവർത്തനപരിമിതികൾ, ഫയൽ എഴുതുന്ന വൈറ്റ്ലിസ്റ്റ്, ശൈലി നിയമങ്ങൾ, നൽകിയാൽ അർത്ഥപരമായ വര്ഷണങ്ങൾ.
- നിന്നിടത്തേക്ക് ചരിത്രം: അവസാന രണ്ട് വ്യത്യാസവും അവരുടെ പരീക്ഷണ ഫലങ്ങളും. മറ്റുപോലെയില്ല.
Claude 4.5 ആവശ്യമായ പരീക്ഷണം നേടാൻ search_code, read_file എന്നിവക്കായുള്ള കഴിവുണ്ട്. യാത്രയിഴക്കുമാത്രം കോർ.
പടി 3: ലൂപ്പ് (നിഗമനം → പദ്ധതി → പ്രവർത്തിക്കുക → അവലോകനം)
- നിഗമനം: ഡയറക്ടറികളുടെ പട്ടികയെ ചാരം വായിക്കേണ്ടതും, പിശക് ലോഗും, പരീക്ഷണിയും വായിക്കുക. Claude നെ FAILURE ലക്ഷണങ്ങൾ രണ്ടോ മൂന്നോ ബുള്ളറ്റുകളിൽ കുറുക്കാൻ അഭ്യർത്ഥിക്കുക.
- പദ്ധതി: Claude ഒരു പദ്ധതിക്ക് മുൻകൂറായിരിക്കും:
- നിങ്ങൾക്കു വ്യതിയാനമെന്നെ പരിശോധിക്കുന്ന ഫയലുകൾ
- നിങ്ങൾക്ക് ശ്രമിക്കേണ്ട നിരന്തര വ്യതിന്യാസങ്ങൾ
- മൂലകമുണ്ടായ ടെസ്റ്റ് കമാൻഡ്
- പ്രവർത്തിക്കുക: write_file വഴി നിർദ്ദേശിച്ച വ്യത്യാസങ്ങൾ പ്രപിച്ചു. വ്യത്യാസം വാചല്യശേഷിക്കിടുന്നു. പരീക്ഷണങ്ങൾ നടത്തി.
- അവലോകനം: stdout/stderr തിരിച്ചുനൽകുക. Claude സപ്പോർട്ട് പ്രവർത്തനം, പുൽവരിയിൽ അല്ലെങ്കിൽ നിർത്തുക? പദ്ധതി മാറ്റാൻ, ജോഡിച്ചിരിക്കുന്ന വാചകത്തിന്റെ തികഞ്ഞ കാര്യങ്ങളിലേക്കു കാണുക.
- വെള്ളം: അല്ലെങ്കിൽ N ഘടനകൾ കഴിഞ്ഞാൽ, എങ്കിൽ ഇതിനു മുന്നിൽ മത്സരിക്കുക.
ഈ പെയർ പ്രോഗ്രാമിംഗിൽ ഒരു പെയർ പ്രതീക്ഷിക്കുന്നത്.
പടങ്ങുകൾ നിങ്ങളെ രക്ഷിച്ചിരിക്കുന്നു.
- വഴിയിൽ വയ്ക്കുക: src/, lib/, അല്ലെങ്കിൽ വ്യക്തമായി അംഗീകൃത വഴികളിൽ മാറ്റങ്ങൾ അനുവദിക്കുന്നു.
- വ്യത്യാസത്തിന്റെ വലിപ്പവും പരിധികളും: 200-500 വരെയുള്ള വരികളിൽ വീഴ്ച ചെയ്യുക.
- കമാൻഡ് അനുവദനീയത: പരീക്ഷണങ്ങൾ, ലിൻ്ററുകൾ, ഏതാനും ഡെവിലേക്ക് സ്ക്ക്രിപ്റ്റുകൾ. ശൃംഖല നിരോധിക്കുക. നിങ്ങൾ ഫെലിഞ്ഞ എതർ ഉണ്ടാകേണ്ടതാണ്.
- ടൈമൌട്ട് പരിധിയും പുനരാസക്തികൾ: ക്ഷണിച്ച സമയം, ഒരു മുടക്കുക—നെഞ്ചർ പുനരാധിപത്യത്തിലേക്ക് അവതരണം പോർത്ത കഥാപാത്രീകരിക്കുന്നു.
- ഡ്രൈ റൺ മോഡ്: നിർബന്ധിത വ്യത്യാസങ്ങൾ പ്രിന്റ് ചെയ്യുക, പക്ഷേ എഴുതരുത്. കോഡ് റിവ്യുവിന് മികച്ചത്.
Claude 4.5 ലെ വ്യക്ഷാനങ്ങൾ ഉറപ്പിക്കും.
പടി 5: യഥാർത്ഥ പ്രയോജനങ്ങൾ.
അവസാനത്തിലേക്ക് എത്താനുള്ള ഓരോ ഫസ്മയോ ചെന്നാൽ 80% പ്രശ്നങ്ങൾ അല്പത്തിൽ.
- ഒരു scratchpad ഹ്യുപോസിസിന്റെ നിലവിലേയ്ക്ക്.
- ന്മാം ശരിച്ച ഒരു ആവശ്യകമായ വൌശ്ചിലേക്ക്.
- ചുകളിക്കുന്ന രണ്ട് കമാൻഡ് ഔട്ട്പുട്ടുകൾ.
Claude 4.5 അന്വേഷണം സംഭാഷണമായി കരുതുന്നതിന്റെ പ്രതീക്ഷയിൽ യാഥാർത്ഥമാണ് അത്. സ്ഥിരമുള്ളമെങ്ങളായി ശേഷം അത് നഷ്ടമാക്കുന്നത്.
മിനിമൽ സംവിധാന സ്കെച്ച്
പ്സാനിലെയിൽ നിങ്ങളുടെ ഏജൻറ് ഇതിനകം ഒരുപാട് റെർമകൾ നിലനിർത്തുവാൻ നിങ്ങൾക്കാകും:
- init: repo മെറ്റാടാറ്റ, നിയന്ത്രണങ്ങളും മോഡൽ ക്ലയന്റും ലോഡ് ചെയ്തു
- observe: പ്പിശക് പരിശോധന; ഫയലുകൾ, ലോഗുകൾ
- പദ്ധതി = മോഡൽ.propose_plan(സന്ദർഭം)
- അല്ലാതെല്ല മറ്റ് കിട്ടിയും വിട്ടതിനു MAX :
- diff = മെറ്റോഡ്.propose_patch(പദ്ധതി)
- പ്രദർശിപ്പിക്കുക (വ്യത്യാസം); മേല്യാജ്യം നൽകുകയോ
- out = run_cmd(plan.test_cmd)
- reflect = model.evaluate(out)
- നിങ്ങളുടെ ജോലി ഉണ്ടാക്കുക true
- ആകെ ആക്കുന്നതിനു പോവുക:last_commit)
- ആയിരം മാറ്റങ്ങൾ മുതൽ: പദ്ധതി =model.revise_plan(out)
നിങ്ങളുടെ ശ്രദ്ധയിൽ വരുന്നത് തെറ്ററ്റുകളുടെ ഭാഗങ്ങൾ നിങ്ങൾ ദുരിതത്തിലേക്കൊന്ന് ചെയ്യുക, മറ്റ് `` ഏജൻറ്'' പലക്ഷണങ്ങളും ഇല്ല, അല്ലെങ്കിൽ ഒരു 'മൂലക'' മോഡൽപ്പം, Claude 4.5 ഓരോരുത്തൻ വഴകളും അച്ഛപ്പെടുന്നുവേല്ക്കൊള്ളട്ടില്ല.
പ്രോമ്പ്റ്റിംഗ് ശ്രമിക്കുന്നതിൽ ഏറെ പ്രയാസമില്ല.
ചെറിയ പ്രോമ്പ്റ്റുകളുടെ