What is the best way to prompt Grok 4 for a code review?

Use a structured prompt that defines role, goals, constraints, environment, and acceptance criteria. Ask for critique, minimal diffs, a final refactor, tests, and a brief trade-off analysis.

How can I get accurate refactor suggestions from Grok 4?

Provide clear intent (e.g., readability or performance), include context like interfaces and constraints, and request option sets with pros and cons. Enforce non-functional requirements and ask for a self-check.

Should I paste the whole repository into Grok 4?

No. Share the smallest reproducible code with relevant interfaces and constraints. Keep prompts focused and iterate by feeding back test failures and benchmarks.

How do I prevent Grok 4 from changing public APIs during refactors?

State explicit constraints such as “do not change public API,” provide example inputs/outputs, and ask the model to confirm compliance with a self-check before returning code.

Can Grok 4 suggest tests and benchmarks?

Yes. Ask it to include unit tests, property-based tests, and a small benchmark harness. Specify the testing framework and runtime to keep suggestions runnable.

วิธีการใช้ Prompt กับ Grok 4 เพื่อการรีวิวโค้ดและการแนะนำการปรับปรุงโค้ดที่แม่นยำ

คุณไม่จำเป็นต้องมีคอมเมนต์เพิ่มขึ้น สิ่งที่คุณต้องการคือ prompt ที่ดีกว่า ความแตกต่างระหว่างการรีวิวโค้ดด้วย AI แบบธรรมดากับการรีวิวที่เฉียบคม มักจะอยู่ที่วิธีการถามของคุณ

ในคู่มือเชิงปฏิบัติสำหรับนักพัฒนาเป็นอันดับแรกนี้ เราจะแนะนำวิธีการใช้ prompt กับ Grok 4 เพื่อการรีวิวโค้ดและการแนะนำการปรับปรุงโค้ดที่แม่นยำ เราจะครอบคลุมเทมเพลต prompt ในโลกแห่งความเป็นจริง ข้อผิดพลาดทั่วไป และกลยุทธ์ขั้นสูงที่ช่วยให้ Grok 4 พิจารณาบริบท สถาปัตยกรรม ประสิทธิภาพ และความสามารถในการบำรุงรักษา เพื่อให้ได้ผลลัพธ์ที่คุณสามารถนำไปใช้ได้จริง

เพื่อให้สามารถนำไปปฏิบัติได้จริง เราจะใช้โครงสร้างที่นำโดยคำถาม:

Prompt สำหรับการรีวิวโค้ดด้วย AI ที่ดีมีลักษณะอย่างไร?

คุณจะป้อนบริบทที่ถูกต้องให้กับ Grok 4 ได้อย่างไรโดยไม่ทำให้มันล้น?

รูปแบบ prompt ใดที่ให้คำแนะนำในการปรับปรุงโค้ดที่ดีที่สุด?

คุณจะทำให้ Grok 4 อธิบายข้อดีข้อเสีย ไม่ใช่แค่เขียนโค้ดใหม่ได้อย่างไร?

วิธีที่เร็วที่สุดในการปรับปรุงผลลัพธ์ AI ให้ "พร้อมใช้งานจริง" คืออะไร?

ตลอดเส้นทาง คุณจะได้รับสูตร prompt ตัวอย่าง และรายการตรวจสอบที่คุณสามารถคัดลอกและวางเพื่อปรับใช้กับ stack ของคุณได้

เหตุใด Grok 4 จึงต้องการ Prompt ที่ดี (และความหมายของคำว่า "ดี")

Grok 4 เป็น large language model ที่มีความสามารถ พร้อมด้วยความสามารถในการให้เหตุผลและการเขียนโค้ดที่แข็งแกร่ง แต่คุณภาพของผลลัพธ์นั้นเชื่อมโยงอย่างใกล้ชิดกับความชัดเจนและข้อจำกัดของอินพุต Prompt ที่ดีสำหรับการรีวิวโค้ดหรือการปรับปรุงโค้ดมีสี่สิ่ง:

ให้ขอบเขต: เรากำลังพูดถึงไฟล์ ฟังก์ชัน หรือโมดูลใด สิ่งใดที่อยู่นอกขอบเขต?

กำหนดเจตนา: เรากำลังปรับประสิทธิภาพ ปรับปรุงความสามารถในการอ่าน บังคับใช้สไตล์ หรือแก้ไขข้อบกพร่อง?

จัดหาบริบท: ภาษา เฟรมเวิร์ก รันไทม์ การพึ่งพา ข้อจำกัด และเกณฑ์การยอมรับ

ต้องการหลักฐาน: ขอคำอธิบาย การวิเคราะห์ความซับซ้อน และการให้เหตุผลทีละขั้นตอน ไม่ใช่แค่การเปลี่ยนแปลง

เมื่อคุณเข้ารหัสองค์ประกอบเหล่านั้นอย่างสม่ำเสมอ คำแนะนำในการรีวิวโค้ดและการปรับปรุงโค้ดของ Grok 4 จะแม่นยำ มีเหตุผล และบำรุงรักษาได้มากขึ้น

รูปแบบ Prompt ทองคำสำหรับการรีวิวโค้ด

ใช้รูปแบบหลักนี้ จากนั้นปรับแต่งตามงาน:

คุณคือวิศวกร [ภาษา/เฟรมเวิร์ก] อาวุโสที่กำลังรีวิวโค้ดสำหรับ [โครงการ/โดเมน]
เป้าหมาย: [แก้ไขข้อผิดพลาด | ประสิทธิภาพ | ความสามารถในการอ่าน | ความปลอดภัย | DX | ความสอดคล้องของ API]
ข้อจำกัด: [คู่มือสไตล์ เวอร์ชันที่รองรับ ขีดจำกัดหน่วยความจำ/เวลา ข้อจำกัดของไลบรารี]
บริบท:
- รันไทม์/Env: [Node 20, JVM 17, Python 3.11, iOS 17, ฯลฯ ]
- การพึ่งพาหลัก: [รายการ]
- สถาปัตยกรรม: [monolith, microservice, serverless, hexagonal, ฯลฯ ]
- อินเทอร์เฟซ/สัญญาที่เกี่ยวข้อง: [ลิงก์หรืออินไลน์]
งาน:
1) รีวิวโค้ดต่อไปนี้สำหรับ [เป้าหมาย]
2) ระบุปัญหาเฉพาะพร้อมหลักฐาน (การอ้างอิงบรรทัด การประมาณความซับซ้อน กรณีพิเศษ)
3) เสนอ diff ที่น้อยที่สุดและตรงเป้าหมาย
4) จัดทำเวอร์ชันที่ปรับปรุงใหม่ขั้นสุดท้าย
5) อธิบายข้อดีข้อเสียและความเสี่ยง
โค้ด:
```[ภาษา]
// วางโค้ดที่นี่

รูปแบบผลลัพธ์:

ผลการค้นหา: รายการ bullet พร้อมความรุนแรงและเหตุผล

Diffs: บล็อก diff ที่รวมเป็นหนึ่งเดียว

ปรับปรุง: บล็อกโค้ดที่สมบูรณ์

การทดสอบ: คำแนะนำการทดสอบหน่วย (happy path + กรณีพิเศษ)

หมายเหตุ: ข้อดีข้อเสีย ทางเลือก ข้อกังวลในการย้ายข้อมูล


เหตุผลที่ได้ผล:
- กำหนดบทบาทและเป้าหมาย
- กำหนดข้อจำกัดและบริบท
- บังคับใช้หลักฐานและโครงสร้าง
- สร้าง diff + โค้ดสุดท้าย + การทดสอบ
---
## เทมเพลตเริ่มต้นอย่างรวดเร็วสำหรับสถานการณ์ทั่วไป
### 1) แก้ไขข้อผิดพลาด + safety nets
```text
ทำหน้าที่เป็นวิศวกร [ภาษา] อาวุโส รีวิวเพื่อความถูกต้องและกรณีพิเศษที่ซ่อนอยู่
เน้น: race conditions, การจัดการ null/None, off-by-one, การตรวจสอบอินพุต, การแพร่กระจายข้อผิดพลาด
จัดหา: ปัญหาพร้อมการอ้างอิงบรรทัด diff ที่น้อยที่สุด และการปรับปรุงที่ปลอดภัยพร้อมการทดสอบ

2) เส้นทางประสิทธิภาพที่สำคัญ

เป้าหมาย: ลดความซับซ้อนของเวลาและหน่วยความจำโดยไม่เปลี่ยนพฤติกรรมสาธารณะ
จัดหา: ความซับซ้อนปัจจุบัน ความซับซ้อนที่เสนอ การเพิ่มประสิทธิภาพขนาดเล็กกับการเปลี่ยนแปลงเชิงอัลกอริทึม และเกณฑ์มาตรฐานที่จะเรียกใช้

3) ความสามารถในการอ่านและการบำรุงรักษา

ปรับปรุงเพื่อความชัดเจน: การตั้งชื่อที่ดีขึ้น ฟังก์ชันที่เล็กลง ความรับผิดชอบเดียว
เพิ่ม docstrings/JSDoc ลดความซับซ้อนของการควบคุมการไหล ลบโค้ดที่ตายแล้ว รักษา API สาธารณะให้เสถียร

4) การตรวจสอบความปลอดภัย

แบบจำลองภัยคุกคาม: อินพุตที่ไม่น่าเชื่อถือจาก [แหล่งที่มา]
ตรวจสอบ: injection, deserialization, SSRF, XSS, CSRF, authZ/authN, การจัดการความลับ
แนะนำ: ไลบรารีที่ปลอดภัย รูปแบบการตรวจสอบ และ diff ที่น้อยที่สุด

5) การย้ายเฟรมเวิร์กหรือ SDK

เรากำลังย้ายจาก [lib A] ไปยัง [lib B]
แสดงรายการการเปลี่ยนแปลงที่ทำให้เกิดปัญหา เสนอเลเยอร์อะแดปเตอร์ และจัดทำแผนการเปิดตัวที่เพิ่มขึ้นพร้อมการทดสอบ

ให้บริบทที่ถูกต้อง (โดยไม่ทำให้มากเกินไป)

Grok 4 ทำงานได้ดีที่สุดด้วยบริบทที่เพียงพอ นี่คือสิ่งที่ควรรวม:

ภาษาและเวอร์ชัน: เช่น Python 3.12, TypeScript 5.4

เฟรมเวิร์ก/รันไทม์: เช่น FastAPI, Spring Boot, Node 20

ข้อจำกัด: ขีดจำกัดหน่วยความจำ/เวลา สัญญา API ข้อจำกัดการพึ่งพา

อินเทอร์เฟซที่อยู่ติดกัน: ลายเซ็นวิธีการสาธารณะ DTOs สคีมา หรือคำขอตัวอย่าง

อินพุตที่เป็นตัวแทน: payload ที่สมจริง ไม่ใช่แค่ตัวอย่างของเล่น

คู่มือสไตล์: ลิงก์หรือสรุป (PEP 8, Google Java Style, Airbnb TS)

หลีกเลี่ยงการทิ้งที่เก็บทั้งหมด แทน:

แชร์หน่วยที่เล็กที่สุดที่แสดงปัญหา

เพิ่มอินเทอร์เฟซ/สัญญาที่โต้ตอบด้วย

รวมการทดสอบที่ล้มเหลวหรืออินพุตตัวอย่างที่เสีย

ตัวอย่างบล็อกบริบท:

Env: Python 3.11, FastAPI, Pydantic v2
สัญญา: endpoint ต้องส่งคืน 200 พร้อม { data, meta } แม้ว่าจะเกิดความล้มเหลวบางส่วน
ข้อจำกัด: ต้องยังคง async; ไม่สามารถเพิ่ม deps ที่หนักหน่วงใหม่ได้

โครงสร้าง Prompt ที่ปลดล็อกการปรับปรุงที่ดีขึ้น

โครงสร้าง A: วิจารณ์ → Diff → ปรับปรุง → การทดสอบ

ดีที่สุดเมื่อคุณต้องการทั้ง quick wins และผลลัพธ์รวมขั้นสุดท้าย

1) วิจารณ์: แสดงรายการปัญหาที่เป็นรูปธรรมพร้อมหลักฐาน
2) Diff: การเปลี่ยนแปลงที่เล็กที่สุดในการแก้ไข
3) ปรับปรุง: โค้ดสุดท้ายที่สะอาดและสำนวน
4) การทดสอบ: การทดสอบหน่วยที่ครอบคลุม happy path + 3 กรณีพิเศษ

โครงสร้าง B: ชุดตัวเลือกพร้อมข้อดีข้อเสีย

ยอดเยี่ยมสำหรับการปรับปรุงที่ละเอียดอ่อนในการออกแบบ

เสนอ 3 ตัวเลือกการปรับปรุง:
- ตัวเลือก A: การเปลี่ยนแปลงน้อยที่สุด
- ตัวเลือก B: การออกแบบใหม่ปานกลาง
- ตัวเลือก C: เขียนใหม่ทั้งหมด
สำหรับแต่ละ: ข้อดีข้อเสีย ความซับซ้อน ความเสี่ยง แผนการย้ายข้อมูล และเวลาที่จะเลือก

โครงสร้าง C: การปรับปรุงที่ขับเคลื่อนด้วยข้อจำกัด

ใช้เมื่อคุณต้องรักษาพฤติกรรมและงบประมาณ

ข้อจำกัด: API สาธารณะเดียวกัน <50ms p95 <10MB หน่วยความจำเพิ่มเติม ไม่มีการพึ่งพารันไทม์ใหม่
แสดงว่าการปรับปรุงของคุณเป็นไปตามข้อจำกัดแต่ละข้ออย่างไรด้วยการวัดหรือการให้เหตุผล

ตัวอย่าง: การขอให้ Grok 4 รีวิวและปรับปรุง Python Endpoint

Prompt:

คุณคือวิศวกร Python อาวุโส เป้าหมาย: ความถูกต้อง + ประสิทธิภาพ
Env: Python 3.11, FastAPI, httpx, Pydantic v2 สัญญา: ห้าม raise เมื่อเกิดความล้มเหลวบางส่วน
งาน: รีวิวและปรับปรุง จัดเตรียมวิจารณ์ → diff ที่น้อยที่สุด → ปรับปรุงขั้นสุดท้าย → การทดสอบ
โค้ด:
```python
จาก fastapi import APIRouter
import httpx
router = APIRouter
@router.get("/users/{user_id}")
async def get_user(user_id: str):
async with httpx.AsyncClient as client:
profile = await client.get(f")
posts = await client.get(f")
return {"data": {"profile": profile.json, "posts": posts.json}}

การยอมรับ:

จัดการ non-200 จากการเรียกใดๆ โดยไม่ต้อง raise

p95 < 100ms เพิ่มเวลาแฝงเกิน upstreams; ทำให้คำขอพร้อมกัน

เพิ่มการตรวจสอบอินพุตขั้นพื้นฐาน, timeouts และ retries พร้อม jitter


Prompt นี้ทำให้ Grok 4 ได้รับงาน guardrails และรูปร่างเอาต์พุต ดังนั้นคำแนะนำจึงง่ายต่อการนำไปใช้
---
## จากคำแนะนำดิบๆ สู่โค้ดที่พร้อมใช้งาน: วงจรการวนซ้ำ
ปฏิบัติต่อ Grok 4 เหมือนกับ pair-programmer ใช้วงจรที่แน่นหนา:
1. เริ่มต้นด้วยโค้ดและข้อจำกัดที่ทำซ้ำได้น้อยที่สุด
2. ขอคำวิจารณ์ + diff ที่ตรงเป้าหมาย
3. ใช้ diff ในเครื่อง เรียกใช้การทดสอบ/เกณฑ์มาตรฐาน
4. วางความล้มเหลว/เอาต์พุตกลับเข้าไปใน Grok 4 พร้อม: "นี่คือกรณีที่ล้มเหลว ปรับเปลี่ยน"
5. ล็อกข้อจำกัด: "อย่าเปลี่ยน API สาธารณะ รักษาระดับความซับซ้อน O(n)"
6. ขอการทดสอบและกรณีที่อิงตามคุณสมบัติ
Iteration prompt:
```text
นี่คือความล้มเหลวในการทดสอบและเกณฑ์มาตรฐาน รักษากรณีที่ผ่านมา เสนอการเปลี่ยนแปลงที่เล็กที่สุดเพื่อแก้ไขการทดสอบสีแดงทั้งหมดโดยไม่ทำลาย API สาธารณะ ส่งคืนเฉพาะ unified diff

ทำให้คำแนะนำในการปรับปรุงสามารถนำไปปฏิบัติได้

ขอให้ Grok 4:

แท็กคำแนะนำแต่ละรายการด้วยความรุนแรง (สูง/กลาง/ต่ำ) และหมวดหมู่ (ข้อผิดพลาด, ประสิทธิภาพ, สไตล์, ความปลอดภัย)

ให้เหตุผลหนึ่งบรรทัดต่อคำแนะนำ

รวมส่วนย่อยก่อน/หลังอย่างรวดเร็ว

จัดทำแผนการย้ายข้อมูลหากมีความเสี่ยงในการเปลี่ยนแปลงที่ก่อให้เกิดปัญหา

Prompt add-on:

ใส่คำอธิบายประกอบแต่ละคำแนะนำด้วย: {severity, category, rationale} รวมส่วนย่อยก่อน/หลังและแผนการย้ายข้อมูลขั้นตอนเดียวหากพฤติกรรมอาจเปลี่ยนแปลง

ความปลอดภัย ประสิทธิภาพ และการทดสอบ: Prompt Add‑Ons ที่ตรงเป้าหมาย

เลนส์ความปลอดภัย:

"สมมติว่าอินพุตทั้งหมดถูกควบคุมโดยผู้โจมตี ระบุ injection, SSRF, path traversal และการเปิดเผยความลับ จัดหารูปแบบที่ปลอดภัยและ diff ที่น้อยที่สุด"

เลนส์ประสิทธิภาพ:

"รายงานความซับซ้อนปัจจุบันเทียบกับที่เสนอ เน้น hotspots และทางเลือกที่ถูกกว่า รวม benchmark harness ขนาดเล็ก"

เลนส์การทดสอบ:

"เสนอการทดสอบหน่วย การทดสอบตามคุณสมบัติ และกรณีขอบ รวม mocks สำหรับเครือข่าย/IO ตรวจสอบให้แน่ใจว่าครอบคลุมเส้นทางความล้มเหลว"

การปรับแต่ง Prompt เฉพาะภาษา

JavaScript/TypeScript:

ระบุเป้าหมาย tsconfig, สภาพแวดล้อม Node/browser, bundler tree-shaking และกฎ ESLint/Prettier

ขอ JSDoc/TSDoc และ discriminated unions สำหรับประเภทที่ปลอดภัยกว่า

Python:

หมายเหตุเป้าหมาย mypy, pydantic v1 เทียบกับ v2, sync เทียบกับ async และระดับ type hints

ขอ pytest fixtures และการทดสอบคุณสมบัติผ่าน hypothesis

Java/Kotlin:

เรียกใช้เวอร์ชัน JDK, ความคาดหวังที่ไม่เปลี่ยนรูป, กฎการใช้งาน Lombok และกลยุทธ์การจัดการข้อผิดพลาด

ขอการทดสอบ JUnit 5 และคำแนะนำเกณฑ์มาตรฐานผ่าน JMH

เน้นการจัดสรรศูนย์ในเส้นทางที่สำคัญ, การแพร่กระจาย context.Context และการห่อข้อผิดพลาดด้วย %w

ขอการทดสอบแบบ table-driven และ race detector flags

Rust:

ระบุ edition, นโยบายโค้ดที่ไม่ปลอดภัย และ feature flags ขอกรณีเกณฑ์มาตรฐานและ proptest

รับเอาต์พุต Diff ที่ดีขึ้นจาก Grok 4

Models บางครั้งสร้างเส้นทางไฟล์หรือบรรทัดบริบท ลดแรงเสียดทานด้วย:

ส่งคืนเอาต์พุตเป็น unified diff พร้อมเส้นทางไฟล์ที่ถูกต้องจาก repo root นี้ รวมเฉพาะ hunks ที่เปลี่ยนแปลง ไม่มีความคิดเห็นใน diff จากนั้นรวมส่วนแยกต่างหากสำหรับ notes

หาก diff ยังคงยุ่งเหยิง ให้จำกัดเพิ่มเติม:

ตอบกลับด้วยสองบล็อกเท่านั้น:
1) ```diff
...การเปลี่ยนแปลง...

หมายเหตุ: รายการ bullet


---
## การบังคับใช้ข้อกำหนดที่ไม่เกี่ยวกับฟังก์ชัน (NFRs)
หากคุณต้องการการรับประกันเกี่ยวกับเวลาแฝง หน่วยความจำ หรือความเข้ากันได้ ให้ใส่ไว้ใน prompt และขอให้ Grok 4 ตรวจสอบตัวเอง:
```text
NFRs: p95 เวลาแฝง +< 20ms เทียบกับ baseline, ส่วนต่างของหน่วยความจำ < 5MB, ไม่มีการพึ่งพารันไทม์ใหม่, API สาธารณะเดียวกัน
เพิ่มส่วนตรวจสอบตัวเองที่ยืนยันแต่ละ NFR พร้อมการให้เหตุผลคร่าวๆ หรือแนวคิด microbench

ทำให้ Grok 4 อธิบายเหตุผล (โดยไม่เยิ่นเย้อ)

คุณต้องการคำอธิบายที่เพียงพอเพื่อเชื่อถือคำแนะนำ ลอง:

อธิบายการเปลี่ยนแปลงแต่ละรายการในหนึ่งประโยคพร้อมบรรทัดหรือส่วนย่อยที่อ้างอิง หากไม่แน่ใจ ให้ถามคำถามเพื่อความกระจ่างแทนที่จะเดา

และอนุญาตคำถามอย่างชัดเจน:

หากข้อกำหนดไม่ชัดเจน ให้ถามคำถามเพื่อความกระจ่างสูงสุด 3 ข้อก่อนดำเนินการต่อ

Anti-Patterns: เหตุใด Prompts ของคุณอาจล้มเหลว

เป้าหมายที่คลุมเครือ: "โปรดปรับปรุงสิ่งนี้"

ข้อจำกัดที่ขาดหายไป: "แน่นอน เพิ่มการพึ่งพาขนาดใหญ่และทำลาย CI"

ไม่มีเกณฑ์การยอมรับ: "ดูเหมือนจะดีบนเครื่องของฉัน"

Wall-of-code ที่ไม่มีบริบท: model ไม่สามารถอนุมานขอบเขตหรือสัญญา

ความคาดหวังแบบ single-shot: การปรับปรุงแบบวนซ้ำจะดีกว่า prompts แบบครั้งเดียว

แก้ไขโดยการกำหนดเป้าหมาย ขอบเขต ข้อจำกัด บริบท และการทดสอบการยอมรับ

ตัวอย่าง Refactor Prompt พร้อมรูปร่างเอาต์พุต

บทบาท: วิศวกร TypeScript อาวุโส
เป้าหมาย: ปรับปรุงความสามารถในการอ่านและความปลอดภัยของรันไทม์โดยไม่เปลี่ยน API สาธารณะ
Env: Node 20, TypeScript 5.4, Zod สำหรับการตรวจสอบ, ESLint Airbnb, strictNullChecks
ข้อจำกัด: ไม่มีการพึ่งพารันไทม์ใหม่นอกเหนือจาก Zod ไม่มีการเปลี่ยนแปลงที่ก่อให้เกิดปัญหา รักษาระดับความซับซ้อน O(n)
งาน:
- วิจารณ์ → Diff → ปรับปรุง → การทดสอบ → หมายเหตุ
- แท็กปัญหาด้วย {severity, category, rationale}
- รวมสคีมา Zod สำหรับการตรวจสอบอินพุตและการทดสอบหน่วย 4 รายการ
โค้ด:
```ts
ส่งออกฟังก์ชัน parseUser(raw: any) {
if (!raw) return null
return {
id: raw.id || '0',
name: raw.name || 'Unknown',
age: parseInt(raw.age),
}
}


---
## การทำให้ Grok 4 เคารพสไตล์และสถาปัตยกรรม
ยึด model ด้วยกฎที่เป็นรูปธรรม:
```text
สไตล์: Airbnb TS ชอบการคืนค่าก่อนหน้า หลีกเลี่ยงการซ้อนลึก ใช้ประเภทที่ชัดเจน
สถาปัตยกรรม: รักษารูปแบบฟังก์ชันที่บริสุทธิ์ ไม่มีผลข้างเคียง การตรวจสอบอินพุตที่ขอบเขต

และขอ linter pass:

เรียกใช้ mental ESLint pass และแสดงรายการการละเมิดที่คุณคาดหวัง จากนั้นแก้ไข

เปลี่ยน Refactors ให้เป็นการเรียนรู้: ขอรูปแบบ

ทำให้การปรับปรุงคงอยู่โดยขอให้ Grok 4 ตั้งชื่อรูปแบบและเหตุผลที่เหมาะสม:

สำหรับการเปลี่ยนแปลงแต่ละครั้ง ให้ตั้งชื่อรูปแบบการปรับปรุง (เช่น Extract Function, Introduce Parameter Object) และอธิบายเวลาที่จะนำไปใช้ใน codebase นี้

การแก้ไขปัญหา: เมื่อ Grok 4 พลาดเป้าหมาย

หากคิดค้น APIs: "ใช้เฉพาะ APIs ที่แสดงในโค้ดหรือยืนยันในบริบทเท่านั้น"

หากมีการปรับปรุงมากเกินไป: "Diff ที่น้อยที่สุดก่อน ปรับปรุงเฉพาะเมื่อจำเป็น"

หากละเว้นข้อจำกัด: "แสดงการตรวจสอบตัวเองเทียบกับข้อจำกัดก่อนส่งคืนโค้ด"

หากเยิ่นเย้อเกินไป: "ส่งคืนเฉพาะ diff และสรุป 5 bullet"

หากการทดสอบไม่เสถียร: "เสนอการทดสอบที่กำหนดได้และหลีกเลี่ยงการยืนยันตามเวลา"

เวิร์กโฟลว์ในโลกแห่งความเป็นจริง: จาก PR สู่ Merge

นักพัฒนาเปิด PR พร้อม prompt artifacts ที่ตรงเป้าหมาย: เป้าหมาย ข้อจำกัด บริบท การทดสอบการยอมรับ

วาง diff + บริบทลงใน Grok 4 ด้วย Golden Pattern

ใช้ diff ที่น้อยที่สุด เรียกใช้ CI อีกครั้ง

วนซ้ำด้วย logs ที่ล้มเหลวเป็น feedback

ขอการปรับปรุงและการทดสอบขั้นสุดท้าย

เพิ่มคอมเมนต์สรุปพร้อมข้อดีข้อเสียและ notes การย้ายข้อมูลสำหรับผู้รีวิว

สิ่งนี้ทำให้มนุษย์สามารถควบคุมได้ ในขณะที่ Grok 4 เร่งส่วนที่น่าเบื่อ: การตรวจจับ การแก้ไขเล็กน้อย และการปรับปรุงที่มีโครงสร้าง

อย่างไรก็ตาม: เร่งวงจรนี้ด้วย Sider.AI

หากเวิร์กโฟลว์ของคุณผสมผสาน chat prompts, code context และ iterative diffs เป็นสิ่งที่ควรค่าแก่การสังเกตว่าเครื่องมือเช่น Sider.ai ผสานรวมการรีวิวโค้ดด้วย AI โดยตรงใน pull requests ของคุณ ทำให้คุณสามารถใช้ prompts เช่น prompts ด้านบนด้วยบริบทที่รับรู้ที่เก็บ ข้อดีคือการลงหลักปักฐานที่แน่นหนาขึ้น: การนำเข้าที่สร้างขึ้นน้อยลง การอ้างอิงบรรทัดที่ดีขึ้น และการวนซ้ำที่เร็วขึ้นด้วยคอมเมนต์แบบอินไลน์

Prompt ที่แนะนำให้ใช้ภายในผู้ช่วยที่รับรู้ที่เก็บ:

ใช้เฉพาะบริบท repo รีวิวไฟล์ที่เปลี่ยนแปลงใน PR นี้สำหรับ [เป้าหมาย] ใส่คำอธิบายประกอบผลการค้นหาแบบอินไลน์ด้วยความรุนแรงและเหตุผล เสนอ diff ที่รักษา API สาธารณะและ NFRs รวมถึงการทดสอบที่สัมผัสเฉพาะเส้นทางที่เปลี่ยนแปลง

ประเด็นสำคัญ

กำหนดขอบเขต เจตนา บริบท และข้อจำกัดล่วงหน้า

ขอวิจารณ์ → diff ที่น้อยที่สุด → ปรับปรุง → การทดสอบเพื่อให้การเปลี่ยนแปลงปลอดภัย

ใช้ชุดตัวเลือกพร้อมข้อดีข้อเสียสำหรับการเปลี่ยนแปลงที่เน้นการออกแบบ

เข้ารหัส NFRs และขอให้ Grok 4 ตรวจสอบตัวเอง

วนซ้ำอย่างรวดเร็ว: เรียกใช้การทดสอบ ส่ง feedback ที่ล้มเหลวกลับ ทำซ้ำ

ใช้เครื่องมือที่รับรู้ที่เก็บเช่น Sider.AI เพื่อลงหลักปักฐานคำแนะนำในโค้ดจริง

ขั้นตอนต่อไป

บันทึก Golden Prompt Pattern ไปยัง snippets ของคุณ

สร้าง variants เฉพาะภาษาสำหรับ stack ของคุณ

ลองใช้กับ PR ขนาดเล็กวันนี้ วัดจำนวนรอบการรีวิวที่คุณประหยัดได้

เพิ่มการทดสอบการยอมรับใน prompts ของคุณเพื่อบังคับใช้สิ่งที่ไม่สามารถต่อรองได้

ค่อยๆ ขยายไปสู่ prompts ประสิทธิภาพและความปลอดภัยเมื่อพื้นฐานติด

FAQ

คำถามที่ 1: วิธีที่ดีที่สุดในการใช้ Grok 4 เพื่อตรวจสอบโค้ดคืออะไร? ใช้พรอมต์ที่มีโครงสร้างซึ่งกำหนดบทบาท เป้าหมาย ข้อจำกัด สภาพแวดล้อม และเกณฑ์การยอมรับ ขอคำวิจารณ์ diffs ที่น้อยที่สุด การปรับโครงสร้างขั้นสุดท้าย การทดสอบ และการวิเคราะห์ข้อดีข้อเสียโดยสังเขป

คำถามที่ 2: ฉันจะรับคำแนะนำในการปรับโครงสร้างที่ถูกต้องจาก Grok 4 ได้อย่างไร? ระบุความตั้งใจที่ชัดเจน (เช่น ความสามารถในการอ่านหรือประสิทธิภาพ) รวมถึงบริบท เช่น อินเทอร์เฟซและข้อจำกัด และขอชุดตัวเลือกพร้อมข้อดีและข้อเสีย บังคับใช้ข้อกำหนดที่ไม่ใช่ฟังก์ชันและการขอตรวจสอบตัวเอง

คำถามที่ 3: ฉันควรวางทั้ง repository ลงใน Grok 4 หรือไม่? ไม่ แบ่งปันโค้ดที่สามารถทำซ้ำได้ที่เล็กที่สุดพร้อมอินเทอร์เฟซและข้อจำกัดที่เกี่ยวข้อง ทำให้พรอมต์มีจุดสนใจและทำซ้ำโดยป้อนข้อผิดพลาดในการทดสอบและเกณฑ์มาตรฐานกลับเข้าไป

คำถามที่ 4: ฉันจะป้องกันไม่ให้ Grok 4 เปลี่ยนแปลง APIs สาธารณะระหว่างการปรับโครงสร้างได้อย่างไร? ระบุข้อจำกัดที่ชัดเจน เช่น “ห้ามเปลี่ยน public API” ระบุอินพุต/เอาต์พุตตัวอย่าง และขอให้โมเดลยืนยันการปฏิบัติตามข้อกำหนดด้วยการตรวจสอบตัวเองก่อนส่งคืนโค้ด

คำถามที่ 5: Grok 4 สามารถแนะนำการทดสอบและเกณฑ์มาตรฐานได้หรือไม่? ใช่ ขอให้ใส่ unit tests, property-based tests และ benchmark harness ขนาดเล็ก ระบุ testing framework และ runtime เพื่อให้คำแนะนำสามารถรันได้