What is the best way to prompt Grok 4 for a code review?

Use a structured prompt that defines role, goals, constraints, environment, and acceptance criteria. Ask for critique, minimal diffs, a final refactor, tests, and a brief trade-off analysis.

How can I get accurate refactor suggestions from Grok 4?

Provide clear intent (e.g., readability or performance), include context like interfaces and constraints, and request option sets with pros and cons. Enforce non-functional requirements and ask for a self-check.

Should I paste the whole repository into Grok 4?

No. Share the smallest reproducible code with relevant interfaces and constraints. Keep prompts focused and iterate by feeding back test failures and benchmarks.

How do I prevent Grok 4 from changing public APIs during refactors?

State explicit constraints such as “do not change public API,” provide example inputs/outputs, and ask the model to confirm compliance with a self-check before returning code.

Can Grok 4 suggest tests and benchmarks?

Yes. Ask it to include unit tests, property-based tests, and a small benchmark harness. Specify the testing framework and runtime to keep suggestions runnable.

Cách Soạn Prompt cho Grok 4 để Đề Xuất Review & Tái Cấu Trúc Code Chính Xác

Bạn không cần thêm comment—bạn cần prompt tốt hơn. Sự khác biệt giữa một bản review code AI tầm thường và một bản sắc bén thường nằm ở cách bạn đặt câu hỏi.

Trong hướng dẫn thực tế, ưu tiên cho nhà phát triển này, chúng ta sẽ cùng nhau tìm hiểu cách soạn prompt cho Grok 4 để có các đề xuất review và tái cấu trúc code chính xác. Chúng ta sẽ đề cập đến các mẫu prompt thực tế, những cạm bẫy phổ biến và các chiến lược nâng cao giúp Grok 4 suy luận về ngữ cảnh, kiến trúc, hiệu suất và khả năng bảo trì—để nó trả về các bản sửa lỗi mà bạn thực sự có thể triển khai.

Để mọi thứ mang tính hành động, chúng ta sẽ sử dụng cấu trúc dẫn dắt bằng câu hỏi:

Một prompt review code AI tốt trông như thế nào?

Làm thế nào để cung cấp cho Grok 4 đúng ngữ cảnh mà không làm nó quá tải?

Những mẫu prompt nào mang lại các đề xuất tái cấu trúc tốt nhất?

Làm thế nào để khiến Grok 4 giải thích các đánh đổi, chứ không chỉ viết lại code?

Cách nhanh nhất để lặp lại để có được đầu ra AI “sẵn sàng cho sản xuất” là gì?

Trong quá trình này, bạn sẽ nhận được các công thức, ví dụ và danh sách kiểm tra prompt sẵn sàng để sao chép và dán mà bạn có thể điều chỉnh cho stack của mình.

Tại Sao Grok 4 Cần Prompt Tuyệt Vời (Và "Tuyệt Vời" Nghĩa Là Gì)

Grok 4 là một mô hình ngôn ngữ lớn có khả năng với khả năng suy luận và viết code mạnh mẽ, nhưng chất lượng đầu ra của nó gắn liền với độ rõ ràng và các ràng buộc của đầu vào. Một prompt tuyệt vời để review hoặc tái cấu trúc code thực hiện bốn điều sau:

Cung cấp phạm vi: Chúng ta đang nói về file, function hoặc module nào? Cái gì là giới hạn?

Xác định ý định: Chúng ta đang tối ưu hóa hiệu suất, cải thiện khả năng đọc, thực thi style, hay sửa lỗi?

Cung cấp ngữ cảnh: Ngôn ngữ, framework, runtime, các dependency, ràng buộc và tiêu chí chấp nhận.

Yêu cầu bằng chứng: Yêu cầu giải thích, phân tích độ phức tạp và suy luận từng bước—chứ không chỉ các thay đổi.

Khi bạn mã hóa nhất quán các yếu tố đó, các đề xuất review và tái cấu trúc code của Grok 4 sẽ trở nên chính xác hơn, có cơ sở hơn và dễ bảo trì hơn.

Mẫu Prompt Vàng cho Review Code

Sử dụng mẫu chính này, sau đó điều chỉnh cho từng tác vụ:

Bạn là một kỹ sư [ngôn ngữ/framework] cấp cao đang review code cho [dự án/domain].
Mục tiêu: [Sửa lỗi | Hiệu suất | Khả năng đọc | Bảo mật | DX | Tính nhất quán của API]
Ràng buộc: [Style guide, các phiên bản được hỗ trợ, giới hạn bộ nhớ/thời gian, ràng buộc thư viện]
Ngữ cảnh:
- Runtime/Env: [Node 20, JVM 17, Python 3.11, iOS 17, v.v.]
- Các dependency chính: [list]
- Kiến trúc: [monolith, microservice, serverless, hexagonal, v.v.]
- Các interface/contract liên quan: [link hoặc inline]
Tác vụ:
1) Review code sau để [các mục tiêu].
2) Xác định các vấn đề cụ thể kèm bằng chứng (tham chiếu dòng, ước tính độ phức tạp, các trường hợp đặc biệt).
3) Đề xuất các diff tối thiểu, có mục tiêu.
4) Cung cấp phiên bản đã tái cấu trúc cuối cùng.
5) Giải thích các đánh đổi và rủi ro.
Code:
```[language]
// paste code here

Định dạng đầu ra:

Các phát hiện: danh sách gạch đầu dòng với mức độ nghiêm trọng và lý do

Diffs: các block diff thống nhất

Tái cấu trúc: block code hoàn chỉnh

Tests: các đề xuất unit test (happy path + các trường hợp đặc biệt)

Ghi chú: các đánh đổi, các lựa chọn thay thế, các lo ngại về migration


Tại sao nó hoạt động:
- Đặt vai trò và các mục tiêu.
- Đặt các ràng buộc và ngữ cảnh.
- Bắt buộc bằng chứng và cấu trúc.
- Tạo ra các diff + code cuối cùng + các tests.
---
## Các Mẫu Khởi Đầu Nhanh cho Các Tình Huống Phổ Biến
### 1) Sửa lỗi + các lưới an toàn
```text
Đóng vai một kỹ sư [ngôn ngữ] cấp cao. Review để tìm tính chính xác và các trường hợp đặc biệt ẩn.
Tập trung vào: race condition, xử lý null/None, off-by-one, xác thực đầu vào, lan truyền lỗi.
Cung cấp: các vấn đề với tham chiếu dòng, các diff tối thiểu và một bản tái cấu trúc an toàn với các tests.

2) Điểm nóng hiệu suất

Mục tiêu: giảm độ phức tạp về thời gian và bộ nhớ mà không thay đổi hành vi công khai.
Cung cấp: độ phức tạp hiện tại, độ phức tạp được đề xuất, các micro-optimization so với các thay đổi về thuật toán và các benchmark để chạy.

3) Khả năng đọc & khả năng bảo trì

Tái cấu trúc để làm rõ: đặt tên tốt hơn, các function nhỏ hơn, trách nhiệm duy nhất.
Thêm docstring/JSDoc, đơn giản hóa luồng điều khiển, loại bỏ code chết. Giữ API công khai ổn định.

4) Review bảo mật

Mô hình mối đe dọa: đầu vào không tin cậy từ [nguồn].
Kiểm tra: injection, deserialization, SSRF, XSS, CSRF, authZ/authN, xử lý bí mật.
Đề xuất: các thư viện an toàn, các mẫu xác thực và các diff tối thiểu.

5) Di chuyển các framework hoặc SDK

Chúng tôi đang di chuyển từ [lib A] sang [lib B].
Liệt kê các thay đổi phá vỡ, đề xuất một lớp adapter và cung cấp một kế hoạch triển khai gia tăng với các tests.

Cung Cấp Ngữ Cảnh Phù Hợp (Mà Không Gây Quá Tải)

Grok 4 hoạt động tốt nhất với vừa đủ ngữ cảnh. Đây là những gì cần bao gồm:

Ngôn ngữ và phiên bản: ví dụ: Python 3.12, TypeScript 5.4.

Framework/runtime: ví dụ: FastAPI, Spring Boot, Node 20.

Các ràng buộc: giới hạn bộ nhớ/thời gian, các contract API, các hạn chế về dependency.

Các interface lân cận: chữ ký method công khai, DTO, schema hoặc các request mẫu.

Các đầu vào đại diện: payload thực tế, không chỉ các ví dụ đồ chơi.

Style guide: link hoặc tóm tắt (PEP 8, Google Java Style, Airbnb TS).

Tránh đổ toàn bộ repository. Thay vào đó:

Chia sẻ đơn vị nhỏ nhất thể hiện vấn đề.

Thêm interface/contract mà nó tương tác.

Bao gồm một test thất bại hoặc đầu vào mẫu bị hỏng.

Ví dụ về block ngữ cảnh:

Env: Python 3.11, FastAPI, Pydantic v2.
Contract: endpoint phải trả về 200 với { data, meta } ngay cả khi thất bại một phần.
Ràng buộc: phải duy trì tính async; không thể thêm các dependency nặng mới.

Các Cấu Trúc Prompt Mở Ra Các Bản Tái Cấu Trúc Tốt Hơn

Cấu trúc A: Phê bình → Diff → Tái cấu trúc → Tests

Tốt nhất khi bạn muốn cả chiến thắng nhanh chóng và một kết quả hợp nhất cuối cùng.

1) Phê bình: liệt kê các vấn đề cụ thể kèm bằng chứng.
2) Diff: các thay đổi nhỏ nhất để sửa lỗi.
3) Tái cấu trúc: code cuối cùng sạch, thành ngữ.
4) Tests: unit tests bao gồm happy path + 3 trường hợp đặc biệt.

Cấu trúc B: Các Tập Hợp Tùy Chọn với Đánh Đổi

Tuyệt vời cho các bản tái cấu trúc nhạy cảm về thiết kế.

Đề xuất 3 tùy chọn tái cấu trúc:
- Tùy chọn A: thay đổi tối thiểu
- Tùy chọn B: thiết kế lại vừa phải
- Tùy chọn C: viết lại hoàn toàn
Đối với mỗi tùy chọn: ưu/nhược điểm, độ phức tạp, rủi ro, kế hoạch migration và thời điểm chọn.

Cấu trúc C: Tái cấu trúc dựa trên ràng buộc

Sử dụng khi bạn phải bảo tồn hành vi và ngân sách.

Các ràng buộc: API công khai giống nhau, <50ms p95, <10MB bộ nhớ bổ sung, không có dependency runtime mới.
Cho biết cách bản tái cấu trúc của bạn đáp ứng từng ràng buộc với các phép đo hoặc lý luận.

Ví Dụ: Yêu Cầu Grok 4 Review và Tái Cấu Trúc Một Endpoint Python

Prompt:

Bạn là một kỹ sư Python cấp cao. Mục tiêu: tính chính xác + hiệu suất.
Env: Python 3.11, FastAPI, httpx, Pydantic v2. Contract: không bao giờ gây ra lỗi khi thất bại một phần.
Tác vụ: review và tái cấu trúc. Cung cấp phê bình → các diff tối thiểu → tái cấu trúc cuối cùng → tests.
Code:
```python
from fastapi import APIRouter
import httpx
router = APIRouter
@router.get("/users/{user_id}")
async def get_user(user_id: str):
async with httpx.AsyncClient as client:
profile = await client.get(f")
posts = await client.get(f")
return {"data": {"profile": profile.json, "posts": posts.json}}

Chấp nhận:

Xử lý mã không phải 200 từ một trong hai lệnh gọi mà không gây ra lỗi.

p95 < 100ms độ trễ được thêm vào ngoài các upstream; giữ cho các request đồng thời.

Thêm xác thực đầu vào cơ bản, timeout và thử lại với jitter.


Prompt này cung cấp cho Grok 4 công việc, các biện pháp bảo vệ và hình dạng đầu ra—để các đề xuất của nó dễ áp dụng.
---
## Từ Các Đề Xuất Thô Sơ Đến Code Sẵn Sàng Để Triển Khai: Một Vòng Lặp Lặp Lại
Đối xử với Grok 4 như một người lập trình cặp. Sử dụng một vòng lặp chặt chẽ:
1. Bắt đầu với code và các ràng buộc có thể tái tạo tối thiểu.
2. Yêu cầu phê bình + các diff có mục tiêu.
3. Áp dụng các diff cục bộ; chạy các tests/benchmark.
4. Dán các thất bại/đầu ra trở lại Grok 4 với: “Đây là trường hợp thất bại; điều chỉnh.”
5. Khóa các ràng buộc: “Không thay đổi API công khai. Giữ độ phức tạp O(n).”
6. Yêu cầu các tests và các trường hợp dựa trên thuộc tính.
Prompt lặp lại:
```text
Đây là các thất bại test và các benchmark. Giữ các ràng buộc trước đó. Đề xuất thay đổi nhỏ nhất để sửa tất cả các tests màu đỏ mà không phá vỡ API công khai. Chỉ trả về một diff thống nhất.

Làm Cho Các Đề Xuất Tái Cấu Trúc Có Thể Hành Động

Yêu cầu Grok 4:

Gắn thẻ mỗi đề xuất với mức độ nghiêm trọng (Cao/Trung bình/Thấp) và danh mục (Lỗi, Hiệu suất, Style, Bảo mật).

Cung cấp một dòng lý do cho mỗi đề xuất.

Bao gồm một snippet trước/sau nhanh chóng.

Cung cấp một kế hoạch migration nếu có rủi ro thay đổi phá vỡ.

Prompt add-on:

Chú thích mỗi đề xuất với: {mức độ nghiêm trọng, danh mục, lý do}. Bao gồm các snippet trước/sau và một kế hoạch migration một bước nếu hành vi có thể thay đổi.

Bảo Mật, Hiệu Suất và Kiểm Tra: Các Add‑On Prompt Có Mục Tiêu

Lăng kính bảo mật:

“Giả sử tất cả các đầu vào đều do kẻ tấn công kiểm soát. Xác định injection, SSRF, path traversal và phơi bày bí mật. Cung cấp các mẫu an toàn và các diff tối thiểu.”

Lăng kính hiệu suất:

“Báo cáo độ phức tạp hiện tại so với độ phức tạp được đề xuất. Làm nổi bật các điểm nóng và các lựa chọn thay thế rẻ hơn. Bao gồm một benchmark harness nhỏ.”

Lăng kính kiểm tra:

“Đề xuất unit tests, property-based tests và các trường hợp biên. Bao gồm các mock cho network/IO. Đảm bảo phạm vi của các đường dẫn thất bại.”

Các Điều Chỉnh Prompt Cụ Thể Theo Ngôn Ngữ

JavaScript/TypeScript:

Chỉ định các target tsconfig, môi trường Node/browser, tree-shaking bundler và các quy tắc ESLint/Prettier.

Yêu cầu JSDoc/TSDoc và discriminated union để có các type an toàn hơn.

Python:

Lưu ý target mypy, pydantic v1 so với v2, sync so với async và mức độ type hint.

Yêu cầu các fixture pytest và các property test thông qua hypothesis.

Java/Kotlin:

Gọi ra phiên bản JDK, các kỳ vọng về tính bất biến, các quy tắc sử dụng Lombok và chiến lược xử lý lỗi.

Yêu cầu các test JUnit 5 và các benchmark hint thông qua JMH.

Nhấn mạnh không phân bổ trên các hot path, lan truyền context.Context và gói lỗi với %w.

Yêu cầu các test dựa trên bảng và các flag dò tìm race.

Rust:

Chỉ định edition, chính sách code không an toàn và các flag tính năng. Yêu cầu các benchmark và các trường hợp proptest.

Nhận Đầu Ra Diff Tốt Hơn Từ Grok 4

Các model đôi khi ảo giác các đường dẫn file hoặc các dòng ngữ cảnh. Giảm ma sát với:

Trả về đầu ra dưới dạng một diff thống nhất với các đường dẫn file chính xác từ thư mục gốc repo này. Chỉ bao gồm các hunk đã thay đổi. Không có bình luận trong diff. Sau đó bao gồm một phần riêng cho các ghi chú.

Nếu diff vẫn còn lộn xộn, hãy hạn chế thêm:

Trả lời chính xác bằng hai block:
1) ```diff
...các thay đổi...

Ghi chú: danh sách gạch đầu dòng.


---
## Thực Thi Các Yêu Cầu Phi Chức Năng (NFR)
Nếu bạn cần đảm bảo về độ trễ, bộ nhớ hoặc khả năng tương thích, hãy đặt chúng trong prompt và yêu cầu Grok 4 tự kiểm tra:
```text
NFR: độ trễ p95 +< 20ms so với baseline, delta bộ nhớ < 5MB, không có dependency runtime mới, API công khai giống nhau.
Thêm một phần tự kiểm tra xác nhận từng NFR, với lý luận sơ bộ hoặc các ý tưởng microbenchmark.

Làm Cho Grok 4 Giải Thích Lý Luận Của Nó (Mà Không Trở Nên Dài Dòng)

Bạn muốn vừa đủ giải thích để tin tưởng đề xuất. Hãy thử:

Giải thích từng thay đổi trong một câu với một dòng hoặc snippet được trích dẫn. Nếu không chắc chắn, hãy đặt một câu hỏi làm rõ thay vì đoán.

Và cho phép rõ ràng các câu hỏi:

Nếu các yêu cầu không rõ ràng, hãy đặt tối đa 3 câu hỏi làm rõ trước khi tiếp tục.

Các Anti-Pattern: Tại Sao Prompt Của Bạn Có Thể Bị Lỗi

Các mục tiêu mơ hồ: “Vui lòng cải thiện điều này.”

Thiếu các ràng buộc: “Chắc chắn, thêm một dependency khổng lồ và phá vỡ CI.”

Không có tiêu chí chấp nhận: “Có vẻ ổn trên máy của tôi.”

Tường code không có ngữ cảnh: model không thể suy ra các ranh giới hoặc contract.

Kỳ vọng một lần: tinh chỉnh lặp đi lặp lại đánh bại các prompt một lần.

Sửa chúng bằng cách xác định mục tiêu, phạm vi, các ràng buộc, ngữ cảnh và các test chấp nhận.

Ví Dụ Prompt Tái Cấu Trúc Với Hình Dạng Đầu Ra

Vai trò: Kỹ sư TypeScript cấp cao.
Mục tiêu: cải thiện khả năng đọc và tính an toàn runtime mà không thay đổi API công khai.
Env: Node 20, TypeScript 5.4, Zod để xác thực, ESLint Airbnb, strictNullChecks.
Các ràng buộc: không có dependency runtime mới ngoài Zod, không có thay đổi phá vỡ, duy trì độ phức tạp O(n).
Tác vụ:
- Phê bình → Diff → Tái cấu trúc → Tests → Ghi chú.
- Gắn thẻ các vấn đề với {mức độ nghiêm trọng, danh mục, lý do}.
- Bao gồm một schema Zod để xác thực đầu vào và 4 unit tests.
Code:
```ts
export function parseUser(raw: any) {
if (!raw) return null
return {
id: raw.id || '0',
name: raw.name || 'Unknown',
age: parseInt(raw.age),
}
}


---
## Yêu Cầu Grok 4 Tôn Trọng Style và Kiến Trúc
Neo model bằng các quy tắc cụ thể:
```text
Style: Airbnb TS. Ưu tiên trả về sớm, tránh lồng sâu, sử dụng các type rõ ràng.
Kiến trúc: giữ các function thuần túy; không có side effect. Xác thực đầu vào ở các ranh giới.

Và yêu cầu một lần chạy linter:

Chạy một lần ESLint tinh thần và liệt kê các vi phạm mà bạn mong đợi, sau đó sửa chúng.

Biến Các Tái Cấu Trúc Thành Học Tập: Yêu Cầu Các Mẫu

Làm cho các cải tiến gắn bó bằng cách yêu cầu Grok 4 đặt tên cho mẫu và lý do tại sao nó phù hợp:

Đối với mỗi thay đổi, hãy đặt tên cho mẫu tái cấu trúc (ví dụ: Extract Function, Introduce Parameter Object) và giải thích thời điểm áp dụng nó trong codebase này.

Khắc Phục Sự Cố: Khi Grok 4 Bỏ Lỡ Mục Tiêu

Nếu nó phát minh ra các API: “Chỉ sử dụng các API được hiển thị trong code hoặc được xác nhận trong ngữ cảnh.”

Nếu nó tái cấu trúc quá mức: “Các diff tối thiểu trước; chỉ tái cấu trúc nếu cần thiết.”

Nếu nó bỏ qua các ràng buộc: “Hiển thị một tự kiểm tra đối với các ràng buộc trước khi trả về code.”

Nếu nó quá dài dòng: “Chỉ trả về diff và một bản tóm tắt 5 gạch đầu dòng.”

Nếu các tests không ổn định: “Đề xuất các test xác định và tránh các khẳng định dựa trên thời gian.”

Quy Trình Làm Việc Thực Tế: Từ PR Đến Hợp Nhất

Nhà phát triển mở một PR với các tạo tác prompt có mục tiêu: mục tiêu, các ràng buộc, ngữ cảnh, các test chấp nhận.

Dán diff + ngữ cảnh vào Grok 4 với Mẫu Vàng.

Áp dụng các diff tối thiểu, chạy lại CI.

Lặp lại với các log thất bại làm phản hồi.

Yêu cầu tái cấu trúc và các tests cuối cùng.

Thêm một comment tóm tắt với các đánh đổi và các ghi chú migration cho người review.

Điều này giữ con người kiểm soát, trong khi Grok 4 tăng tốc các phần tẻ nhạt: phát hiện, các sửa lỗi nhỏ và các tái cấu trúc có cấu trúc.

Nhân tiện: Tăng Tốc Vòng Lặp Này Với Sider.AI

Nếu quy trình làm việc của bạn kết hợp các chat prompt, ngữ cảnh code và các diff lặp đi lặp lại, thì điều đáng chú ý là các công cụ như Sider.ai tích hợp review code AI trực tiếp vào các pull request của bạn, cho phép bạn áp dụng các prompt như những prompt trên với ngữ cảnh nhận biết repository. Lợi ích là nền tảng chặt chẽ hơn: ít import ảo giác hơn, tham chiếu dòng tốt hơn và lặp lại nhanh hơn với các comment nội dòng.

Prompt được đề xuất để sử dụng bên trong một trợ lý nhận biết repo:

Chỉ sử dụng ngữ cảnh repo. Review các file đã thay đổi trong PR này để [mục tiêu]. Chú thích các phát hiện nội dòng với mức độ nghiêm trọng và lý do. Đề xuất các diff bảo tồn API công khai và các NFR. Chỉ bao gồm các tests chạm vào các đường dẫn đã thay đổi.

Những Điểm Chính

Xác định phạm vi, ý định, ngữ cảnh và các ràng buộc ngay từ đầu.

Yêu cầu phê bình → các diff tối thiểu → tái cấu trúc → các tests để giữ cho các thay đổi an toàn.

Sử dụng các tập hợp tùy chọn với đánh đổi cho các thay đổi nặng về thiết kế.

Mã hóa các NFR và yêu cầu Grok 4 tự kiểm tra.

Lặp lại nhanh chóng: chạy các tests, cung cấp phản hồi về các thất bại, lặp lại.

Sử dụng các công cụ nhận biết repo như Sider.AI để đặt cơ sở các đề xuất trong code thực.

Các Bước Tiếp Theo

Lưu Mẫu Prompt Vàng vào các snippet của bạn.

Xây dựng các biến thể cụ thể theo ngôn ngữ cho stack của bạn.

Hãy thử nó trên một PR nhỏ ngay hôm nay; đo xem bạn tiết kiệm được bao nhiêu chu kỳ review.

Thêm các test chấp nhận trong các prompt của bạn để thực thi các yếu tố không thể thương lượng.

Dần dần mở rộng sang các prompt hiệu suất và bảo mật khi các kiến thức cơ bản gắn bó.

FAQ

Câu hỏi 1: Cách tốt nhất để nhắc Grok 4 đánh giá code là gì? Sử dụng một lời nhắc có cấu trúc, xác định vai trò, mục tiêu, ràng buộc, môi trường và tiêu chí chấp nhận. Yêu cầu phê bình, các thay đổi tối thiểu, một lần tái cấu trúc cuối cùng, các bài kiểm tra và một phân tích ngắn gọn về sự đánh đổi.

Câu hỏi 2: Làm thế nào để nhận được các đề xuất tái cấu trúc chính xác từ Grok 4? Cung cấp ý định rõ ràng (ví dụ: dễ đọc hoặc hiệu suất), bao gồm ngữ cảnh như các interface và ràng buộc, đồng thời yêu cầu các tập hợp tùy chọn với ưu và nhược điểm. Thực thi các yêu cầu phi chức năng và yêu cầu tự kiểm tra.

Câu hỏi 3: Tôi có nên dán toàn bộ repository vào Grok 4 không? Không. Chia sẻ đoạn code nhỏ nhất có thể tái tạo với các interface và ràng buộc liên quan. Giữ cho các lời nhắc tập trung và lặp lại bằng cách cung cấp phản hồi về các lỗi kiểm tra và điểm chuẩn.

Câu hỏi 4: Làm cách nào để ngăn Grok 4 thay đổi các API công khai trong quá trình tái cấu trúc? Nêu rõ các ràng buộc rõ ràng như “không thay đổi API công khai”, cung cấp các ví dụ về đầu vào/đầu ra và yêu cầu mô hình xác nhận tuân thủ bằng cách tự kiểm tra trước khi trả về code.

Câu hỏi 5: Grok 4 có thể đề xuất các bài kiểm tra và điểm chuẩn không? Có. Yêu cầu nó bao gồm các unit test, các bài kiểm tra dựa trên thuộc tính và một benchmark harness nhỏ. Chỉ định framework kiểm tra và thời gian chạy để giữ cho các đề xuất có thể chạy được.