Giới thiệu: Nghệ thuật tạo prompt cho một mô hình nhỏ nhưng mạnh mẽ
Nếu bạn từng ước AI của mình giống một đồng đội tư duy nhanh nhạy hơn là một chuyên gia tư vấn chậm chạp, dài dòng, thì Claude Haiku 4.5 chính là mô hình dành cho bạn. Nó được thiết kế để có tốc độ, độ trễ thấp và hiệu quả chi phí — lý tưởng cho việc lặp lại nhanh chóng, khối lượng công việc lớn và vòng phản hồi chặt chẽ. Nhưng có một điều cần lưu ý: để có được kết quả vượt trội từ Haiku 4.5 không phải là viết các prompt dài hơn. Mà là viết những prompt sắc sảo hơn. Trong hướng dẫn này, chúng ta sẽ khám phá các chiến lược prompt tạo ra các đầu ra sắc nét, đáng tin cậy một cách nhất quán từ Claude Haiku 4.5 — và chỉ cho bạn cách điều chỉnh chúng cho mọi thứ, từ viết code đến tạo nội dung và phân tích đơn giản.
Điều gì khiến Claude Haiku 4.5 khác biệt — và tại sao điều đó lại quan trọng đối với việc tạo prompt
Claude Haiku 4.5 nằm trong tầng “mô hình nhỏ”, được xây dựng để có tốc độ và quy mô, đồng thời vẫn duy trì khả năng suy luận mạnh mẽ cho các tác vụ hàng ngày. Điều đó thay đổi cách bạn tạo prompt:
- Bạn sẽ nhận được kết quả tốt nhất với các hướng dẫn có cấu trúc, rõ ràng.
- Các prompt ngắn gọn, có tín hiệu cao sẽ tốt hơn các prompt dài dòng, lan man.
- Lý luận có giới hạn bước (“hãy suy nghĩ từng bước trong 3–5 bước”) giúp nó tập trung.
- Nó rất tốt cho các bản nháp nhanh, dàn ý và hỗ trợ quyết định với các ràng buộc rõ ràng.
Haiku 4.5 được thiết kế để tiết kiệm chi phí ở quy mô lớn, điều này khiến nó trở nên hoàn hảo để điều phối các quy trình làm việc nhiều lượt, chuyển đổi nội dung hàng loạt và tạo sinh tăng cường truy xuất (RAG) khi độ trễ là vấn đề quan trọng.
Lưu ý về phong cách: Bài viết này sử dụng phương pháp Tiếp cận Thực tế & Hướng đến Giải pháp — được tối ưu hóa để sử dụng ngay lập tức trong các dự án thực tế.
Các quy tắc vàng cho các prompt của Claude Haiku 4.5
- Viết prompt ngắn nhất mà vẫn loại bỏ sự mơ hồ
- Tệ: “Tóm tắt báo cáo này.”
- Tốt hơn: “Tóm tắt báo cáo này cho một người quản lý sản phẩm. 5 gạch đầu dòng. Bao gồm: rủi ro, sự phụ thuộc, các bước tiếp theo. Tối đa 120 từ.”
Tại sao nó hiệu quả: Haiku 4.5 phát triển mạnh khi các ràng buộc của bạn rõ ràng. Chỉ định đối tượng, định dạng, độ dài và bất kỳ yếu tố bắt buộc nào.
- Giữ vai trò và mục tiêu rõ ràng trong thiết lập kiểu hệ thống
- Ví dụ: “Bạn là một trợ lý kỹ thuật ngắn gọn. Mục tiêu: (1) trả lời chính xác, (2) giảm thiểu token, (3) chỉ hiển thị dàn ý suy luận 3 bước khi được yêu cầu.”
Tại sao nó hiệu quả: Vai trò + mục tiêu rõ ràng hướng dẫn giải mã, giảm trôi và cải thiện khả năng lặp lại trên các lần gọi.
- Ưu tiên danh sách kiểm tra hơn cách diễn đạt mở
- Ví dụ cho việc xem xét code: “Xem xét về: (a) tính chính xác, (b) tính bảo mật, (c) tính dễ đọc, (d) phạm vi kiểm thử. Đầu ra: đạt/không đạt cho mỗi mục với giải thích 1–2 dòng.”
Tại sao nó hiệu quả: Danh sách kiểm tra nén các tác vụ phức tạp thành các tác vụ con đáng tin cậy, có thể xác minh được.
- Sử dụng tư duy có giới hạn bước
- Ví dụ: “Hãy suy nghĩ tối đa trong 4 bước, sau đó chỉ đưa ra câu trả lời cuối cùng.”
Tại sao nó hiệu quả: Bạn có được lý luận tập trung mà không bị dài dòng quá mức.
- Yêu cầu đầu ra có cấu trúc (luôn luôn!)
- Ví dụ: “Trả về JSON với các khóa: decision, rationale, risks, next_steps. Không có văn bản thừa.”
Tại sao nó hiệu quả: Cấu trúc cho phép tự động hóa downstream, ngăn chặn sự phù phiếm và giữ cho chi phí có thể dự đoán được.
- Neo mô hình bằng các ví dụ mẫu
- Các ví dụ few-shot phải: ngắn gọn, mang tính đại diện và phù hợp với phong cách mong muốn của bạn.
- Mô hình: Hướng dẫn → 1–2 ví dụ mẫu ngắn gọn → Đầu vào mới.
- Mẹo: Giữ cho các ví dụ mẫu cụ thể theo miền (ví dụ: giọng điệu thương hiệu của bạn, kiểu code của bạn).
- Hạn chế giọng văn, độ dài và định dạng
- “Giọng văn: trung lập-chuyên nghiệp.”
- “Định dạng: 5 gạch đầu dòng, mỗi gạch ≤18 từ.”
- Đối với code: “Mục tiêu: Python 3.11, Pydantic v2. Sử dụng gợi ý kiểu. Bao gồm một khối kiểm tra.”
- Dạy nó cách nói “Tôi không biết”
- Thêm: “Nếu thiếu dữ liệu hoặc mơ hồ, trước tiên hãy đặt một câu hỏi làm rõ duy nhất. Nếu vẫn không chắc chắn, hãy nói ‘không rõ’.”
Tại sao nó hiệu quả: Giảm các câu trả lời sai một cách tự tin và giữ cho các vòng lặp hiệu quả.
- Sử dụng truy xuất và chuyển các đoạn trích liên quan, không phải toàn bộ văn bản
- Chỉ cung cấp 1–3 đoạn liên quan hàng đầu.
- Cắt bớt văn bản soạn sẵn để tối đa hóa mật độ tín hiệu.
- Gắn nhãn các đoạn trích: [Policy], [Excerpt], [Email], [Spec].
- Tách biệt chính sách khỏi tác vụ
- Chính sách: “Không bao giờ xuất PII, giữ dưới 150 token, trích dẫn nguồn nếu được cung cấp.”
- Tác vụ của người dùng: “Tóm tắt chuỗi email cho khách hàng tiềm năng bán hàng.”
Tại sao nó hiệu quả: Kiến trúc prompt sạch hơn, dễ bảo trì hơn.
Các mẫu prompt hoạt động nhất quán
Mẫu A: “Tóm tắt chặt chẽ”
Sử dụng khi bạn cần tốc độ và tính nhất quán cho các tác vụ thông thường.
Template:
- Vai trò: “Bạn là một [vai trò].”
- Mục tiêu: “Mục tiêu của bạn là [mục tiêu].”
- Ràng buộc: đối tượng, độ dài, giọng văn, định dạng.
- Rubric đánh giá: 2–4 tiêu chí gạch đầu dòng.
- Dấu phân cách đầu vào: “Đầu vào bắt đầu/kết thúc bằng ===.”
- Lược đồ đầu ra: “Trả về [định dạng]. Không có văn bản thừa.”
Mẫu B: “Phê bình rồi Tạo”
Để có các bản nháp chất lượng cao hơn với số lượng token thừa tối thiểu.
- Bước 1 (nội bộ): “Âm thầm đánh giá mức độ liên quan, khoảng trống và rủi ro trong 3 gạch đầu dòng.”
- Bước 2 (đầu ra): “Tạo ra bản nháp giải quyết những vấn đề đó.”
- Để giữ cho đầu ra sạch, hãy chỉ định: “Không hiển thị phê bình; chỉ áp dụng nó.”
Mẫu C: “So sánh và Chọn”
Sử dụng khi lựa chọn là tác vụ.
- “Với các tùy chọn A–D, hãy chấm điểm về: độ chính xác (40), độ rõ ràng (30), tuân thủ (30). Trả về người chiến thắng và một lời giải thích 2 câu.”
Mẫu D: “Chuỗi kiểm tra”
Để đảm bảo an toàn, tuân thủ hoặc tuân thủ chính sách.
- “Trước khi trả lời, hãy xác minh: (1) được chính sách cho phép, (2) nằm trong phạm vi, (3) không thiếu thông tin. Nếu bất kỳ điều nào không thành công, hãy dừng lại và đặt 1 câu hỏi làm rõ.”
Mẫu E: “Chỉnh sửa Delta”
Để chỉnh sửa văn bản hiện có.
- “Chỉ trả về diff tối thiểu: ‘Thay đổi X thành Y vì Z.’ Giữ nguyên kiểu hiện tại. Tối đa 8 thay đổi.”
Mẫu F: “Giàn giáo Code”
- “Tạo một baseline tối thiểu, có thể chạy được với TODO. Bao gồm các kiểm thử. Giữ các hàm ≤30 dòng. Thêm docstring và gợi ý kiểu.”
Các ví dụ có tác động cao cho các quy trình làm việc hàng ngày
Tóm tắt nội dung
Prompt:
“Bạn là một nhà phân tích ngắn gọn. Tóm tắt báo cáo sau cho một nhà lãnh đạo sản phẩm.
- Đầu ra: 5 gạch đầu dòng (≤18 từ mỗi gạch) cho: kết quả, rủi ro, sự phụ thuộc, các bước tiếp theo, số liệu.
- Nếu thiếu dữ liệu, hãy viết ‘không rõ’ cho gạch đó.
===
[Dán báo cáo]
===”
Soạn email
Prompt:
“Bạn là một trợ lý chuyên nghiệp. Soạn một thư trả lời: ngắn gọn, ấm áp, quyết đoán. Bao gồm: (1) đánh giá cao, (2) 1 quyết định rõ ràng, (3) 1 yêu cầu.
- Tối đa 120 từ. Không có lời chào tạm biệt; tôi sẽ thêm chúng.”
Tạo SQL từ lược đồ
Prompt:
“Bạn là một trợ lý SQL. Với một lược đồ Postgres, hãy viết một truy vấn duy nhất.
- Ràng buộc: ANSI SQL, không có CTE trừ khi cần thiết, sử dụng index nếu được ngụ ý.
- Đầu ra: chỉ khối code. Sau đó là giải thích 1 câu.
Lược đồ:
===
[Lược đồ]
===
Tác vụ: [Câu hỏi]”
Xem xét code
Prompt:
“Bạn là một người xem xét code có ý thức về bảo mật.
- Kiểm tra: tính chính xác, tính bảo mật, tính dễ đọc, các kiểm thử.
- Đầu ra: Mảng JSON gồm các phát hiện với các trường: severity, file, line, issue, fix.
- Tối đa 6 phát hiện. Nếu không có, hãy trả về [].
===
[Diff hoặc file]
===”
Trả lời câu hỏi RAG
Prompt:
“Bạn là một người phản hồi có cơ sở. CHỈ sử dụng các nguồn được cung cấp.
- Trích dẫn ID nguồn trong ngoặc vuông như [S1]. Nếu câu trả lời không có trong nguồn, hãy nói ‘không tìm thấy trong nguồn’.
- Đầu ra: 2–4 câu; sau đó là 3 gạch đầu dòng có nhãn ‘Trích dẫn’.
Nguồn:
[S1] …
[S2] …
Câu hỏi: …”
Rubric đánh giá để đưa vào prompt
- Độ chính xác trước tiên: “Phạt các tuyên bố không được hỗ trợ. Ưu tiên ‘không rõ’ hơn là đoán.”
- Tính ngắn gọn: “Các câu trả lời trên 150 token là không tuân thủ.”
- Cấu trúc: “Không đạt các câu trả lời không khớp với lược đồ JSON.”
- An toàn: “Từ chối các tác vụ bao gồm thông tin xác thực, bí mật hoặc PII.”
Các thủ thuật để có độ tin cậy và độ trễ thấp
- Sử dụng dấu phân cách rõ ràng (===, <<<json>>>). Ngăn chặn sự trộn lẫn ngẫu nhiên giữa các phần.
- Gắn nhãn mọi thứ. Haiku 4.5 tôn trọng các nhãn như [Context], [Policy], [Task], [Output].
- Chỉ định ngân sách token: “Mục tiêu 120–180 token; không bao giờ vượt quá 220.”
- Ưu tiên các từ đơn giản. Tránh ngôn ngữ tượng hình trừ khi cần thiết.
- Tránh các hướng dẫn nhiều bước trong một câu; chia thành các bước được đánh số.
Các cạm bẫy phổ biến — và cách khắc phục chúng
- Cạm bẫy: Mục tiêu mơ hồ.
Khắc phục: Nêu rõ mục tiêu + đối tượng + ràng buộc.
- Cạm bẫy: Context quá dài.
Khắc phục: Chỉ chuyển 1–3 đoạn liên quan nhất.
- Cạm bẫy: Đầu ra không có cấu trúc.
Khắc phục: Bắt buộc lược đồ JSON hoặc gạch đầu dòng.
- Cạm bẫy: Nguồn bịa đặt.
Khắc phục: Hướng dẫn: “Chỉ trích dẫn các nguồn được cung cấp; nếu không, hãy nói ‘không tìm thấy trong nguồn.’”
- Cạm bẫy: Câu trả lời không quyết đoán.
Khắc phục: Cung cấp rubric quyết định và yêu cầu một lựa chọn duy nhất.
Nâng cao: Xây dựng thư viện prompt cho Haiku 4.5
- Tạo các macro có thể tái sử dụng (ví dụ: Tone: Neutral, Output: JSON Schema A, Safety: Basic).
- Phiên bản prompt với tên ngữ nghĩa (email_draft_v3_compact).
- AB-test các biến thể: thay đổi một biến tại một thời điểm (định dạng so với giọng văn so với rubric).
- Duy trì một “bảo tàng thất bại” gồm các prompt tạo ra kết quả tồi tệ và lý do.
Khi nào nên chọn Haiku 4.5 so với các mô hình lớn hơn
- Chọn Haiku 4.5 khi bạn cần: tốc độ, kiểm soát chi phí, định tuyến tác vụ khối lượng lớn, đầu ra có cấu trúc hoặc các vòng lặp lặp đi lặp lại.
- Chọn các mô hình lớn hơn khi bạn cần: lý luận đa bước sâu sắc, tổng hợp mới trên các tài liệu nhiễu hoặc tạo code phức tạp trên các codebase lớn.
- Mô hình hỗn hợp: Sử dụng Haiku 4.5 để phân loại, chia nhỏ và soạn thảo; leo thang các trường hợp khó lên một mô hình lớn hơn.
Nhân tiện: Nếu bạn đang điều phối việc tạo prompt nhiều bước, một không gian làm việc AI hỗ trợ các template đã lưu, bộ nhớ nhiều lượt cho mỗi dự án và thiết lập RAG dễ dàng có thể giảm đáng kể thời gian lặp lại. Các công cụ cho phép bạn chuẩn hóa vai trò, ràng buộc và lược đồ đầu ra trên các prompt giúp bạn mở rộng quy mô các phương pháp hay nhất này trên toàn nhóm.
Các template prompt sao chép-dán mà bạn có thể điều chỉnh ngay hôm nay
- Tóm tắt siêu ngắn gọn
“Bạn là một [vai trò]. Mục tiêu: [mục tiêu].
Đối tượng: [đối tượng]. Định dạng: [định dạng]. Độ dài: [N từ/token].
Ràng buộc: [quy tắc].
Chỉ trả về đầu ra cuối cùng.”
- Bản ghi nhớ quyết định
“Bạn là một nhà phân tích sản phẩm. Soạn một bản ghi nhớ quyết định.
Bao gồm các phần: Context (2 câu), Options (3 gạch đầu dòng), Risks (3 gạch đầu dòng), Recommendation (1 đoạn), Next steps (3 gạch đầu dòng). Độ dài ≤180 từ.”
- Làm rõ rồi trả lời
“Bạn là một trợ lý cẩn thận. Nếu tác vụ thiếu 1 thông tin quan trọng, hãy đặt 1 câu hỏi làm rõ. Nếu không, hãy trả lời trực tiếp trong ≤120 từ.”
- Trình kiểm tra QA JSON
“Bạn là một người xác minh. Xác thực câu trả lời sau với câu hỏi.
Trả về JSON: { valid: boolean, reason: string, missing: string[] }.”
- Người phản hồi có cơ sở an toàn
“Bạn có cơ sở. Chỉ sử dụng các nguồn được cung cấp. Nếu không được hỗ trợ, hãy nói ‘không rõ.’ Trích dẫn ID nguồn trong ngoặc vuông.”
Những điểm chính
- Hãy cụ thể, không dài dòng: nén ý định và ràng buộc.
- Cấu trúc chiến thắng: yêu cầu lược đồ, danh sách hoặc JSON.
- Giới hạn tư duy: giới hạn các bước, token và phạm vi.
- Ưu tiên các ví dụ mẫu: few-shot ngắn gọn, có mục tiêu.
- Tách biệt chính sách khỏi tác vụ: các prompt mô-đun mở rộng quy mô tốt hơn.
- Sử dụng Haiku 4.5 cho các tác vụ nhạy cảm về tốc độ, khối lượng lớn, có cấu trúc — và chỉ leo thang khi cần thiết.
Các bước tiếp theo
- Biến các tác vụ có tần suất cao nhất của bạn thành các template prompt.
- Thêm danh sách kiểm tra và lược đồ đầu ra vào mọi prompt.
- AB-test hai phiên bản của mỗi prompt trong một tuần và áp dụng phiên bản chiến thắng.
- Xây dựng một “thư viện prompt” đơn giản mà toàn bộ nhóm của bạn có thể tái sử dụng.
Câu hỏi thường gặp
Câu hỏi 1: Những prompt nào hoạt động tốt nhất với Claude Haiku 4.5?
Các prompt ngắn gọn, cụ thể với vai trò, ràng buộc và đầu ra có cấu trúc rõ ràng. Sử dụng danh sách kiểm tra, giới hạn bước và lược đồ JSON để tăng độ chính xác và tính nhất quán.
Câu hỏi 2: Làm cách nào để giảm ảo giác với Haiku 4.5?
Neo mô hình chỉ với các đoạn liên quan hàng đầu và yêu cầu trích dẫn từ các nguồn được cung cấp. Nếu thiếu bằng chứng, hãy hướng dẫn nó nói “không rõ”.
Câu hỏi 3: Tôi có nên sử dụng các ví dụ few-shot với Haiku 4.5 không?
Có — cung cấp 1–2 ví dụ mẫu ngắn gọn phù hợp với kiểu và cấu trúc mong muốn của bạn. Giữ cho các ví dụ cụ thể theo miền và ngắn hơn đầu ra dự kiến của bạn.
Câu hỏi 4: Khi nào tôi nên chọn Haiku 4.5 thay vì một mô hình lớn hơn?
Chọn Haiku 4.5 cho các tác vụ nhanh, nhạy cảm về chi phí, được hưởng lợi từ cấu trúc: tóm tắt, trả lời RAG, danh sách kiểm tra xem xét code và soạn thảo. Sử dụng các mô hình lớn hơn để lý luận đa bước sâu sắc hơn.
Câu hỏi 5: Định dạng đầu ra lý tưởng cho quy trình làm việc tự động hóa là gì?
JSON hoặc các gạch đầu dòng có cấu trúc chặt chẽ. Xác định các khóa chính xác, giới hạn độ dài và quy tắc tuân thủ để đầu ra phù hợp gọn gàng vào các hệ thống downstream.