What is MetaGPT and how does it work?

MetaGPT is a multi-agent framework where role‑based agents (PM, Architect, Engineer, QA) collaborate to produce structured outputs like PRDs, designs, and code. It coordinates tasks, shares context, and lets you plug in local or cloud LLMs for each role.

How do I install and set up MetaGPT?

Install via pip or from source, configure your LLM (OpenAI, Anthropic, or local via Ollama), and set environment variables for model access. Then define agents, create a team, and run a task to generate artifacts like PRDs and code.

Can I use MetaGPT with local LLMs like DeepSeek or Llama?

Yes. Using Ollama, you can run models like DeepSeek‑Coder or Llama locally and point MetaGPT to the local endpoint. This reduces cost and improves privacy for sensitive projects.

What are best practices for prompts in MetaGPT?

Use structured briefs with objectives, users, constraints, success metrics, and deliverables. Assign each agent a clear mandate and provide schema‑based output formats (e.g., JSON/YAML) to reduce ambiguity.

How do I prevent agents from looping or producing low-quality code?

Add step limits and review gates, enforce output schemas, and use specialized models per role (e.g., reasoning‑strong for Architect, code‑strong for Engineer). Include a Tester/Linter agent and run unit tests automatically.

Cách Sử Dụng MetaGPT: Hướng Dẫn Thực Hành về Quy Trình Làm Việc Đa Tác Tử

Nếu bạn từng mong muốn AI của mình có thể hoạt động như một nhóm sản phẩm được phối hợp nhịp nhàng—PM, kiến trúc sư, kỹ sư, người kiểm thử—làm việc song song hướng tới một mục tiêu chung, thì MetaGPT là khuôn khổ giúp điều đó xảy ra. Trong hướng dẫn thực tế, hướng đến giải pháp này, chúng ta sẽ cùng nhau tìm hiểu cách sử dụng MetaGPT từng bước, từ cài đặt đến xây dựng quy trình làm việc đa tác tử, cùng với các phương pháp hay nhất, mẹo khắc phục sự cố và các ví dụ thực tế mà bạn có thể áp dụng ngay hôm nay.

Đến cuối cùng, bạn sẽ có thể cài đặt MetaGPT, khởi động một pipeline đa tác tử, viết các prompt (lời nhắc) tốt hơn, mở rộng nó bằng các công cụ và LLM, và cho ra một sản phẩm hữu ích—một cách nhanh chóng.

MetaGPT Là Gì (và Tại Sao Nó Quan Trọng)

MetaGPT là một khuôn khổ đa tác tử được thiết kế để điều phối các tác tử chuyên biệt—như người quản lý sản phẩm, kiến trúc sư, người viết code và người kiểm thử—để họ có thể giải quyết các tác vụ phức tạp một cách hợp tác. Thay vì một AI nguyên khối làm mọi thứ, MetaGPT tạo ra một hệ thống các tác tử dựa trên vai trò với ngữ cảnh, bộ nhớ và định tuyến tác vụ được chia sẻ. Kết quả: các dự án chuyển từ ý tưởng thành sản phẩm có thể giao được với ít sự can thiệp thủ công hơn và tính song song cao hơn.

Vai trò đa tác tử: Xác định các trách nhiệm riêng biệt (ví dụ: soạn thảo PRD, thiết kế hệ thống, viết code).

Các tạo tác được chia sẻ: Các tác tử chuyển các đầu ra có cấu trúc (PRD → thiết kế → code → các bài kiểm thử).

LLM có thể cắm vào: Chọn các mô hình (cục bộ hoặc đám mây) tùy thuộc vào chi phí, tốc độ và quyền riêng tư.

Các công cụ có thể mở rộng: Thêm truy xuất, thực thi code hoặc API bên ngoài.

Để có một cái nhìn tổng quan tốt và "tại sao nó hoạt động", hãy xem các hướng dẫn độc lập phân tích cách MetaGPT điều phối các nhóm và tạo code. Đối với một quy trình làm việc cụ thể (tự động hóa yêu cầu sản phẩm với các mô hình cục bộ), hướng dẫn của IBM cho thấy MetaGPT kết hợp với các mô hình Ollama và DeepSeek để tạo ra PRD từ đầu đến cuối.

Bắt Đầu Nhanh: Cài Đặt MetaGPT trong 15 Phút

Đây là một thiết lập sạch hoạt động trên macOS, Linux và WSL.

1) Điều Kiện Tiên Quyết

Python 3.10+ và pip

Node.js/npm (cho một số công cụ và tích hợp nếu bạn định thử nghiệm)

Tùy chọn: Docker (cho các môi trường có thể tái tạo) và Ollama (cho LLM cục bộ)

Xác minh môi trường của bạn:

python --version
pip --version
node -v
npm -v

Nếu bạn chọn tuyến LLM cục bộ, hãy cài đặt Ollama và kéo một mô hình (ví dụ: DeepSeek hoặc các biến thể Llama 3), như được minh họa trong ví dụ tự động hóa PRD.

2) Cài Đặt MetaGPT

# Lựa chọn A: Từ PyPI (nếu có)
pip install metagpt
# Lựa chọn B: Từ mã nguồn (khuyến nghị để theo dõi các ví dụ)
git clone <org>/MetaGPT.git
cd MetaGPT
pip install -r requirements.txt

Kiểm tra README của dự án để biết các bước cài đặt mới nhất và các tùy chọn bổ sung. Các hướng dẫn của cộng đồng cũng phác thảo các bước cục bộ bao gồm kiểm tra npm và thiết lập Python.

3) Cấu Hình LLM Của Bạn

LLM Đám Mây: Xuất các khóa (ví dụ: OPENAI_API_KEY, ANTHROPIC_API_KEY).

LLM Cục Bộ: Chạy ollama serve và chọn một mô hình; trỏ MetaGPT đến endpoint cục bộ của bạn.

Ví dụ .env (điều chỉnh cho nhà cung cấp của bạn):

OPENAI_API_KEY=sk-...
MODEL_NAME=gpt-4o-mini
# Hoặc cục bộ
LLM_ENDPOINT=
MODEL_NAME=deepseek-coder

Quy Trình Làm Việc Đa Tác Tử Đầu Tiên Của Bạn

Hãy xây dựng một pipeline tối thiểu "ý tưởng → PRD → thiết kế → code". Bạn có thể điều chỉnh điều này cho các ứng dụng web, script hoặc công cụ dữ liệu.

Luồng Khái Niệm

Tác Tử Quản Lý Sản Phẩm: Làm rõ các mục tiêu, người dùng và số liệu thành công; viết PRD.

Tác Tử Kiến Trúc Sư: Đề xuất thiết kế hệ thống, API, các đánh đổi.

Tác Tử Kỹ Sư: Viết code khung dựa trên thiết kế.

Tác Tử QA/Người Đánh Giá: Đánh giá code, viết các bài kiểm thử, gắn cờ các vấn đề.

Ví Dụ Khung Sườn (Python)

from metagpt import MetaTeam, Agent, Role
from metagpt.llms import LLM
# 1) Xác định backend LLM
llm = LLM(model_name="gpt-4o-mini") # hoặc trỏ đến mô hình cục bộ
# 2) Xác định các tác tử dành riêng cho vai trò
pm = Agent(name="PM", role=Role.PRODUCT_MANAGER, llm=llm)
arch = Agent(name="Architect", role=Role.ARCHITECT, llm=llm)
eng = Agent(name="Engineer", role=Role.ENGINEER, llm=llm)
qa = Agent(name="QA", role=Role.QA, llm=llm)
# 3) Tạo một nhóm với bộ nhớ/ngữ cảnh được chia sẻ
team = MetaTeam(agents=.
---
## Viết Các Prompt Mà Đa Tác Tử Hiểu Được
MetaGPT tỏa sáng khi bạn cung cấp cho nó các hướng dẫn có cấu trúc, nhận biết vai trò. Hãy nghĩ như một người quản lý viết một bản tóm tắt cho bốn chuyên gia.
- Mục tiêu: Một câu nêu rõ mục tiêu cuối cùng.
- Người dùng và Phạm vi: Ai được hưởng lợi và cái gì trong/ngoài.
- Ràng buộc: Các ranh giới rõ ràng (stack, độ trễ, quyền riêng tư, ngân sách).
- Số liệu Thành công: Cái gì trông "tốt".
- Các sản phẩm có thể giao được: Các tạo tác rõ ràng (PRD, sơ đồ, bố cục repo, các bài kiểm thử).
Ví dụ bản tóm tắt:
```yaml
objective: Xây dựng một CLI Python đọc một PDF và tạo ra một bản tóm tắt 1 trang bằng Markdown.
users: .
---
## Các Phương Pháp Hay Nhất Để Có Kết Quả Đáng Tin Cậy
- Bắt đầu nhỏ, sau đó mở rộng: Xác thực pipeline trên một thông số kỹ thuật tối thiểu trước các dự án lớn.
- Một vai trò, một nhiệm vụ: Tránh trách nhiệm chồng chéo để giảm sự nhầm lẫn.
- Sử dụng danh sách kiểm tra: Cung cấp cho mỗi tác tử một rubric (tiêu chí chấp nhận) cho đầu ra của họ.
- Đánh giá cổng: Thêm một vai trò Người Đánh Giá/Trưởng Nhóm để phê duyệt hoặc gửi lại công việc.
- Giữ cho các prompt có cấu trúc: Các lược đồ YAML/JSON làm cho đầu ra xác định hơn.
- Lưu trữ các tạo tác: Lưu PRD/thiết kế/code vào đĩa để theo dõi và chạy lại.
- Ghép nối cục bộ + đám mây: Sử dụng các mô hình cục bộ cho bản nháp; leo thang các bước khó khăn lên một mô hình đám mây mạnh hơn.
- Ràng buộc ngân sách: Đặt giới hạn token và kiểm tra chi phí cho từng giai đoạn.
---
## Dự Án Ví Dụ: Tự Động Tạo PRD cho Các Yêu Cầu Tính Năng
Mục tiêu: Chuyển đổi một yêu cầu tính năng thô thành một PRD bóng bẩy với các user story và tiêu chí chấp nhận.
Luồng:
1. Phân tích cú pháp đầu vào: Chuẩn hóa yêu cầu và trích xuất ngữ cảnh (persona người dùng, các điểm khó khăn).
2. Tác tử PM: Soạn thảo PRD với các mục tiêu, phi mục tiêu, KPI.
3. Tác tử Kiến trúc sư: Đề xuất các tùy chọn giải pháp với ưu/nhược điểm.
4. Tác tử Người Đánh Giá: Đảm bảo sự rõ ràng, các rủi ro và sự phụ thuộc được ghi lại.
Tại sao nó hoạt động: Việc chuyển giao có cấu trúc phản ánh các nhóm sản phẩm thực tế và buộc phải rõ ràng. Hướng dẫn của IBM trình bày chi tiết một luồng PRD đa tác tử tương tự với các mô hình cục bộ mà bạn có thể sao chép.
---
## Khắc Phục Các Sự Cố Thường Gặp
- Các tác tử lặp hoặc đình trệ
- Giảm phạm vi và thêm các sản phẩm có thể giao được rõ ràng.
- Thêm thời gian chờ và giới hạn bước; bật đánh giá cổng.
- Đầu ra lộn xộn hoặc không có cấu trúc
- Thực thi các lược đồ với JSON/YAML; nhắc với các ví dụ định dạng.
- Thêm một tác tử "Người Định Dạng" có công việc duy nhất là chuẩn hóa đầu ra.
- Code chất lượng thấp
- Sử dụng một mô hình mạnh về code (ví dụ: DeepSeek‑Coder cục bộ, hoặc một mô hình đám mây hàng đầu) cho Kỹ Sư.
- Thêm một tác tử Người Kiểm Thử/Linter; chạy các unit test tự động.
- Chi phí cao
- Sử dụng các mô hình cục bộ để soạn thảo; chỉ leo thang lên các LLM cao cấp để đánh bóng cuối cùng.
- Giới hạn cửa sổ ngữ cảnh; chia nhỏ các tạo tác và truy xuất khi cần.
- Mô hình không phù hợp
- Điều chỉnh các mô hình trên mỗi vai trò (lý luận so với viết code so với chỉnh sửa) và cài đặt nhiệt độ.
Các tổng quan độc lập làm nổi bật sức mạnh của MetaGPT trong việc tạo code và cách tránh các cạm bẫy với các prompt và công cụ tốt hơn.
---
## Đi Sâu Hơn: Các Mẫu Nâng Cao
- Tạo Sinh Tăng Cường Truy Xuất (RAG)
- Cung cấp cho nhóm của bạn một "cơ sở kiến thức" dự án gồm các PRD, thiết kế và code trước đây.
- Cho phép PM/Kiến Trúc Sư truy xuất ngữ cảnh liên quan trước khi viết.
- Các hành động theo kiểu Toolformer
- Cho phép Kỹ Sư chạy các lệnh shell, tạo các file và thực thi các bài kiểm thử.
- Các dự án đa bên thuê
- Chạy nhiều nhóm song song để khám phá giải pháp A/B.
- Kiểm soát sự tham gia của con người
- Chèn các bước phê duyệt (ví dụ: PRD → đánh giá của con người → tiếp tục).
- Khai thác đánh giá
- Tự động chấm điểm đầu ra (ví dụ: linting, độ bao phủ của bài kiểm thử, điểm số dễ đọc) và gửi kết quả trở lại cho một tác tử Huấn Luyện.
---
## Các Trường Hợp Sử Dụng Thực Tế Mà Bạn Có Thể Xây Dựng Trong Tuần Này
- Ý tưởng Khởi Nghiệp → PRD → Website Nguyên Mẫu
- Công cụ dữ liệu nội bộ với CLI và tài liệu
- Thiết kế API với các thư viện client bằng nhiều ngôn ngữ
- Pipeline QA tạo ra các bài kiểm thử từ các ticket Jira
- Trình tạo blog kỹ thuật với các mẫu code và sơ đồ
Các bài viết của cộng đồng cho thấy khả năng của MetaGPT trong việc biến đầu vào tối thiểu thành các tạo tác có cấu trúc, chất lượng cao một cách nhanh chóng, đặc biệt là đối với công việc kỹ thuật và sản phẩm.
---
## Tiện thể: Tăng tốc ý tưởng và lặp lại với [Sider.AI](https://sider.ai)
Điều đáng chú ý: nếu bạn đang soạn thảo prompt, đánh giá các tạo tác hoặc lặp lại các thông số kỹ thuật, một trợ lý đa năng như [Sider.AI](https://sider.ai) có thể giúp bạn tạo mẫu các bản tóm tắt, so sánh các giải pháp thay thế và tinh chỉnh đầu ra trước khi giao chúng cho MetaGPT. Nó đặc biệt hữu ích cho việc động não các user story, tiêu chí chấp nhận và các trường hợp kiểm thử mà các tác tử của bạn có thể sử dụng. Khám phá [Sider.AI](https://sider.ai) tại https://sider.ai./
---
## Kế Hoạch Hành Động: 60 Phút Tiếp Theo Của Bạn
- 10 phút: Cài đặt MetaGPT và thiết lập LLM của bạn (cục bộ hoặc đám mây).
- 15 phút: Tạo một nhóm 4 vai trò (PM, Kiến Trúc Sư, Kỹ Sư, QA) và chạy một dự án nhỏ.
- 15 phút: Thêm các lược đồ cho PRD/thiết kế và một cổng Người Đánh Giá.
- 20 phút: Hoán đổi các mô hình trên mỗi vai trò; thêm một công cụ chạy thử nghiệm cho Kỹ Sư/QA.
Giao một tạo tác đầu tiên ngay hôm nay. Lặp lại vào ngày mai.
---
## Những Điểm Chính
- MetaGPT cho phép bạn viết script một nhóm các tác tử chuyên biệt làm việc cùng nhau trên các tác vụ phức tạp.
- Thành công phụ thuộc vào các prompt có cấu trúc, các sản phẩm có thể giao được rõ ràng và đánh giá cổng.
- Kết hợp các mô hình cục bộ và đám mây để cân bằng chi phí, quyền riêng tư và chất lượng.
- Bắt đầu với các pipeline nhỏ (PRD → thiết kế → code → các bài kiểm thử), sau đó mở rộng sang các công cụ và quản trị phong phú hơn.
Để biết thêm ngữ cảnh và các ví dụ thực hành, hãy xem các hướng dẫn và bài hướng dẫn này.
### Câu Hỏi Thường Gặp
Câu hỏi 1: MetaGPT là gì và nó hoạt động như thế nào?
MetaGPT là một khuôn khổ đa tác tử, nơi các tác tử dựa trên vai trò (PM, Kiến Trúc Sư, Kỹ Sư, QA) cộng tác để tạo ra các đầu ra có cấu trúc như PRD, thiết kế và code. Nó điều phối các tác vụ, chia sẻ ngữ cảnh và cho phép bạn cắm các LLM cục bộ hoặc đám mây cho mỗi vai trò.
Câu hỏi 2: Làm cách nào để cài đặt và thiết lập MetaGPT?
Cài đặt qua pip hoặc từ mã nguồn, cấu hình LLM của bạn (OpenAI, Anthropic hoặc cục bộ qua Ollama) và đặt các biến môi trường để truy cập mô hình. Sau đó, xác định các tác tử, tạo một nhóm và chạy một tác vụ để tạo ra các tạo tác như PRD và code.
Câu hỏi 3: Tôi có thể sử dụng MetaGPT với các LLM cục bộ như DeepSeek hoặc Llama không?
Có. Sử dụng Ollama, bạn có thể chạy các mô hình như DeepSeek‑Coder hoặc Llama cục bộ và trỏ MetaGPT đến endpoint cục bộ. Điều này làm giảm chi phí và cải thiện quyền riêng tư cho các dự án nhạy cảm.
Câu hỏi 4: Các phương pháp hay nhất cho prompt trong MetaGPT là gì?
Sử dụng các bản tóm tắt có cấu trúc với các mục tiêu, người dùng, ràng buộc, số liệu thành công và các sản phẩm có thể giao được. Giao cho mỗi tác tử một nhiệm vụ rõ ràng và cung cấp các định dạng đầu ra dựa trên lược đồ (ví dụ: JSON/YAML) để giảm sự mơ hồ.
Câu hỏi 5: Làm cách nào để ngăn các tác tử lặp hoặc tạo ra code chất lượng thấp?
Thêm giới hạn bước và đánh giá cổng, thực thi các lược đồ đầu ra và sử dụng các mô hình chuyên biệt trên mỗi vai trò (ví dụ: mạnh về lý luận cho Kiến Trúc Sư, mạnh về code cho Kỹ Sư). Bao gồm một tác tử Người Kiểm Thử/Linter và chạy các unit test tự động.