Sider.ai
  • Trò chuyện
  • Wisebase
  • Công cụ
  • Sự mở rộng
  • Khách hàng
  • Định giá
Tải ngay
Đăng nhập

Học nhanh hơn, suy nghĩ sâu sắc hơn và phát triển thông minh hơn với Sider.

Sản phẩm
Ứng dụng
  • Tiện ích mở rộng
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Công cụ
  • Người tạo webNew
  • AI SlidesNew
  • Trình viết luận AI
  • Nano Banana Pro
  • Nano Banana Infographic
  • Trình tạo hình ảnh AI
  • Máy phát não Ý
  • Xóa nền
  • Thay đổi nền
  • Xóa ảnh
  • Xóa văn bản
  • Vẽ lại
  • Nâng cấp hình ảnh
  • Tạo
  • Trình dịch AI
  • Trình dịch hình ảnh
  • Trình dịch PDF
Sider
  • Liên hệ chúng tôi
  • Trung tâm trợ giúp
  • Tải xuống
  • Giá cả
  • Kế hoạch Giáo dục
  • Có gì mới
  • Blog
  • Cộng đồng
  • Đối tác
  • Liên kết
  • Mời
©2026 Bảo lưu mọi quyền
Điều khoản sử dụng
Chính sách bảo mật
  • Trang chủ
  • Blog
  • Công Cụ AI
  • Cách Tạo Prompt để Kết Hợp Nhiều Ảnh trong Nano Banana cho các Bố Cục Phức Tạp

Cách Tạo Prompt để Kết Hợp Nhiều Ảnh trong Nano Banana cho các Bố Cục Phức Tạp

Cập nhật vào 19 Th09 2025

9 phút


Cách Tạo Prompt cho Kết Hợp Đa Ảnh trong Nano Banana để Tạo Ra Các Bố Cục Phức Tạp

Phong cách: Thực tế & hướng đến giải pháp
Nếu bạn đã từng thử kết hợp nhiều ảnh tham khảo vào một cảnh duy nhất, mạch lạc, bạn sẽ biết sự khó khăn: bảo toàn chi tiết đối tượng, giữ cho phong cách nhất quán và vẫn có được một bố cục thực sự hiệu quả. Tính năng kết hợp đa ảnh của Nano Banana có thể thực hiện điều này với độ tin cậy đáng ngạc nhiên—nếu bạn tạo prompt có chủ đích. Hướng dẫn này sẽ hướng dẫn bạn quy trình làm việc đã được thử nghiệm thực tế cho các bố cục phức tạp, bao gồm định dạng đầu vào, chiến lược phân bổ trọng số hình ảnh, lập kế hoạch bố cục, prompt phủ định, kiểm soát seed và khắc phục sự cố.
Điều đáng chú ý ngay từ đầu: các bài viết công khai mô tả Nano Banana là một mô hình hình ảnh hiện đại với khả năng chỉnh sửa, tính nhất quán và kết hợp đa ảnh mạnh mẽ, đồng thời nó được liệt kê trong số các mô hình sẵn sàng sản xuất trên các thư mục mô hình. Các hướng dẫn cộng đồng cũng phác thảo các mẫu prompt và các mẹo dựa trên kịch bản cho mô hình cũng như các hướng dẫn sử dụng thực tế mà chúng tôi tổng hợp ở đây.

Kết hợp đa ảnh trong Nano Banana là gì?

  • Định nghĩa: Kết hợp hai hoặc nhiều hình ảnh đầu vào (đối tượng, phong cách, bố cục) thành một đầu ra duy nhất trong khi giải quyết các xung đột về ánh sáng, phối cảnh, bảng màu và bố cục không gian.
  • Tại sao nó quan trọng: Nó cho phép bạn xây dựng các composite phức tạp (ví dụ: một bức chân dung theo phong cách phong cảnh màu nước; một sản phẩm được đặt trong một cảnh điện ảnh) mà không cần che (masking) thủ công.
  • Các yếu tố cốt lõi: Trọng số hình ảnh, mức độ ưu tiên của prompt văn bản, prompt phủ định, kiểm soát seed và các ràng buộc về tỷ lệ khung hình/kích thước.

Quy trình làm việc cấp cao cho các bố cục phức tạp

  1. Lập kế hoạch bố cục trước khi tạo prompt
  • Quyết định hình ảnh nào cung cấp bố cục, hình ảnh nào cung cấp nhận dạng đối tượng và hình ảnh nào cung cấp phong cách. Nếu bạn có ba hình ảnh, hãy gán vai trò cho mỗi hình ảnh.
  • Phác thảo một hình thu nhỏ (trong đầu hoặc vẽ nguệch ngoạc nhanh chóng). Lưu ý các tiêu điểm và độ sâu.
  1. Bắt đầu với hình ảnh cơ sở cho bố cục
  • Sử dụng hình ảnh tham khảo có phối cảnh và khung hình đã khớp với cảnh bạn mong muốn.
  • Ban đầu, hãy giữ trọng số của nó ở mức vừa phải (ví dụ: 0,6–0,8). Bạn sẽ điều chỉnh sau.
  1. Thêm (các) hình ảnh nhận dạng đối tượng
  • Cho hình ảnh tham khảo đối tượng trọng số cao hơn một chút (ví dụ: 0,8–1,0) để nhận dạng tồn tại dưới áp lực bố cục.
  • Sử dụng một crop chặt chẽ cho hình ảnh nhận dạng nếu nguồn bận; nó cải thiện khả năng thu hồi nhận dạng.
  1. Xếp lớp phong cách
  • Sử dụng hình ảnh phong cách (bảng màu/nét vẽ/ánh sáng). Bắt đầu với trọng số thấp hơn (0,3–0,6) để tránh lấn át nhận dạng.
  • Nếu phong cách làm sụp đổ tính hiện thực, hãy thử nghiệm với mô tả phong cách bằng văn bản thay vì (hoặc ngoài) hình ảnh phong cách.
  1. Viết một prompt giải quyết các xung đột
  • Chỉ định cảnh, ống kính, ánh sáng và thuộc tính vật liệu để căn chỉnh các tham chiếu khác nhau.
  • Bao gồm các vai trò không gian: “Đối tượng A ở tiền cảnh”, “Hậu cảnh từ Hình ảnh B”, “Phong cách từ Hình ảnh C”.
  1. Thêm prompt phủ định để bảo vệ bố cục
  • Nêu ra các tạo tác (“bàn tay bị cong vênh”, “các chi thừa”, “mắt đôi”, “chảy logo”, “ánh sáng không phù hợp”, “lỗi”).
  • Nếu phong cách quá mạnh, hãy thêm một phủ định như “quá cách điệu, vết nhòe kiểu họa sĩ” hoặc “kết cấu cọ dày” (nếu không mong muốn).
  1. Khóa seed sau bản nháp tốt
  • Khi bố cục chung hoạt động, hãy đóng băng seed để lặp lại chính xác trọng số, độ mạnh của phong cách và chi tiết.
  1. Lặp lại với các thay đổi nhỏ
  • Thay đổi một tham số tại một thời điểm (ví dụ: trọng số phong cách +0,1) và so sánh.
Nhân tiện, một số hướng dẫn công khai cung cấp các công thức tạo prompt dựa trên kịch bản và A/B phản ánh phương pháp dàn dựng này, trong khi các hướng dẫn từng bước chia nhỏ các chiến thuật tham khảo và prompt phủ định.

Kiến trúc prompt: một mẫu đáng tin cậy

Sử dụng cấu trúc phân lớp, dễ đọc mà bạn có thể điều chỉnh nhanh chóng:
  • Ý định hệ thống/hướng dẫn (nếu được hỗ trợ): “Tuân thủ nghiêm ngặt hình ảnh tham khảo để nhận dạng, sử dụng văn bản cho sắc thái phong cách.”
  • Khối hình ảnh với vai trò: bố cục, nhận dạng, phong cách.
  • Khối văn bản với bố cục, máy ảnh, ánh sáng và vật liệu.
  • Prompt phủ định.
  • Điều khiển: seed, guidance/CFG, kích thước/tỷ lệ khung hình.
Cấu trúc ví dụ (giả prompt):
Hình ảnh:
- img_layout: {URL or upload id} weight: 0.7 role: layout
- img_identity: {URL or upload id} weight: 0.9 role: subject identity
- img_style: {URL or upload id} weight: 0.4 role: style/palette
Prompt:
Một bức chân dung cỡ trung của đối tượng từ img_identity, đứng trong cảnh đường phố từ img_layout.
Duy trì bảng màu và tâm trạng ánh sáng từ img_style: hoàng hôn ấm áp, ánh sáng vành mềm mại, độ sâu trường ảnh nông.
Máy ảnh: 50mm, f/1.8, góc ngang vai. Bokeh mềm mại, kết cấu da chân thực.
Trang phục: áo khoác tối giản màu tối, không có logo. Biểu cảm: bình tĩnh, tự tin.
Phủ định:
nét vẽ quá cách điệu, vết nhòe kiểu họa sĩ, da nhựa, ngón tay thừa, bàn tay bị cong vênh, các đặc điểm khuôn mặt trùng lặp,
phối cảnh không phù hợp, bóng bị poster hóa, nhiễu sắc, tạo tác logo.
Điều khiển:
seed: 142375
guidance: 5.5–7.5 (bắt đầu 6.5)
kích thước: 768x1024 (chân dung) hoặc 1024x768 (phong cảnh)
Nếu giao diện của bạn hỗ trợ thanh trượt hoặc mã thông báo trọng số hình ảnh, hãy giữ trọng số trong dải 0,3–1,2; chỉ tăng cao hơn khi nhận dạng sụp đổ. Ngay cả bên ngoài Nano Banana, các chuyên gia đã nhận thấy rằng trọng số thấp hơn mang lại sự tự do trong khi trọng số cao hơn thực thi độ trung thực.

Trọng số hình ảnh: ba công thức thực tế

  • Chân dung ưu tiên nhận dạng
  • bố cục: 0,5–0,7
  • nhận dạng: 0,9–1,1
  • phong cách: 0,3–0,5
  • Tại sao: Giữ độ trung thực của khuôn mặt trong khi gợi ý một cái nhìn.
  • Biên tập theo phong cách
  • bố cục: 0,6–0,8
  • nhận dạng: 0,6–0,8
  • phong cách: 0,7–1,0
  • Tại sao: Đẩy một hướng nghệ thuật mạnh mẽ trên toàn khung hình.
  • Xây dựng thế giới cân bằng
  • bố cục: 0,8–1,0
  • nhận dạng: 0,7–0,9
  • phong cách: 0,4–0,7
  • Tại sao: Sự mạch lạc của bố cục quan trọng nhất; nhận dạng có mặt nhưng không tuyệt đối.

Kiểm soát bố cục: phối cảnh, độ sâu và ánh sáng

  • Phối cảnh: Căn chỉnh các giá trị tương đương của ống kính trên văn bản và hình ảnh (ví dụ: “ảnh rộng 24mm” cho các cảnh rộng lớn; “85mm” cho chân dung). Nếu hình ảnh bố cục là 24mm nhưng bạn yêu cầu giao diện 85mm, mô hình phải điều hòa hình học xung đột. Giữ chúng nhất quán.
  • Độ sâu: Đề cập đến các vai trò tiền cảnh/trung cảnh/hậu cảnh (“đối tượng tiền cảnh, đường chân trời trung cảnh, núi hậu cảnh”). Điều này làm giảm các lỗi chồng chéo đối tượng.
  • Ánh sáng: Tuyên bố một nguồn sáng chủ đạo duy nhất và thời gian trong ngày. Sử dụng “ánh sáng chính bên trái, ấm; ánh sáng phụ mềm mại, mát mẻ; ánh sáng vành tinh tế.” Điều này giúp hợp nhất các hình ảnh nguồn không phù hợp.

Các prompt phủ định thực sự hữu ích

  • Cấu trúc: “phối cảnh không phù hợp”, “đường chân trời bị nghiêng”, “giải phẫu bị cong vênh”, “độ sâu phẳng”.
  • Bề mặt/kết cấu: “ánh bóng nhựa”, “chi tiết bùn”, “poster hóa”, “banding”, “các cạnh quá sắc nét”.
  • Kiểm soát phong cách: “quá cách điệu”, “kết cấu cọ dày”, “hoạt hình”, khi nhắm đến tính hiện thực.
  • Tính nhất quán: Nếu logo hoặc hình mờ xâm nhập, hãy thêm “không có hình mờ, không có logo”.

Seed và chiến lược biến thể

  • Khám phá với một seed ngẫu nhiên cho đến khi khung hình ‘nhấp’.
  • Khóa seed và lặp lại trọng số theo các bước nhỏ: ±0,1. Giữ một bản ghi phiên bản.
  • Nếu các chi tiết nhỏ tiếp tục bị hỏng (bàn tay, đạo cụ nhỏ), hãy giữ seed nhưng đẩy nhẹ guidance/CFG ±0,5 và điều chỉnh các phủ định.

Độ phân giải, tỷ lệ khung hình và upscaling

  • Tạo ở hoặc gần tỷ lệ khung hình mục tiêu của bạn để tránh các thay đổi bố cục trong quá trình upscaling.
  • Nếu bạn cần chi tiết cực cao, hãy tạo ra một cơ sở mạnh mẽ ở 768–1024 px ở cạnh ngắn, sau đó upscale với một lượt bảo toàn chi tiết. Tránh thay đổi tỷ lệ khung hình trong quá trình upscale.

Sổ tay khắc phục sự cố

  • Khuôn mặt hoặc nhận dạng trôi dạt
  • Tăng trọng số nhận dạng thêm +0,1 đến +0,2.
  • Thêm các mô tả nhận dạng rõ ràng trong văn bản (kiểu tóc, dấu hiệu trên khuôn mặt, phụ kiện).
  • Sử dụng crop nhận dạng chặt chẽ hơn.
  • Phong cách lấn át tính hiện thực
  • Giảm trọng số phong cách; thêm các phủ định như “quá cách điệu, vết nhòe kiểu họa sĩ”.
  • Thay thế hình ảnh phong cách bằng prompt phong cách chỉ bằng văn bản.
  • Bố cục lộn xộn
  • Tăng trọng số bố cục, tăng các tín hiệu độ sâu trong văn bản (“sự phân tách rõ ràng của các mặt phẳng”).
  • Đơn giản hóa prompt; loại bỏ các tính từ xung đột.
  • Ánh sáng không phù hợp
  • Điều hòa thành một thời gian trong ngày và một hướng ánh sáng; đề cập đến nó một cách rõ ràng.
  • Nếu một hình ảnh phong cách áp đặt ánh sáng khác, hãy giảm trọng số của nó.
  • Các tạo tác lặp đi lặp lại (bàn tay, logo)
  • Tăng cường các phủ định; tăng nhẹ guidance.
  • Tạo lại với cùng một seed sau những thay đổi nhỏ để duy trì bố cục nhưng làm mới chi tiết.

Các trường hợp sử dụng thực tế

  • Sản phẩm anh hùng trong bối cảnh phong cách sống
  • Bố cục: ảnh phong cách sống; Nhận dạng: ảnh chụp sản phẩm; Phong cách: bảng tông màu thương hiệu.
  • Prompt cho bóng và phản xạ nhất quán; phủ định cho “các đối tượng nổi”, “phản xạ giả”.
  • Chân dung theo phong cách của một bậc thầy
  • Bố cục: tham khảo tư thế studio; Nhận dạng: người; Phong cách: tham khảo tranh vẽ hoặc phân loại màu.
  • Kiểm soát độ bão hòa và kết cấu trong văn bản; giữ trọng số phong cách vừa phải để có độ giống.
  • Kết hợp bảng phân cảnh
  • Bố cục: tấm môi trường; Nhận dạng: chuyển động nhân vật; Phong cách: khung hình điện ảnh.
  • Chỉ định chuyển động của máy ảnh ngụ ý bởi bố cục (“dolly thấp, nghiêng lên nhẹ”).

Ví dụ về prompt (sẵn sàng để sao chép)

  1. Kết hợp hai hình ảnh: nhận dạng + bố cục
Hình ảnh:
- img_layout: city_street_at_dusk.jpg weight: 0.7 role: layout
- img_identity: subject_headshot.png weight: 1.0 role: identity
Prompt:
Một bức chân dung cỡ trung của đối tượng nhận dạng đứng ở vạch kẻ đường, cùng phối cảnh với img_layout.
Ánh sáng bên giờ vàng, độ sâu nông, kết cấu da tự nhiên, bokeh mềm mại.
Phủ định:
da nhựa, ngón tay bị cong vênh, các chi thừa, tạo tác logo, các cạnh quá sắc nét.
Điều khiển:
seed: 88123, guidance: 6.5, kích thước: 896x1152
  1. Kết hợp ba hình ảnh: bố cục + nhận dạng + phong cách
Hình ảnh:
- img_layout: forest_path_wide.png weight: 0.8 role: layout
- img_identity: runner_profile.jpg weight: 0.9 role: identity
- img_style: teal_orange_grade.png weight: 0.5 role: style
Prompt:
Ảnh toàn thân của người chạy trên cùng một con đường rừng, sải chân năng động, chuyển động sắc nét, phân loại điện ảnh màu xanh mòng két-cam.
Ống kính 35mm, góc thấp, sương mù buổi sáng, ánh sáng mặt trời có hướng từ bên phải.
Phủ định:
vệt mờ chuyển động, tán lá bùn, poster hóa, bóng không phù hợp.
Điều khiển:
seed: 44701, guidance: 6.0, kích thước: 1024x768
  1. Composite biên tập thống trị phong cách
Hình ảnh:
- img_layout: studio_three_point_lighting.jpg weight: 0.6 role: layout
- img_identity: model_closeup.png weight: 0.7 role: identity
- img_style: magazine_cover_moodboard.jpg weight: 0.9 role: style
Prompt:
Chân dung trang bìa biên tập, điểm nổi bật bóng bẩy, nền tối giản, không gian âm an toàn cho kiểu chữ bên trái.
Ống kính 85mm, f/2, biểu cảm trung tính, trang điểm sạch sẽ.
Phủ định:
làm mịn da khắc nghiệt, nét vẽ quá cách điệu, banding, viền màu.
Điều khiển:
seed: 99021, guidance: 7.0, kích thước: 1024x1365
Để có các thiết lập kịch bản sâu hơn và các ví dụ về giải phẫu prompt xung quanh mô hình này, các bài viết của cộng đồng rất hữu ích. Các bản tóm tắt độc lập cũng nêu bật khả năng kết hợp đa ảnh trong số các thế mạnh của Nano Banana.

Lời khuyên chuyên nghiệp cho các cảnh phức tạp

  • Giữ vai trò rõ ràng: Bạn càng sử dụng nhiều hình ảnh, bạn càng phải tuyên bố ai làm gì.
  • Ưu tiên tính hiện thực với các tín hiệu máy ảnh: ống kính, khẩu độ, chiều cao, hướng ánh sáng.
  • Sử dụng phong cách như gia vị: bắt đầu thấp, chỉ tăng lên khi cần thiết.
  • Lặp lại như một nhà thiết kế: các thay đổi nhỏ, được ghi lại với một seed cố định.
  • Biết khi nào nên chuyển đổi: nếu một hình ảnh tiếp tục chống lại mục tiêu (phối cảnh xung đột), hãy thay thế nó thay vì điều chỉnh quá mức.

Một lưu ý về Sider.AI

Nếu bạn đang thực hiện soạn thảo prompt và so sánh lặp đi lặp lại, thì một không gian làm việc song song giữ các seed, trọng số và phủ định được kiểm soát phiên bản là rất có giá trị. Điều đáng chú ý: bạn có thể sử dụng một công cụ quản lý prompt để tạo khuôn mẫu cho các vai trò đa hình ảnh, lưu trữ ID hình ảnh và nhanh chóng A/B trọng số—rất tiện dụng khi chạy hàng tá lần lặp nhỏ để quay số chất lượng hợp nhất.

Những điểm chính

  • Gán vai trò rõ ràng cho mỗi hình ảnh tham khảo: bố cục, nhận dạng, phong cách.
  • Bắt đầu bảo thủ với trọng số phong cách; bảo vệ nhận dạng bằng trọng số cao hơn.
  • Điều hòa ống kính và ánh sáng trên các tín hiệu văn bản và hình ảnh.
  • Khóa seed trước khi điều chỉnh vi mô; thay đổi một thứ tại một thời điểm.
  • Sử dụng các phủ định có mục tiêu để kiểm soát cấu trúc, kết cấu và tạo tác.
Tài liệu tham khảo và đọc thêm: Tổng quan về prompt Nano Banana và hướng dẫn của cộng đồng; bình luận về khả năng kết hợp đa ảnh của nó; danh sách thư mục mô hình.

FAQ

Q1:Làm cách nào để gán trọng số cho nhiều hình ảnh trong Nano Banana để hợp nhất tốt hơn? Gán vai trò (bố cục, nhận dạng, phong cách) và bắt đầu với các trọng số như 0,7/1,0/0,5. Tăng trọng số nhận dạng nếu độ giống trôi dạt; giảm trọng số phong cách nếu giao diện lấn át tính hiện thực. Các thay đổi nhỏ ±0,1 hoạt động tốt nhất.
Q2:Những prompt phủ định nào giúp ích cho việc kết hợp đa ảnh trong Nano Banana? Sử dụng các bảo vệ cấu trúc và kết cấu: “giải phẫu bị cong vênh, phối cảnh không phù hợp, da nhựa, poster hóa, các cạnh quá sắc nét, tạo tác logo.” Thêm các phủ định kiểm soát phong cách như “nét vẽ quá cách điệu” khi cần tính hiện thực.
Q3:Tôi có nên sửa seed khi kết hợp các bố cục phức tạp không? Vâng. Tự do khám phá cho đến khi bạn thích khung hình, sau đó khóa seed để lặp lại một cách có thể dự đoán được trên trọng số, độ mạnh của phong cách, guidance và phủ định mà không làm mất bố cục.
Q4:Tôi nên sử dụng độ phân giải và tỷ lệ khung hình nào cho việc kết hợp đa ảnh? Tạo gần với tỷ lệ khung hình mục tiêu của bạn (ví dụ: 1024×768 hoặc 896×1152) để tránh các thay đổi bố cục. Upscale sau đó với một lượt bảo toàn chi tiết, giữ cho tỷ lệ khung hình không đổi.
Q5:Tôi có thể kết hợp một hình ảnh phong cách và một mô tả văn bản cùng nhau không? Chắc chắn rồi. Bắt đầu với trọng số hình ảnh phong cách thấp (0,3–0,5) và củng cố giao diện thông qua văn bản (ánh sáng, phân loại màu). Nếu hình ảnh phong cách chống lại cảnh, hãy giảm trọng số của nó hoặc chuyển sang tạo kiểu chỉ bằng văn bản.

Các Bài Viết Gần Đây
Cách Thành Thạo ChatPDF: Tìm Kiếm Thông Tin Nhanh Hơn Trong Tài Liệu Dày

Cách Thành Thạo ChatPDF: Tìm Kiếm Thông Tin Nhanh Hơn Trong Tài Liệu Dày

Giải pháp thay thế X Auto-Translation tốt nhất cho tài liệu nhanh chóng, chính xác

Giải pháp thay thế X Auto-Translation tốt nhất cho tài liệu nhanh chóng, chính xác

Dịch thuật AI Samsung không khả dụng tại Iran? Các giải pháp thực tế

Dịch thuật AI Samsung không khả dụng tại Iran? Các giải pháp thực tế

Công cụ dịch tiếng Ba Tư: hướng dẫn thực tiễn để làm việc nhanh hơn, chính xác hơn

Công cụ dịch tiếng Ba Tư: hướng dẫn thực tiễn để làm việc nhanh hơn, chính xác hơn

Lựa chọn thay thế Grok tốt nhất cho nghiên cứu sâu và có trích dẫn

Lựa chọn thay thế Grok tốt nhất cho nghiên cứu sâu và có trích dẫn

15 Tính Năng Hàng Đầu Của Trình Tạo Ảnh AI Mà Bạn Sẽ Thực Sự Sử Dụng

15 Tính Năng Hàng Đầu Của Trình Tạo Ảnh AI Mà Bạn Sẽ Thực Sự Sử Dụng