-80%

Quy trình Tạo Ảnh Tự Động Với Google Banana Pro thông qua Whisk – Miễn Phí, Không Cần API Chính Thống

300.000 đ 60.000 đ

Quy trình này được xây dựng để giải quyết chính vấn đề đó. Dựa trên môi trường Sandbox của Google, quy trình cho phép bạn sử dụng trực tiếp 3 model mạnh nhất hiện tại là Banana Pro, Banana, Imagen 4 mà không cần API key chính thống

Danh mục

Mô tả

Quy trình tạo ảnh dựa vào Authorization và Project ID của Whisk, sử dụng tốt cho model Google Banana

Xây dựng trên phiên bản n8n v1.120.4 (Để tránh lỗi vui lòng cài phiên bản n8n tương ứng hoặc cao hơn trước khi import quy trình)

Quy trình này được xây dựng để giải quyết chính vấn đề đó. Dựa trên môi trường Sandbox của Google, quy trình cho phép bạn sử dụng trực tiếp 2 model mạnh nhất hiện tại mà không cần API key chính thống, không cần đăng ký tài khoản nhà phát triển, không tốn phí hạ tầng – chỉ cần cung cấp Authorization tạm thời và Project ID là bạn có thể tạo ảnh chất lượng cao trong vài giây.

Cách thức lấy Project_ID và Authorization tham khảo tại đây.

Điểm mạnh nhất của quy trình nằm ở việc tối ưu hoá từng bước để người dùng cuối chỉ cần nhập prompt, chọn kiểu tạo ảnh và chọn model. Tất cả phần còn lại — từ xử lý prompt, upload ảnh tham chiếu, chuyển đổi định dạng, chọn aspect ratio (Hiện có 3 tỉ lệ là 1:1, 16:9, 9:16), xác định tên model phù hợp, gửi request đến API sandbox và trả kết quả cuối — đều được tự động hóa hoàn toàn trong n8n.

Bất kể bạn muốn tạo ảnh text-to-image hay image-to-image, quy trình đều được thiết kế để đáp ứng. Mỗi phần tử trong workflow được tách bạch, xử lý mạch lạc và vận hành theo cấu trúc logic, giúp bạn dễ dàng mở rộng, can thiệp hoặc tùy chỉnh nếu cần. Đặc biệt, workflow tự động chọn đúng model theo yêu cầu của người dùng, tương ứng với 3 lựa chọn phổ biến nhất:

Hai model đang sử dụng tốt trong quy trình này là:

  • GEM_PIX – Google Banana: nhanh, nhẹ, phù hợp tạo ảnh tốc độ cao.

  • IMAGEN_3_5 – Imagen 4: chất ảnh sạch, tinh tế, phù hợp cho chủ đề tự nhiên, người thật và cảnh vật.

Riêng model: GEM_PIX_2 – Google Banana Pro: độ chi tiết cao, thể hiện vật liệu và ánh sáng vượt trội. (Hiện tại Whisk chưa cập nhật Model này nhưng tương lai sẽ có nên mình vẫn để mã này giới thiệu các bạn)

Một ưu điểm khác không thể bỏ qua chính là khả năng hoạt động hoàn toàn miễn phí. Vì quy trình này sử dụng Sandbox nội bộ thông qua Whisk của Google, bạn có thể triển khai các yêu cầu tạo ảnh nhiều lần mà không tốn bất kỳ chi phí nào như các API thương mại khác. Đây là giải pháp lý tưởng dành cho người sáng tạo nội dung, lập trình viên, designer hoặc người dùng đang cần trải nghiệm nhanh sức mạnh của mô hình mà không muốn đầu tư tài chính ban đầu.

Bên cạnh đó, quy trình còn xử lý đầy đủ các trường hợp đặc biệt: làm sạch prompt, escape ký tự đặc biệt, tự động chuẩn hóa ngoặc kép, chuyển dòng đúng định dạng JSON, tách nhánh cho từng kích thước ảnh, và hỗ trợ upload ảnh tham chiếu dựa trên chuẩn rawImageBytes của Google. Bằng cách này, bạn chỉ cần tập trung vào sáng tạo ý tưởng; mọi khâu kỹ thuật đã được lo liệu.

Cuối cùng, toàn bộ hệ thống được thiết kế theo hướng trải nghiệm người dùng tối ưu, dù người dùng là người mới với n8n vẫn có thể làm chủ quy trình chỉ sau vài phút. Không cần kiến thức lập trình, không cần server phức tạp — chỉ cần import workflow và chạy.

Ưu điểm nổi bật

  • Tạo ảnh từ Text (Text-to-Image): chỉ cần prompt đã clean — workflow tự chọn model phù hợp và trả ảnh chất lượng cao (GEM_PIX / IMAGEN_3_5 đều hỗ trợ output chi tiết).

  • Tạo ảnh từ 1 ảnh đầu vào (Image-to-Image): upload ảnh tham chiếu → uploadUserImage → truyền imageInputs trong payload để model biến đổi ảnh theo prompt (thay đổi phong cách, màu sắc, bố cục).

  • Upload nhiều ảnh đầu vào → tạo nhiều ảnh đầu ra: workflow hỗ trợ tách binary, loop in batches và aggregate — phù hợp cho trường hợp bạn muốn xử lý hàng loạt (bulk) ảnh input và nhận batch kết quả trả về.

  • Không cần API chính thức / Hoạt động miễn phí: tận dụng Google Sandbox endpoint (không yêu cầu API key thương mại), tiết kiệm chi phí cho thử nghiệm và phát triển.

  • Dễ mở rộng & tùy chỉnh: cấu trúc node rõ ràng (switches, sets, http requests) giúp bạn dễ thêm bước xử lý (ví dụ watermark, resize, lưu lên cloud) mà không phá luồng chính

Workflow sau khi cài đặt thành công

Điểm đặc biệt của quy trình này bạn có thể tự phát triển thêm mình có thể gợi ý là Whisk có chia ra khung upload đối tương, upload bối cảnh, upload phong cách để tạo ra được bức ảnh ưng ý nhất. Bạn hoàn toàn có thể xây thêm quy trình auto để tạo ra bức ảnh đồng nhất phong cách, khuôn mặt, bối cảnh.

Lưu ý: Quy trình chi phí thấp nên không bao gồm chi phí cài đặt và chỉnh sửa theo yêu cầu.

Đánh giá

Chưa có đánh giá nào.

Chỉ những khách hàng đã đăng nhập và mua sản phẩm này mới có thể đưa ra đánh giá.