Trong quá trình làm video AI (đặc biệt là storytelling), một vấn đề cực kỳ đau đầu mà mình từng gặp phải là:
- Nhân vật bị thay đổi ngoại hình giữa các scene
- Giọng kể và hình ảnh không đồng bộ
- Prompt mỗi lần generate lại lệch style hoàn toàn
Sau khi tối ưu rất nhiều workflow trong n8n, mình nhận ra:
Muốn hệ thống ổn định → phải có một “BỘ NÃO” điều phối
Và đó chính là AI Agent System Prompt.
⚙️ Vai trò của “Bộ não” trong workflow n8n
Trong workflow của mình, AI Agent đóng vai trò:
- Phân tích câu chuyện đầu vào
- Xây dựng database nhân vật
- Sinh prompt hình ảnh & video
Đặc biệt, phần database nhân vật là yếu tố quan trọng nhất giúp giữ consistency.
🧩 Tư duy thiết kế System Prompt
Thay vì prompt kiểu:
Hãy tạo scene từ câu chuyện
Mình chuyển sang tư duy:
Bạn là một hệ thống sản xuất phim tự động
Bạn có thể theo dõi thành quả video được tạo ra từ quy trình như dưới đây:
System prompt được thiết kế như một pipeline logic gồm các bước sau:
STEP 1 – Chia nhỏ câu chuyện (Segmentation)
- Mỗi đoạn khoảng 10–12 từ
- Thời lượng tối đa 8 giây
- Không rewrite nội dung
STEP 2 – Character Database
Tạo database đầy đủ cho tất cả nhân vật:
{
"character_id": "CHAR_SIDDHARTHA",
"name": "Siddhartha"
}
Mỗi nhân vật là một identity duy nhất xuyên suốt video.
STEP 3 – Lock đặc điểm nhân vật
- Khuôn mặt
- Mắt
- Tóc
- Trang phục
- Phụ kiện
Nếu không lock → AI sẽ random lại mỗi scene.
STEP 4 – Animal & Non-human system
Các nhân vật như thú vật hoặc thần linh đều phải trở thành character chính thức.
STEP 5 – Timeline (độ tuổi)
Nhân vật phải phát triển theo timeline: child → adult → elder nhưng vẫn giữ nhận diện.
STEP 6 – Costume Lock
- Vua → áo choàng + vương miện
- Tu sĩ → áo cà sa
Không được thay đổi giữa các scene.
STEP 7 – Chiều cao & tỉ lệ
Giữ consistency giữa các nhân vật: người lớn cao hơn trẻ em, v.v.
STEP 8 – Character Graph
Mỗi scene chỉ chứa nhân vật liên quan và luôn dùng character_id.
STEP 9 – Style Lock
An oil painting in an impressionistic style
Toàn bộ ảnh phải cùng style để giữ visual consistency.
STEP 10 – Image Prompt
Mỗi scene có prompt riêng gồm môi trường, ánh sáng, bố cục và nhân vật.
STEP 11 – Video Prompt
Cấu trúc gồm:
- scene_title
- environment
- actions
- camera
- audio
- visual_fx
🔥 Kết quả sau khi áp dụng
Sheet quản lý Prompt tạo ra và phân cảnh:

- Nhân vật giữ nguyên từ đầu đến cuối
- Không còn lỗi đổi mặt
- Video mượt và cinematic hơn
- Có thể scale hàng loạt video
Chi tiết System Prompt bạn có thể tham khảo Tại đây

