Trên thị trường có rất nhiều các ứng dụng Ai giúp chuyển văn bản thành giọng nói, tuy nhiên với những dự án mình đang sử dụng với ngôn ngữ tiếng Việt, mình lựa chọn Ausynlab bởi những yếu tố:
Các Tính Năng Nổi Bật
-
Voice Library (Thư Viện Giọng Nói)
Cho phép người dùng tải lên và đăng ký giọng nói cá nhân một cách dễ dàng. Tính năng này hỗ trợ bạn lưu trữ, quản lý các mẫu giọng nói của riêng mình để sử dụng trong các dịch vụ khác như Text-to-Speech hoặc Voice Cloning. Với Voice Library, bạn có thể:- Tải lên mẫu giọng nói cá nhân.
- Tùy chỉnh hoặc gán nhãn giọng nói để dễ dàng quản lý.
- Sử dụng giọng nói đã đăng ký trong các tính năng khác của AusyncLab.
-
Text-to-Speech (Chuyển Văn Bản Thành Giọng Nói)
Tạo giọng nói tự nhiên và truyền cảm từ văn bản với khả năng hỗ trợ ngôn ngữ đa dạng. Các tính năng bao gồm xử lý ngôn ngữ hỗn hợp, tinh chỉnh ngữ điệu và công nghệ sao chép giọng nói tiên tiến, chỉ cần 3-7 giây mẫu giọng nói để có thể tái tạo chính xác. -
Lipsync (Đồng Bộ Hóa Môi)
Đồng bộ hóa chuyển động môi với âm thanh từ video và file audio. Tính năng này cho phép tạo ra các video có sự đồng bộ hoàn hảo giữa chuyển động môi và âm thanh, phù hợp cho các ứng dụng sáng tạo nội dung và giải trí. -
Instant Avatar (Hình Ảnh Nói)
Biến hình ảnh tĩnh thành avatar biết nói sống động. Sử dụng đầu vào âm thanh để tạo chuyển động môi, biểu cảm, và cử động đầu, phù hợp với các ứng dụng như sáng tạo nội dung, giáo dục, và giải trí.
Ausynlab được phát triển bởi công ty tại Việt Nam, có cộng đồng hỗ trợ trên Discord, mức chi phí sử dụng hàng tháng khá tối ưu cho các bạn làm nội dung,
Tài khoản đăng ký mới được miễn phí 10.000 token tương ứng tạo audio có độ dài từ 5-7 phút.
Đăng ký tài khoản đơn giản:
- Đăng Ký hoặc Đăng Nhập: Thao tác đăng ký rất đơn giản, chỉ cần truy cập Link đăng ký
- Nhận API Key của bạn: Truy cập mục API Key trong bảng điều khiển.
- Đọc tài liệu: Khám phá các endpoint và tính năng trong từng phần của tài liệu.
- Thử nghiệm: Sử dụng Playground để thử nghiệm các API.
Lưu ý An toàn: Không chia sẻ API Key của bạn công khai để đảm bảo tính bảo mật.
Cách đăng ký giọng nói mới trong Voice Library
Bước 1: Truy cập thư viên giọng nói (Lưu ý tài khoản miễn phí được tạo tối đa 3 giọng nói)
Link thư viện giọng nói: https://ausynclab.io/voice
Bước 2: Thêm giọng nói mới: Bấm vào nút “Thêm giọng nói +” và nhập các thông tin cần thiết

Đặt tên giọng nói, lựa chọn ngôn ngữ, giới tính, độ tuổi và trường hợp sử dụng
Sau đó tải lên file audio của bạn. Lưu ý định dạng file là đuôi .mp3 hoặc .wav
Chọn vào Tôi xác nhận rằng tôi chịu trách nhiệm… và bấm Đăng ký.
Sau khi đăng ký thành công bạn sẽ có các audio riêng của mình để sử dụng cho quy trình tự động hoá như ảnh.

Để lấy ID audio cho quy trình tự động hoá, bạn copy trong ô khoanh đỏ và nhập vào quy trình để gọi giọng nói đó trong Quy trình tự động hoá n8n Text to speech bằng Ausynlab.
Ứng dụng:
Giải pháp Text to Speech của Ausynclab phù hợp với các quy trình cần sử dụng cá nhân hoá giọng đọc: Đọc những câu chuyện đầy cảm xúc, chia sẻ cảm nhận cá nhân, đọc lại những cuốn sách hay, tạo giọng cho Chatbot thân thiện….
Quy trình tự động trích xuất và lưu trữ nội dung truyện Gemini Story bằng n8n Tại đây
Tài liệu Api sử dụng giọng nói của Ausynclab: https://docs.ausynclab.io/
Workflow tự động tạo giọng đọc theo list danh sách văn bản hoàn chỉnh:

Nếu bạn quan tâm có thể tải về quy trình tại đây


