Nhà phát triển API
Tích hợp tính năng bản địa hóa Addavox vào quy trình làm việc của bạn. Chọn tùy chọn Dịch thuật API để dịch âm thanh độc lập, hoặc tùy chọn Lồng tiếng Video API để bản địa hóa video đầy đủ với căn chỉnh thời gian, kiểm tra chất lượng và phụ đề.
API Keys
Tạo các khóa API trong ứng dụng Addavox . Mỗi khóa sử dụng cùng gói cước và số phút được bao gồm như tài khoản của bạn.
Quản lý các khóa APIURL cơ sở:
https://api.addavox.com/api/v1
Tiêu đề xác thực:
X- API -Key: YOUR_KEY
Tổng quan về dịch vụ
Hai bảng API dành cho các nhu cầu bản địa hóa khác nhau.
- Điểm cuối
POST /api/v1/localize- Đầu ra
- Âm thanh tuần tự độc lập
- Ngôn ngữ
- Một yêu cầu mỗi lần
- Kiểm định chất lượng
- Không có
Từ $0.05/phút
Xem chi tiết ↓- Điểm cuối
POST /api/v1/localize-video- Đầu ra
- Video + âm thanh + phụ đề theo từng ngôn ngữ
- Ngôn ngữ
- Nhiều yêu cầu cho mỗi đơn hàng
- Kiểm định chất lượng
- Đảm bảo chất lượng LLM được bao gồm
- Ôn tập
- Mời người đánh giá thông qua liên kết đặc biệt
Từ $1.60/phút mỗi ngôn ngữ
Mức phí hàng năm dành cho doanh nghiệp.
Xem chi tiết ↓Bản dịch API
Điểm cuối duy nhất: POST /api/v1/localize — tạo bản ghi âm đã dịch độc lập từ nội dung nguồn của bạn.
Ứng dụng web so với API này: khi bạn sử dụng sản phẩm Addavox trong trình duyệt, các tác vụ chỉnh sửa phân đoạn và bản địa hóa sẽ giữ nguyên âm thanh xem trước trên mỗi phân đoạn và trì hoãn chương trình đã được phối trộn hoàn chỉnh cho đến khi bạn tải xuống các tài nguyên từ trang dự án. Các điểm cuối v1 này xây dựng đầu ra đã được ghép nối như một phần của tác vụ để các máy khách API có thể lấy kết quả mà không cần bước xuất riêng biệt.
Bạn cung cấp
- Âm thanh nguồn
- Ngôn ngữ nguồn + ngôn ngữ đích
Chúng tôi xử lý
- Phiên âm
- Bản dịch
- âm thanh giọng nói phù hợp với người nói
- Khâu nối tiếp
Từ $0.08/phút
Giá gói dịch vụ doanh nghiệp. Xem bảng giá →
Bạn cung cấp
- Âm thanh nguồn
- Phiên âm có đánh dấu thời gian theo từng đoạn.
- Ngôn ngữ nguồn + ngôn ngữ đích
Chúng tôi xử lý
- Bản dịch
- âm thanh giọng nói phù hợp với người nói
- Khâu nối tiếp
Từ $0.06/phút
Giá gói dịch vụ doanh nghiệp. Xem bảng giá →
Bạn cung cấp
- Âm thanh nguồn
- Phiên âm + dịch thuật có đánh dấu thời gian theo từng đoạn
Chúng tôi xử lý
- âm thanh giọng nói phù hợp với người nói
- Khâu nối tiếp
Từ $0.05/phút
Giá gói dịch vụ doanh nghiệp. Xem bảng giá →
Cách thức hoạt động
Định dạng đầu ra
Tệp API tạo ra một tệp âm thanh tuần tự độc lập. Mỗi đoạn được dịch được tạo ra và ghép lại với nhau theo thứ tự, có những khoảng dừng ngắn giữa chúng. Đầu ra không được đồng bộ hóa thời gian với nguồn gốc ban đầu — đó là một tệp âm thanh mới được thiết kế để nghe độc lập.
Tại sao cần cung cấp nguồn âm thanh và mốc thời gian?
Dấu thời gian của âm thanh nguồn và phân đoạn (start_time, end_time) được sử dụng để xác định và khớp giọng nói của từng người nói trong bản ghi âm gốc. Điều này cho phép âm thanh được tạo ra nghe giống như giọng nói của người nói gốc. Các dấu thời gian này không kiểm soát thời gian phát ra.
Không có kiểm tra chất lượng hoặc khớp thời lượng
Không giống như Lồng tiếng video, chức năng Dịch thuật API không thực hiện viết lại văn bản, điều chỉnh nhịp độ hoặc căn chỉnh thời gian. Chính điều này làm cho nó nhanh hơn và tiết kiệm chi phí hơn. Nếu bạn cần đồng bộ âm thanh với video gốc theo từng khung hình, hãy sử dụng chức năng Lồng tiếng video API .
Ví dụ mã
Lồng tiếng video API
Điểm cuối: POST /api/v1/localize-video — dịch thuật video hoàn chỉnh bao gồm thời gian, kiểm tra chất lượng và phụ đề.
Các công việc được bắt đầu thông qua API này sẽ tạo ra các sản phẩm bàn giao theo từng ngôn ngữ khi công việc hoàn thành. Ứng dụng Addavox trên trình duyệt sử dụng cùng một công cụ bản địa hóa nhưng chuyển toàn bộ tài sản hỗn hợp sang quy trình Tải xuống dự án trừ khi có ghi chú khác.
Bạn cung cấp
- URL video
- Ngôn ngữ nguồn
- Ngôn ngữ mục tiêu (một hoặc nhiều)
Chúng tôi xử lý
- Tách âm thanh/video
- Phiên âm
- Bản dịch
- LLM QA
- Tổng hợp giọng nói
- Căn chỉnh thời gian
- Tạo phụ đề
- Hiển thị video theo từng ngôn ngữ
Định dạng đầu ra
Video, âm thanh và phụ đề cho từng ngôn ngữ. Có sẵn file nén ZIP chứa tất cả các ngôn ngữ để tải xuống. Các URL đã được ký sẽ hết hạn sau 24 giờ.
Việc làm đa ngôn ngữ
Một yêu cầu, nhiều ngôn ngữ. Công việc chính sẽ tạo ra các công việc con cho mỗi ngôn ngữ. Kiểm tra trạng thái của công việc chính theo từng ngôn ngữ. Các giá trị trạng thái: đang chờ xử lý → đang chạy → đã hoàn thành | thất bại.
Quy trình làm việc của người đánh giá
Mời người đánh giá thông qua API . Mỗi người đánh giá sẽ nhận được một email chứa liên kết để chỉnh sửa bản địa hóa trong trình soạn thảo web — không cần tài khoản.
Ví dụ mã
Sự đồng ý và ủy quyền
Tất cả các yêu cầu API phải bao gồm một đối tượng đồng ý và một trường chế độ cấp cao nhất. Cùng nhau, chúng tạo ra một bản ghi xác nhận cho mỗi công việc, xác nhận rằng bạn nắm giữ các quyền cần thiết và sự đồng ý của người nói.
Trường chế độ xác định phương pháp tổng hợp giọng nói: "voice_matched" sử dụng sao chép giọng nói của người nói, "standard" sử dụng TTS tổng hợp. Cả hai chế độ đều có cùng mức giá — việc lựa chọn hoàn toàn dựa trên sự đồng ý của người dùng.
Chế độ khớp giọng nói — Cần có sự đồng ý hoàn toàn
Chế độ tiêu chuẩn — Chỉ quyền truy cập nội dung
Tham chiếu trường
| Cánh đồng | Kiểu | Yêu cầu | Sự miêu tả |
|---|---|---|---|
| mode | string | Cấp cao nhất | voice_matched hoặc standard |
| speaker_consent_obtained | boolean | chỉ khớp giọng nói | Sự đồng ý rõ ràng từ những người phát ngôn có thể xác định được danh tính. |
| content_rights_confirmed | boolean | Cả hai chế độ | Quyền sở hữu hoặc giấy phép hợp lệ đối với nội dung |
| eula_accepted | boolean | Cả hai chế độ | Chấp nhận Thỏa thuận cấp phép người dùng cuối (EULA) của Addavox |
| attested_by | string | Cả hai chế độ | Địa chỉ email hoặc thông tin nhận dạng của bên chịu trách nhiệm |
| attested_at | ISO 8601 | Cả hai chế độ | Trong vòng 24 giờ kể từ thời điểm yêu cầu. |
Mã lỗi đồng ý
| HTTP | Mã số | Tình trạng |
|---|---|---|
| 403 | CONSENT_MISSING | Không có đối tượng đồng ý |
| 403 | CONSENT_INCOMPLETE | Thiếu trường attested_by hoặc attested_at không hợp lệ. |
| 403 | CONSENT_NOT_AFFIRMED | Quyền hoặc Thỏa thuận cấp phép người dùng cuối (EULA) chưa được xác nhận. |
| 403 | CONSENT_EXPIRED | đã được chứng thực hơn 24 giờ |
| 403 | SPEAKER_CONSENT_REQUIRED | voice_matched without speaker consent |
| 400 | INVALID_MODE | Giá trị chế độ không hợp lệ |
API Tài liệu tham khảo
Toàn bộ lược đồ tương tác và các điểm cuối bổ sung có sẵn thông qua Open API .
Điểm cuối
| POST /localize | Bản dịch trước / bản ghi âm một phần |
| POST /localize-video | Lồng tiếng video đầy đủ (đa ngôn ngữ) |
| GET /jobs/{job_id} | Tình trạng việc làm |
| GET /jobs/{job_id}/result | Sản phẩm bàn giao (URL, mã zip) |
| GET /jobs | Liệt kê việc làm |
| DELETE /jobs/{job_id} | Hủy bỏ công việc |
| GET /account | Thông tin tài khoản |
| GET /voices | Danh mục giọng nói TTS |
| GET /languages | Ngôn ngữ được hỗ trợ |
| POST /projects/{id}/reviewers | Mời người đánh giá |
| GET|POST /jobs/{id}/webhooks | Trạng thái Webhook / thử lại |
API Bảng giá dịch vụ
Bảng giá theo phút tùy thuộc vào gói đăng ký. Giá dưới đây phản ánh giá hàng năm của gói Doanh nghiệp (giảm giá 20%). Xem bảng đầy đủ cho từng gói và dịch vụ.
Giá gói dịch vụ doanh nghiệp được hiển thị đã bao gồm chiết khấu hàng năm.
Miễn phí
Lồng tiếng video
Bao gồm (~phút)
2 min
Mức lương cơ bản (hàng năm)
/min
Vượt quá
$4.00/min
API Dịch vụ
Tách âm thanh
Bản ghi âm giọng nói đã được khử nhiễu độc quyền
Mức lương cơ bản
$0.03/min
Vượt quá
$0.04/min
Bao gồm (~phút)
~— min
Phát hiện giới tính
Phân loại giới tính dựa trên giọng nói + ngữ cảnh
Mức lương cơ bản
$0.02/min
Vượt quá
$0.02/min
Bao gồm (~phút)
~— min
Phiên âm (STT)
Chuyển đổi giọng nói thành văn bản bằng Deepgram kèm theo phân tách giọng nói.
Mức lương cơ bản
$0.05/min
Vượt quá
$0.06/min
Bao gồm (~phút)
~— min
Bản dịch
Google Translate
Mức lương cơ bản
$0.03/min
Vượt quá
$0.04/min
Bao gồm (~phút)
~— min
Chuyển văn bản thành giọng nói
Google TTS + các nhà cung cấp khác
Mức lương cơ bản
$0.06/min
Vượt quá
$0.08/min
Bao gồm (~phút)
~— min
Ghép giọng nói
Công nghệ sao chép giọng nói độc quyền (trọn gói)
Mức lương cơ bản
$0.08/min
Vượt quá
$0.10/min
Bao gồm (~phút)
~— min
Người mới bắt đầu
Lồng tiếng video
Bao gồm (~phút)
10 min
Mức lương cơ bản (hàng năm)
$2.80/min
Vượt quá
$3.60/min
API Dịch vụ
Tách âm thanh
Bản ghi âm giọng nói đã được khử nhiễu độc quyền
Mức lương cơ bản
$0.02/min
Vượt quá
$0.03/min
Bao gồm (~phút)
~— min
Phát hiện giới tính
Phân loại giới tính dựa trên giọng nói + ngữ cảnh
Mức lương cơ bản
$0.02/min
Vượt quá
$0.02/min
Bao gồm (~phút)
~— min
Phiên âm (STT)
Chuyển đổi giọng nói thành văn bản bằng Deepgram kèm theo phân tách giọng nói.
Mức lương cơ bản
$0.04/min
Vượt quá
$0.05/min
Bao gồm (~phút)
~— min
Bản dịch
Google Translate
Mức lương cơ bản
$0.02/min
Vượt quá
$0.03/min
Bao gồm (~phút)
~— min
Chuyển văn bản thành giọng nói
Google TTS + các nhà cung cấp khác
Mức lương cơ bản
$0.05/min
Vượt quá
$0.06/min
Bao gồm (~phút)
~— min
Ghép giọng nói
Công nghệ sao chép giọng nói độc quyền (trọn gói)
Mức lương cơ bản
$0.08/min
Vượt quá
$0.10/min
Bao gồm (~phút)
~— min
Người sáng tạo
Lồng tiếng video
Bao gồm (~phút)
30 min
Mức lương cơ bản (hàng năm)
$2.64/min
Vượt quá
$3.20/min
API Dịch vụ
Phiên âm + Dịch thuật + Âm thanh giọng nói
Bản dịch đầy đủ API bundle
Mức lương cơ bản
$0.11/min
Vượt quá
$0.13/min
Bao gồm (~phút)
~— min
Dịch + Âm thanh giọng nói
Gói dịch thuật + âm thanh giọng nói
Mức lương cơ bản
$0.10/min
Vượt quá
$0.11/min
Bao gồm (~phút)
~— min
Chỉ âm thanh giọng nói
Gói chỉ âm thanh giọng nói
Mức lương cơ bản
$0.08/min
Vượt quá
$0.10/min
Bao gồm (~phút)
~— min
Tách âm thanh
Bản ghi âm giọng nói đã được khử nhiễu độc quyền
Mức lương cơ bản
$0.02/min
Vượt quá
$0.02/min
Bao gồm (~phút)
~— min
Phát hiện giới tính
Phân loại giới tính dựa trên giọng nói + ngữ cảnh
Mức lương cơ bản
$0.01/min
Vượt quá
$0.02/min
Bao gồm (~phút)
~— min
Phiên âm (STT)
Chuyển đổi giọng nói thành văn bản bằng Deepgram kèm theo phân tách giọng nói.
Mức lương cơ bản
$0.03/min
Vượt quá
$0.04/min
Bao gồm (~phút)
~— min
Bản dịch
Google Translate
Mức lương cơ bản
$0.02/min
Vượt quá
$0.03/min
Bao gồm (~phút)
~— min
Chuyển văn bản thành giọng nói
Google TTS + các nhà cung cấp khác
Mức lương cơ bản
$0.04/min
Vượt quá
$0.05/min
Bao gồm (~phút)
~— min
Ghép giọng nói
Công nghệ sao chép giọng nói độc quyền (trọn gói)
Mức lương cơ bản
$0.06/min
Vượt quá
$0.08/min
Bao gồm (~phút)
~— min
Chuyên nghiệp
Lồng tiếng video
Bao gồm (~phút)
120 min
Mức lương cơ bản (hàng năm)
$1.99/min
Vượt quá
$2.80/min
API Dịch vụ
Phiên âm + Dịch thuật + Âm thanh giọng nói
Bản dịch đầy đủ API bundle
Mức lương cơ bản
$0.10/min
Vượt quá
$0.11/min
Bao gồm (~phút)
~— min
Dịch + Âm thanh giọng nói
Gói dịch thuật + âm thanh giọng nói
Mức lương cơ bản
$0.08/min
Vượt quá
$0.10/min
Bao gồm (~phút)
~— min
Chỉ âm thanh giọng nói
Gói chỉ âm thanh giọng nói
Mức lương cơ bản
$0.06/min
Vượt quá
$0.08/min
Bao gồm (~phút)
~— min
Tách âm thanh
Bản ghi âm giọng nói đã được khử nhiễu độc quyền
Mức lương cơ bản
$0.02/min
Vượt quá
$0.02/min
Bao gồm (~phút)
~— min
Phát hiện giới tính
Phân loại giới tính dựa trên giọng nói + ngữ cảnh
Mức lương cơ bản
$0.01/min
Vượt quá
$0.01/min
Bao gồm (~phút)
~— min
Phiên âm (STT)
Chuyển đổi giọng nói thành văn bản bằng Deepgram kèm theo phân tách giọng nói.
Mức lương cơ bản
$0.02/min
Vượt quá
$0.03/min
Bao gồm (~phút)
~— min
Bản dịch
Google Translate
Mức lương cơ bản
$0.02/min
Vượt quá
$0.02/min
Bao gồm (~phút)
~— min
Chuyển văn bản thành giọng nói
Google TTS + các nhà cung cấp khác
Mức lương cơ bản
$0.03/min
Vượt quá
$0.04/min
Bao gồm (~phút)
~— min
Ghép giọng nói
Công nghệ sao chép giọng nói độc quyền (trọn gói)
Mức lương cơ bản
$0.05/min
Vượt quá
$0.06/min
Bao gồm (~phút)
~— min
Việc kinh doanh
Lồng tiếng video
Bao gồm (~phút)
500 min
Mức lương cơ bản (hàng năm)
$1.60/min
Vượt quá
$2.40/min
API Dịch vụ
Phiên âm + Dịch thuật + Âm thanh giọng nói
Bản dịch đầy đủ API bundle
Mức lương cơ bản
$0.08/min
Vượt quá
$0.10/min
Bao gồm (~phút)
~— min
Dịch + Âm thanh giọng nói
Gói dịch thuật + âm thanh giọng nói
Mức lương cơ bản
$0.06/min
Vượt quá
$0.08/min
Bao gồm (~phút)
~— min
Chỉ âm thanh giọng nói
Gói chỉ âm thanh giọng nói
Mức lương cơ bản
$0.05/min
Vượt quá
$0.06/min
Bao gồm (~phút)
~— min
Tách âm thanh
Bản ghi âm giọng nói đã được khử nhiễu độc quyền
Mức lương cơ bản
$0.01/min
Vượt quá
$0.02/min
Bao gồm (~phút)
~— min
Phát hiện giới tính
Phân loại giới tính dựa trên giọng nói + ngữ cảnh
Mức lương cơ bản
$0.01/min
Vượt quá
$0.01/min
Bao gồm (~phút)
~— min
Phiên âm (STT)
Chuyển đổi giọng nói thành văn bản bằng Deepgram kèm theo phân tách giọng nói.
Mức lương cơ bản
$0.02/min
Vượt quá
$0.03/min
Bao gồm (~phút)
~— min
Bản dịch
Google Translate
Mức lương cơ bản
$0.02/min
Vượt quá
$0.02/min
Bao gồm (~phút)
~— min
Chuyển văn bản thành giọng nói
Google TTS + các nhà cung cấp khác
Mức lương cơ bản
$0.02/min
Vượt quá
$0.03/min
Bao gồm (~phút)
~— min
Ghép giọng nói
Công nghệ sao chép giọng nói độc quyền (trọn gói)
Mức lương cơ bản
$0.03/min
Vượt quá
$0.05/min
Bao gồm (~phút)
~— min
Số phút hiển thị là số phút tương đương — số phút sử dụng dịch vụ của bạn được chia sẻ giữa tất cả các dịch vụ. Sử dụng dịch vụ có chi phí thấp hơn sẽ tiêu tốn ít điểm tín dụng hơn mỗi phút.