Nhà phát triển API

Tích hợp tính năng bản địa hóa Addavox vào quy trình làm việc của bạn. Chọn tùy chọn Dịch thuật API để dịch âm thanh độc lập, hoặc tùy chọn Lồng tiếng Video API để bản địa hóa video đầy đủ với căn chỉnh thời gian, kiểm tra chất lượng và phụ đề.

API Keys

Tạo các khóa API trong ứng dụng Addavox . Mỗi khóa sử dụng cùng gói cước và số phút được bao gồm như tài khoản của bạn.

Quản lý các khóa API

URL cơ sở: https://api.addavox.com/api/v1

Tiêu đề xác thực: X- API -Key: YOUR_KEY

Tổng quan về dịch vụ

Hai bảng API dành cho các nhu cầu bản địa hóa khác nhau.

Bản dịch API
Điểm cuối
POST /api/v1/localize
Đầu ra
Âm thanh tuần tự độc lập
Ngôn ngữ
Một yêu cầu mỗi lần
Kiểm định chất lượng
Không có

Từ $0.05/phút

Xem chi tiết ↓
Lồng tiếng video API
Điểm cuối
POST /api/v1/localize-video
Đầu ra
Video + âm thanh + phụ đề theo từng ngôn ngữ
Ngôn ngữ
Nhiều yêu cầu cho mỗi đơn hàng
Kiểm định chất lượng
Đảm bảo chất lượng LLM được bao gồm
Ôn tập
Mời người đánh giá thông qua liên kết đặc biệt

Từ $1.60/phút mỗi ngôn ngữ

Mức phí hàng năm dành cho doanh nghiệp.

Xem chi tiết ↓

Bản dịch API

Điểm cuối duy nhất: POST /api/v1/localize — tạo bản ghi âm đã dịch độc lập từ nội dung nguồn của bạn.

Ứng dụng web so với API này: khi bạn sử dụng sản phẩm Addavox trong trình duyệt, các tác vụ chỉnh sửa phân đoạn và bản địa hóa sẽ giữ nguyên âm thanh xem trước trên mỗi phân đoạn và trì hoãn chương trình đã được phối trộn hoàn chỉnh cho đến khi bạn tải xuống các tài nguyên từ trang dự án. Các điểm cuối v1 này xây dựng đầu ra đã được ghép nối như một phần của tác vụ để các máy khách API có thể lấy kết quả mà không cần bước xuất riêng biệt.

Phiên âm + Dịch thuật + Âm thanh giọng nói

Bạn cung cấp

  • Âm thanh nguồn
  • Ngôn ngữ nguồn + ngôn ngữ đích

Chúng tôi xử lý

  • Phiên âm
  • Bản dịch
  • âm thanh giọng nói phù hợp với người nói
  • Khâu nối tiếp

Từ $0.08/phút

Giá gói dịch vụ doanh nghiệp. Xem bảng giá →

Dịch + Âm thanh giọng nói

Bạn cung cấp

  • Âm thanh nguồn
  • Phiên âm có đánh dấu thời gian theo từng đoạn.
  • Ngôn ngữ nguồn + ngôn ngữ đích

Chúng tôi xử lý

  • Bản dịch
  • âm thanh giọng nói phù hợp với người nói
  • Khâu nối tiếp

Từ $0.06/phút

Giá gói dịch vụ doanh nghiệp. Xem bảng giá →

Chỉ âm thanh giọng nói

Bạn cung cấp

  • Âm thanh nguồn
  • Phiên âm + dịch thuật có đánh dấu thời gian theo từng đoạn

Chúng tôi xử lý

  • âm thanh giọng nói phù hợp với người nói
  • Khâu nối tiếp

Từ $0.05/phút

Giá gói dịch vụ doanh nghiệp. Xem bảng giá →

Cách thức hoạt động

Định dạng đầu ra

Tệp API tạo ra một tệp âm thanh tuần tự độc lập. Mỗi đoạn được dịch được tạo ra và ghép lại với nhau theo thứ tự, có những khoảng dừng ngắn giữa chúng. Đầu ra không được đồng bộ hóa thời gian với nguồn gốc ban đầu — đó là một tệp âm thanh mới được thiết kế để nghe độc ​​lập.

Tại sao cần cung cấp nguồn âm thanh và mốc thời gian?

Dấu thời gian của âm thanh nguồn và phân đoạn (start_time, end_time) được sử dụng để xác định và khớp giọng nói của từng người nói trong bản ghi âm gốc. Điều này cho phép âm thanh được tạo ra nghe giống như giọng nói của người nói gốc. Các dấu thời gian này không kiểm soát thời gian phát ra.

Không có kiểm tra chất lượng hoặc khớp thời lượng

Không giống như Lồng tiếng video, chức năng Dịch thuật API không thực hiện viết lại văn bản, điều chỉnh nhịp độ hoặc căn chỉnh thời gian. Chính điều này làm cho nó nhanh hơn và tiết kiệm chi phí hơn. Nếu bạn cần đồng bộ âm thanh với video gốc theo từng khung hình, hãy sử dụng chức năng Lồng tiếng video API .

Ví dụ mã

Lồng tiếng video API

Điểm cuối: POST /api/v1/localize-video — dịch thuật video hoàn chỉnh bao gồm thời gian, kiểm tra chất lượng và phụ đề.

Các công việc được bắt đầu thông qua API này sẽ tạo ra các sản phẩm bàn giao theo từng ngôn ngữ khi công việc hoàn thành. Ứng dụng Addavox trên trình duyệt sử dụng cùng một công cụ bản địa hóa nhưng chuyển toàn bộ tài sản hỗn hợp sang quy trình Tải xuống dự án trừ khi có ghi chú khác.

Bạn cung cấp

  • URL video
  • Ngôn ngữ nguồn
  • Ngôn ngữ mục tiêu (một hoặc nhiều)

Chúng tôi xử lý

  • Tách âm thanh/video
  • Phiên âm
  • Bản dịch
  • LLM QA
  • Tổng hợp giọng nói
  • Căn chỉnh thời gian
  • Tạo phụ đề
  • Hiển thị video theo từng ngôn ngữ

Định dạng đầu ra

Video, âm thanh và phụ đề cho từng ngôn ngữ. Có sẵn file nén ZIP chứa tất cả các ngôn ngữ để tải xuống. Các URL đã được ký sẽ hết hạn sau 24 giờ.

Việc làm đa ngôn ngữ

Một yêu cầu, nhiều ngôn ngữ. Công việc chính sẽ tạo ra các công việc con cho mỗi ngôn ngữ. Kiểm tra trạng thái của công việc chính theo từng ngôn ngữ. Các giá trị trạng thái: đang chờ xử lý → đang chạy → đã hoàn thành | thất bại.

Quy trình làm việc của người đánh giá

Mời người đánh giá thông qua API . Mỗi người đánh giá sẽ nhận được một email chứa liên kết để chỉnh sửa bản địa hóa trong trình soạn thảo web — không cần tài khoản.

Ví dụ mã

API Tài liệu tham khảo

Toàn bộ lược đồ tương tác và các điểm cuối bổ sung có sẵn thông qua Open API .

Điểm cuối

POST /localize Bản dịch trước / bản ghi âm một phần
POST /localize-video Lồng tiếng video đầy đủ (đa ngôn ngữ)
GET /jobs/{job_id} Tình trạng việc làm
GET /jobs/{job_id}/result Sản phẩm bàn giao (URL, mã zip)
GET /jobs Liệt kê việc làm
DELETE /jobs/{job_id} Hủy bỏ công việc
GET /account Thông tin tài khoản
GET /voices Danh mục giọng nói TTS
GET /languages Ngôn ngữ được hỗ trợ
POST /projects/{id}/reviewers Mời người đánh giá
GET|POST /jobs/{id}/webhooks Trạng thái Webhook / thử lại

API Bảng giá dịch vụ

Bảng giá theo phút tùy thuộc vào gói đăng ký. Giá dưới đây phản ánh giá hàng năm của gói Doanh nghiệp (giảm giá 20%). Xem bảng đầy đủ cho từng gói và dịch vụ.

Giá gói dịch vụ doanh nghiệp được hiển thị đã bao gồm chiết khấu hàng năm.

Miễn phí

Lồng tiếng video

Bao gồm (~phút)

2 min

Mức lương cơ bản (hàng năm)

/min

Vượt quá

$4.00/min

API Dịch vụ

Tách âm thanh

Bản ghi âm giọng nói đã được khử nhiễu độc quyền

Mức lương cơ bản

$0.03/min

Vượt quá

$0.04/min

Bao gồm (~phút)

~— min

Phát hiện giới tính

Phân loại giới tính dựa trên giọng nói + ngữ cảnh

Mức lương cơ bản

$0.02/min

Vượt quá

$0.02/min

Bao gồm (~phút)

~— min

Phiên âm (STT)

Chuyển đổi giọng nói thành văn bản bằng Deepgram kèm theo phân tách giọng nói.

Mức lương cơ bản

$0.05/min

Vượt quá

$0.06/min

Bao gồm (~phút)

~— min

Bản dịch

Google Translate

Mức lương cơ bản

$0.03/min

Vượt quá

$0.04/min

Bao gồm (~phút)

~— min

Chuyển văn bản thành giọng nói

Google TTS + các nhà cung cấp khác

Mức lương cơ bản

$0.06/min

Vượt quá

$0.08/min

Bao gồm (~phút)

~— min

Ghép giọng nói

Công nghệ sao chép giọng nói độc quyền (trọn gói)

Mức lương cơ bản

$0.08/min

Vượt quá

$0.10/min

Bao gồm (~phút)

~— min

Người mới bắt đầu

Lồng tiếng video

Bao gồm (~phút)

10 min

Mức lương cơ bản (hàng năm)

$2.80/min

Vượt quá

$3.60/min

API Dịch vụ

Tách âm thanh

Bản ghi âm giọng nói đã được khử nhiễu độc quyền

Mức lương cơ bản

$0.02/min

Vượt quá

$0.03/min

Bao gồm (~phút)

~— min

Phát hiện giới tính

Phân loại giới tính dựa trên giọng nói + ngữ cảnh

Mức lương cơ bản

$0.02/min

Vượt quá

$0.02/min

Bao gồm (~phút)

~— min

Phiên âm (STT)

Chuyển đổi giọng nói thành văn bản bằng Deepgram kèm theo phân tách giọng nói.

Mức lương cơ bản

$0.04/min

Vượt quá

$0.05/min

Bao gồm (~phút)

~— min

Bản dịch

Google Translate

Mức lương cơ bản

$0.02/min

Vượt quá

$0.03/min

Bao gồm (~phút)

~— min

Chuyển văn bản thành giọng nói

Google TTS + các nhà cung cấp khác

Mức lương cơ bản

$0.05/min

Vượt quá

$0.06/min

Bao gồm (~phút)

~— min

Ghép giọng nói

Công nghệ sao chép giọng nói độc quyền (trọn gói)

Mức lương cơ bản

$0.08/min

Vượt quá

$0.10/min

Bao gồm (~phút)

~— min

Người sáng tạo

Lồng tiếng video

Bao gồm (~phút)

30 min

Mức lương cơ bản (hàng năm)

$2.64/min

Vượt quá

$3.20/min

API Dịch vụ

Phiên âm + Dịch thuật + Âm thanh giọng nói

Bản dịch đầy đủ API bundle

Mức lương cơ bản

$0.11/min

Vượt quá

$0.13/min

Bao gồm (~phút)

~— min

Dịch + Âm thanh giọng nói

Gói dịch thuật + âm thanh giọng nói

Mức lương cơ bản

$0.10/min

Vượt quá

$0.11/min

Bao gồm (~phút)

~— min

Chỉ âm thanh giọng nói

Gói chỉ âm thanh giọng nói

Mức lương cơ bản

$0.08/min

Vượt quá

$0.10/min

Bao gồm (~phút)

~— min

Tách âm thanh

Bản ghi âm giọng nói đã được khử nhiễu độc quyền

Mức lương cơ bản

$0.02/min

Vượt quá

$0.02/min

Bao gồm (~phút)

~— min

Phát hiện giới tính

Phân loại giới tính dựa trên giọng nói + ngữ cảnh

Mức lương cơ bản

$0.01/min

Vượt quá

$0.02/min

Bao gồm (~phút)

~— min

Phiên âm (STT)

Chuyển đổi giọng nói thành văn bản bằng Deepgram kèm theo phân tách giọng nói.

Mức lương cơ bản

$0.03/min

Vượt quá

$0.04/min

Bao gồm (~phút)

~— min

Bản dịch

Google Translate

Mức lương cơ bản

$0.02/min

Vượt quá

$0.03/min

Bao gồm (~phút)

~— min

Chuyển văn bản thành giọng nói

Google TTS + các nhà cung cấp khác

Mức lương cơ bản

$0.04/min

Vượt quá

$0.05/min

Bao gồm (~phút)

~— min

Ghép giọng nói

Công nghệ sao chép giọng nói độc quyền (trọn gói)

Mức lương cơ bản

$0.06/min

Vượt quá

$0.08/min

Bao gồm (~phút)

~— min

Chuyên nghiệp

Lồng tiếng video

Bao gồm (~phút)

120 min

Mức lương cơ bản (hàng năm)

$1.99/min

Vượt quá

$2.80/min

API Dịch vụ

Phiên âm + Dịch thuật + Âm thanh giọng nói

Bản dịch đầy đủ API bundle

Mức lương cơ bản

$0.10/min

Vượt quá

$0.11/min

Bao gồm (~phút)

~— min

Dịch + Âm thanh giọng nói

Gói dịch thuật + âm thanh giọng nói

Mức lương cơ bản

$0.08/min

Vượt quá

$0.10/min

Bao gồm (~phút)

~— min

Chỉ âm thanh giọng nói

Gói chỉ âm thanh giọng nói

Mức lương cơ bản

$0.06/min

Vượt quá

$0.08/min

Bao gồm (~phút)

~— min

Tách âm thanh

Bản ghi âm giọng nói đã được khử nhiễu độc quyền

Mức lương cơ bản

$0.02/min

Vượt quá

$0.02/min

Bao gồm (~phút)

~— min

Phát hiện giới tính

Phân loại giới tính dựa trên giọng nói + ngữ cảnh

Mức lương cơ bản

$0.01/min

Vượt quá

$0.01/min

Bao gồm (~phút)

~— min

Phiên âm (STT)

Chuyển đổi giọng nói thành văn bản bằng Deepgram kèm theo phân tách giọng nói.

Mức lương cơ bản

$0.02/min

Vượt quá

$0.03/min

Bao gồm (~phút)

~— min

Bản dịch

Google Translate

Mức lương cơ bản

$0.02/min

Vượt quá

$0.02/min

Bao gồm (~phút)

~— min

Chuyển văn bản thành giọng nói

Google TTS + các nhà cung cấp khác

Mức lương cơ bản

$0.03/min

Vượt quá

$0.04/min

Bao gồm (~phút)

~— min

Ghép giọng nói

Công nghệ sao chép giọng nói độc quyền (trọn gói)

Mức lương cơ bản

$0.05/min

Vượt quá

$0.06/min

Bao gồm (~phút)

~— min

Việc kinh doanh

Lồng tiếng video

Bao gồm (~phút)

500 min

Mức lương cơ bản (hàng năm)

$1.60/min

Vượt quá

$2.40/min

API Dịch vụ

Phiên âm + Dịch thuật + Âm thanh giọng nói

Bản dịch đầy đủ API bundle

Mức lương cơ bản

$0.08/min

Vượt quá

$0.10/min

Bao gồm (~phút)

~— min

Dịch + Âm thanh giọng nói

Gói dịch thuật + âm thanh giọng nói

Mức lương cơ bản

$0.06/min

Vượt quá

$0.08/min

Bao gồm (~phút)

~— min

Chỉ âm thanh giọng nói

Gói chỉ âm thanh giọng nói

Mức lương cơ bản

$0.05/min

Vượt quá

$0.06/min

Bao gồm (~phút)

~— min

Tách âm thanh

Bản ghi âm giọng nói đã được khử nhiễu độc quyền

Mức lương cơ bản

$0.01/min

Vượt quá

$0.02/min

Bao gồm (~phút)

~— min

Phát hiện giới tính

Phân loại giới tính dựa trên giọng nói + ngữ cảnh

Mức lương cơ bản

$0.01/min

Vượt quá

$0.01/min

Bao gồm (~phút)

~— min

Phiên âm (STT)

Chuyển đổi giọng nói thành văn bản bằng Deepgram kèm theo phân tách giọng nói.

Mức lương cơ bản

$0.02/min

Vượt quá

$0.03/min

Bao gồm (~phút)

~— min

Bản dịch

Google Translate

Mức lương cơ bản

$0.02/min

Vượt quá

$0.02/min

Bao gồm (~phút)

~— min

Chuyển văn bản thành giọng nói

Google TTS + các nhà cung cấp khác

Mức lương cơ bản

$0.02/min

Vượt quá

$0.03/min

Bao gồm (~phút)

~— min

Ghép giọng nói

Công nghệ sao chép giọng nói độc quyền (trọn gói)

Mức lương cơ bản

$0.03/min

Vượt quá

$0.05/min

Bao gồm (~phút)

~— min

Số phút hiển thị là số phút tương đương — số phút sử dụng dịch vụ của bạn được chia sẻ giữa tất cả các dịch vụ. Sử dụng dịch vụ có chi phí thấp hơn sẽ tiêu tốn ít điểm tín dụng hơn mỗi phút.