Deweloper API
Zintegruj lokalizację Addavox ze swoim procesem pracy. Wybierz opcję Tłumaczenie API dla samodzielnego tłumaczenia audio lub Dubbing Wideo API dla pełnej lokalizacji wideo z synchronizacją, kontrolą jakości i napisami.
API Klawisze
Wygeneruj klucze API w aplikacji Addavox . Każdy klucz korzysta z tego samego planu i minut, co Twoje konto.
Zarządzaj kluczami APIPodstawowy adres URL:
https://api.addavox.com/api/v1
Nagłówek autoryzacji:
X- API -Klucz: TWÓJ_KLUCZ
Przegląd usług
Dwa API dla różnych potrzeb lokalizacyjnych.
- Punkt końcowy
POST /api/v1/localize- Wyjście
- Samodzielny sekwencyjny dźwięk
- Języki
- Pojedynczy na żądanie
- Zapewnienie jakości
- Nic
Z $0.05/min
Zobacz szczegóły ↓- Punkt końcowy
POST /api/v1/localize-video- Wyjście
- Wideo + dźwięk + napisy w każdym języku
- Języki
- Wiele na żądanie
- Zapewnienie jakości
- LLM QA w zestawie
- Recenzja
- Zaproś recenzentów za pomocą magicznego linku
Z $1.60/min na język
Roczna stopa oprocentowania firmy.
Zobacz szczegóły ↓Tłumaczenie API
Pojedynczy punkt końcowy: POST /api/v1/localize — generuj samodzielne przetłumaczone pliki audio z treści źródłowej.
Aplikacja internetowa a ten API : gdy używasz produktu Addavox w przeglądarce, zadania edycji i lokalizacji segmentów zachowują podgląd audio dla każdego segmentu i odkładają pełny program miksowany do momentu pobrania zasobów ze strony projektu. Te punkty końcowe v1 tworzą zszyte dane wyjściowe jako część zadania, dzięki czemu klienci API mogą pobierać wyniki bez oddzielnego kroku eksportu.
Ty dostarczasz
- Źródło dźwięku
- Język źródłowy + język docelowy
My się tym zajmujemy
- Transkrypcja
- Tłumaczenie
- Dźwięk głosu dopasowany do mówcy
- Szycie sekwencyjne
Z $0.08/min
Stawka planu biznesowego. Zobacz cennik →
Ty dostarczasz
- Źródło dźwięku
- Transkrypcja ze znacznikami czasu według segmentu
- Język źródłowy + język docelowy
My się tym zajmujemy
- Tłumaczenie
- Dźwięk głosu dopasowany do mówcy
- Szycie sekwencyjne
Z $0.06/min
Stawka planu biznesowego. Zobacz cennik →
Ty dostarczasz
- Źródło dźwięku
- Transkrypcja + tłumaczenie ze znacznikami czasu dla segmentów
My się tym zajmujemy
- Dźwięk głosu dopasowany do mówcy
- Szycie sekwencyjne
Z $0.05/min
Stawka planu biznesowego. Zobacz cennik →
Jak to działa
Format wyjściowy
API generuje samodzielny, sekwencyjny plik audio. Każdy przetłumaczony segment jest generowany i łączony w kolejności, z krótkimi przerwami między nimi. Wynik nie jest wyrównany czasowo do oryginału — jest to nowy plik audio przeznaczony do niezależnego słuchania.
Dlaczego należy podawać źródłowy dźwięk i znaczniki czasu?
Znaczniki czasu źródłowego dźwięku i segmentu (start_time, end_time) służą do identyfikacji i dopasowania głosu każdego mówcy w oryginalnym nagraniu. Dzięki temu wygenerowany dźwięk brzmi jak głosy oryginalnych mówców. Znaczniki czasu nie kontrolują synchronizacji wyjściowej.
Brak kontroli jakości i dopasowania czasu trwania
W przeciwieństwie do dubbingu wideo, funkcja tłumaczenia API nie przepisuje tekstu, nie dostosowuje tempa ani nie wyrównuje synchronizacji. Dzięki temu jest szybsza i tańsza. Jeśli potrzebujesz zsynchronizować dźwięk z oryginalnym wideo z synchronizacją na poziomie klatki, użyj funkcji dubbingu wideo API .
Przykłady kodu
Dubbing wideo API
Punkt końcowy: POST /api/v1/localize-video — pełna lokalizacja wideo z uwzględnieniem czasu, kontroli jakości i napisów.
Zadania rozpoczęte za pośrednictwem API generują materiały w poszczególnych językach po zakończeniu pracy. Aplikacja Addavox działająca w przeglądarce korzysta z tego samego silnika lokalizacji, ale przekazuje pełne zasoby mieszane do procesu pobierania projektu, o ile nie zaznaczono inaczej.
Ty dostarczasz
- Adres URL filmu
- Język źródłowy
- Języki docelowe (jeden lub więcej)
My się tym zajmujemy
- Separacja dźwięku i obrazu
- Transkrypcja
- Tłumaczenie
- LLM QA
- Synteza głosu
- Wyrównanie czasowe
- Generowanie napisów
- Renderowanie wideo według języka
Format wyjściowy
Wideo + dźwięk + napisy w różnych językach. Dostępny jest również plik zip zawierający wszystkie języki. Podpisane adresy URL wygasają po 24 godzinach.
Praca w wielu językach
Jedno żądanie, wiele języków. Zadanie główne generuje zadania podrzędne dla każdego języka. Zapytaj zadanie główne o status dla każdego języka. Wartości statusu: w kolejce → wykonywane → ukończone | niepowodzenie.
Przepływ pracy recenzenta
Zaproś recenzentów za pośrednictwem API . Każdy recenzent otrzyma e-mail z magicznym linkiem umożliwiającym edycję lokalizacji w edytorze internetowym — nie jest wymagane konto.
Przykłady kodu
Zgoda i autoryzacja
Wszystkie żądania API muszą zawierać obiekt zgody i pole trybu najwyższego poziomu. Razem tworzą one rekord poświadczenia dla każdego zadania, potwierdzający posiadanie niezbędnych uprawnień i zgód prelegentów.
Pole trybu określa syntezę głosu: „voice_matched” korzysta z klonowania głosu mówcy, „standard” korzysta z syntetycznego syntezatora mowy (TS). Oba tryby mają tę samą cenę — wybór zależy wyłącznie od zgody.
Tryb dopasowania głosu — wymagana pełna zgoda
Tryb standardowy — tylko prawa do treści
Odniesienie terenowe
| Pole | Typ | Wymagany | Opis |
|---|---|---|---|
| mode | string | Najwyższego poziomu | voice_matched Lub standard |
| speaker_consent_obtained | boolean | tylko z dopasowaniem głosowym | Wyraźna zgoda od identyfikowalnych mówców |
| content_rights_confirmed | boolean | Oba tryby | Własność lub ważna licencja na treść |
| eula_accepted | boolean | Oba tryby | Akceptuje Addavox EULA |
| attested_by | string | Oba tryby | Adres e-mail lub identyfikator strony odpowiedzialnej |
| attested_at | ISO 8601 | Oba tryby | W ciągu 24 godzin od złożenia wniosku |
Kody błędów zgody
| HTTP | Kod | Stan |
|---|---|---|
| 403 | CONSENT_MISSING | Brak obiektu zgody |
| 403 | CONSENT_INCOMPLETE | Brak attested_by lub nieprawidłowy attested_at |
| 403 | CONSENT_NOT_AFFIRMED | Prawa lub umowa EULA nie zostały potwierdzone |
| 403 | CONSENT_EXPIRED | poświadczone_na starsze niż 24 godziny |
| 403 | SPEAKER_CONSENT_REQUIRED | voice_matched bez zgody mówcy |
| 400 | INVALID_MODE | Nieprawidłowa wartość trybu |
API Odniesienie
Pełny interaktywny schemat i dodatkowe punkty końcowe są dostępne poprzez Open API .
Punkty końcowe
| POST /localize | Lokalizacja wstępnie przetłumaczonego/częściowo transkrypcyjnego nagrania audio |
| POST /localize-video | Pełny dubbing wideo (wielojęzyczny) |
| GET /jobs/{job_id} | Status pracy |
| GET /jobs/{job_id}/result | Produkty dostarczane (adresy URL, kod pocztowy) |
| GET /jobs | Wyświetl listę zadań |
| DELETE /jobs/{job_id} | Anuluj zadanie |
| GET /account | Informacje o koncie |
| GET /voices | Katalog głosów TTS |
| GET /languages | Obsługiwane języki |
| POST /projects/{id}/reviewers | Zaproś recenzenta |
| GET|POST /jobs/{id}/webhooks | Status webhooka / ponowienie próby |
API Cennik usług
Stawki za minutę według planu abonamentowego. Poniższe stawki odzwierciedlają ceny roczne planu Business (zniżka 20%). Zobacz pełną tabelę dla każdego planu i usługi.
Podano stawki planów biznesowych z uwzględnieniem rocznego rabatu.
Bezpłatny
Dubbing wideo
W zestawie (~min)
2 min
Stawka bazowa (roczna)
/min
Przekroczenie limitu
$4.00/min
API Usługi
Separacja dźwięku
Własnościowa, odszumiona ścieżka głosowa
Stawka bazowa
$0.03/min
Przekroczenie limitu
$0.04/min
W zestawie (~min)
~— min
Wykrywanie płci
Klasyfikacja płci na podstawie głosu i kontekstu
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.02/min
W zestawie (~min)
~— min
Transkrypcja (STT)
Deepgram zamiany mowy na tekst z diaryzacją
Stawka bazowa
$0.05/min
Przekroczenie limitu
$0.06/min
W zestawie (~min)
~— min
Tłumaczenie
Tłumacz Google
Stawka bazowa
$0.03/min
Przekroczenie limitu
$0.04/min
W zestawie (~min)
~— min
Tekst na mowę
Google TTS + inni dostawcy
Stawka bazowa
$0.06/min
Przekroczenie limitu
$0.08/min
W zestawie (~min)
~— min
Dopasowanie głosu
Własnościowe klonowanie głosu (wszystko w jednym)
Stawka bazowa
$0.08/min
Przekroczenie limitu
$0.10/min
W zestawie (~min)
~— min
Rozrusznik
Dubbing wideo
W zestawie (~min)
10 min
Stawka bazowa (roczna)
$2.80/min
Przekroczenie limitu
$3.60/min
API Usługi
Separacja dźwięku
Własnościowa, odszumiona ścieżka głosowa
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.03/min
W zestawie (~min)
~— min
Wykrywanie płci
Klasyfikacja płci na podstawie głosu i kontekstu
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.02/min
W zestawie (~min)
~— min
Transkrypcja (STT)
Deepgram zamiany mowy na tekst z diaryzacją
Stawka bazowa
$0.04/min
Przekroczenie limitu
$0.05/min
W zestawie (~min)
~— min
Tłumaczenie
Tłumacz Google
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.03/min
W zestawie (~min)
~— min
Tekst na mowę
Google TTS + inni dostawcy
Stawka bazowa
$0.05/min
Przekroczenie limitu
$0.06/min
W zestawie (~min)
~— min
Dopasowanie głosu
Własnościowe klonowanie głosu (wszystko w jednym)
Stawka bazowa
$0.08/min
Przekroczenie limitu
$0.10/min
W zestawie (~min)
~— min
Twórca
Dubbing wideo
W zestawie (~min)
30 min
Stawka bazowa (roczna)
$2.64/min
Przekroczenie limitu
$3.20/min
API Usługi
Transkrybuj + Tłumacz + Głos Audio
Pełne tłumaczenie API pakiet
Stawka bazowa
$0.11/min
Przekroczenie limitu
$0.13/min
W zestawie (~min)
~— min
Tłumaczenie + Głos Audio
Pakiet audio z tłumaczeniem i głosem
Stawka bazowa
$0.10/min
Przekroczenie limitu
$0.11/min
W zestawie (~min)
~— min
Tylko dźwięk głosowy
Pakiet tylko z dźwiękiem głosowym
Stawka bazowa
$0.08/min
Przekroczenie limitu
$0.10/min
W zestawie (~min)
~— min
Separacja dźwięku
Własnościowa, odszumiona ścieżka głosowa
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.02/min
W zestawie (~min)
~— min
Wykrywanie płci
Klasyfikacja płci na podstawie głosu i kontekstu
Stawka bazowa
$0.01/min
Przekroczenie limitu
$0.02/min
W zestawie (~min)
~— min
Transkrypcja (STT)
Deepgram zamiany mowy na tekst z diaryzacją
Stawka bazowa
$0.03/min
Przekroczenie limitu
$0.04/min
W zestawie (~min)
~— min
Tłumaczenie
Tłumacz Google
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.03/min
W zestawie (~min)
~— min
Tekst na mowę
Google TTS + inni dostawcy
Stawka bazowa
$0.04/min
Przekroczenie limitu
$0.05/min
W zestawie (~min)
~— min
Dopasowanie głosu
Własnościowe klonowanie głosu (wszystko w jednym)
Stawka bazowa
$0.06/min
Przekroczenie limitu
$0.08/min
W zestawie (~min)
~— min
Zawodowiec
Dubbing wideo
W zestawie (~min)
120 min
Stawka bazowa (roczna)
$1.99/min
Przekroczenie limitu
$2.80/min
API Usługi
Transkrybuj + Tłumacz + Głos Audio
Pełne tłumaczenie API pakiet
Stawka bazowa
$0.10/min
Przekroczenie limitu
$0.11/min
W zestawie (~min)
~— min
Tłumaczenie + Głos Audio
Pakiet audio z tłumaczeniem i głosem
Stawka bazowa
$0.08/min
Przekroczenie limitu
$0.10/min
W zestawie (~min)
~— min
Tylko dźwięk głosowy
Pakiet tylko z dźwiękiem głosowym
Stawka bazowa
$0.06/min
Przekroczenie limitu
$0.08/min
W zestawie (~min)
~— min
Separacja dźwięku
Własnościowa, odszumiona ścieżka głosowa
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.02/min
W zestawie (~min)
~— min
Wykrywanie płci
Klasyfikacja płci na podstawie głosu i kontekstu
Stawka bazowa
$0.01/min
Przekroczenie limitu
$0.01/min
W zestawie (~min)
~— min
Transkrypcja (STT)
Deepgram zamiany mowy na tekst z diaryzacją
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.03/min
W zestawie (~min)
~— min
Tłumaczenie
Tłumacz Google
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.02/min
W zestawie (~min)
~— min
Tekst na mowę
Google TTS + inni dostawcy
Stawka bazowa
$0.03/min
Przekroczenie limitu
$0.04/min
W zestawie (~min)
~— min
Dopasowanie głosu
Własnościowe klonowanie głosu (wszystko w jednym)
Stawka bazowa
$0.05/min
Przekroczenie limitu
$0.06/min
W zestawie (~min)
~— min
Biznes
Dubbing wideo
W zestawie (~min)
500 min
Stawka bazowa (roczna)
$1.60/min
Przekroczenie limitu
$2.40/min
API Usługi
Transkrybuj + Tłumacz + Głos Audio
Pełne tłumaczenie API pakiet
Stawka bazowa
$0.08/min
Przekroczenie limitu
$0.10/min
W zestawie (~min)
~— min
Tłumaczenie + Głos Audio
Pakiet audio z tłumaczeniem i głosem
Stawka bazowa
$0.06/min
Przekroczenie limitu
$0.08/min
W zestawie (~min)
~— min
Tylko dźwięk głosowy
Pakiet tylko z dźwiękiem głosowym
Stawka bazowa
$0.05/min
Przekroczenie limitu
$0.06/min
W zestawie (~min)
~— min
Separacja dźwięku
Własnościowa, odszumiona ścieżka głosowa
Stawka bazowa
$0.01/min
Przekroczenie limitu
$0.02/min
W zestawie (~min)
~— min
Wykrywanie płci
Klasyfikacja płci na podstawie głosu i kontekstu
Stawka bazowa
$0.01/min
Przekroczenie limitu
$0.01/min
W zestawie (~min)
~— min
Transkrypcja (STT)
Deepgram zamiany mowy na tekst z diaryzacją
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.03/min
W zestawie (~min)
~— min
Tłumaczenie
Tłumacz Google
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.02/min
W zestawie (~min)
~— min
Tekst na mowę
Google TTS + inni dostawcy
Stawka bazowa
$0.02/min
Przekroczenie limitu
$0.03/min
W zestawie (~min)
~— min
Dopasowanie głosu
Własnościowe klonowanie głosu (wszystko w jednym)
Stawka bazowa
$0.03/min
Przekroczenie limitu
$0.05/min
W zestawie (~min)
~— min
Podane minuty są równoważne — pula punktów jest współdzielona przez wszystkie usługi. Korzystanie z tańszej usługi wiąże się z mniejszą liczbą punktów na minutę.