Desarrollador API
Integra la localización Addavox en tu flujo de trabajo. Elige la opción Traducción API para audio traducido independiente, o la opción Doblaje de vídeo API para localización completa de vídeo con sincronización, control de calidad y subtítulos.
API Claves
Genera claves API en la aplicación Addavox . Cada clave utiliza el mismo plan y los mismos minutos incluidos que tu cuenta.
Administrar claves APIURL base:
https://api.addavox.com/api/v1
Encabezado de autenticación:
X- API -Clave: TU_CLAVE
Descripción general del servicio
Dos API para diferentes necesidades de localización.
- Punto final
POST /api/v1/localize- Producción
- Audio secuencial independiente
- Idiomas
- Una sola solicitud
- Control de calidad
- Ninguno
De $0.05/min
Ver detalles ↓- Punto final
POST /api/v1/localize-video- Producción
- Vídeo + audio + subtítulos por idioma
- Idiomas
- Varias por solicitud
- Control de calidad
- LLM QA incluido
- Revisar
- Invite a los revisores a través de un enlace mágico.
De $1.60/min por idioma
Tarifa anual para empresas.
Ver detalles ↓Traducción API
Punto final único: POST /api/v1/localize — genera audio traducido independiente a partir de tu contenido de origen.
Aplicación web frente a este API : cuando se utiliza el producto Addavox en el navegador, las tareas de edición de segmentos y localización mantienen el audio de vista previa en cada segmento y posponen el programa mezclado completo hasta que se descargan los recursos desde la página del proyecto. Estos puntos finales v1 generan la salida combinada como parte de la tarea, de modo que los clientes de API pueden obtener los resultados sin un paso de exportación independiente.
Usted proporciona
- Audio de origen
- Idioma de origen + idioma de destino
Nosotros nos encargamos
- Transcripción
- Traducción
- Audio de voz adaptado al hablante
- Costura secuencial
De $0.08/min
Tarifa del plan de negocios. Ver precios →
Usted proporciona
- Audio de origen
- Transcripción con marcas de tiempo por segmento
- Idioma de origen + idioma de destino
Nosotros nos encargamos
- Traducción
- Audio de voz adaptado al hablante
- Costura secuencial
De $0.06/min
Tarifa del plan de negocios. Ver precios →
Usted proporciona
- Audio de origen
- Transcripción + traducción con marcas de tiempo por segmento
Nosotros nos encargamos
- Audio de voz adaptado al hablante
- Costura secuencial
De $0.05/min
Tarifa del plan de negocios. Ver precios →
Cómo funciona
Formato de salida
El API genera un archivo de audio secuencial independiente. Cada segmento traducido se genera y se une en orden, con breves pausas entre ellos. El resultado no está sincronizado con la fuente original; se trata de un nuevo archivo de audio diseñado para escucharse de forma independiente.
¿Por qué proporcionar el audio original y las marcas de tiempo?
Las marcas de tiempo del audio original y de los segmentos (inicio y fin) se utilizan para identificar y hacer coincidir la voz de cada hablante en la grabación original. Esto permite que el audio generado suene como las voces originales. Estas marcas de tiempo no controlan la sincronización de la salida.
Sin control de calidad ni coincidencia de duración
A diferencia del doblaje de vídeo, la traducción API no realiza reescritura de texto, ajuste de tempo ni alineación de tiempo. Esto es lo que la hace más rápida y económica. Si necesita sincronizar el audio con el vídeo original a nivel de fotograma, utilice el doblaje de vídeo API .
Ejemplos de código
Doblaje de vídeo API
Punto final: POST /api/v1/localize-video — localización completa de vídeo con sincronización, control de calidad y subtítulos.
Los trabajos iniciados a través de este API generan entregables por idioma al finalizar el trabajo. La aplicación en el navegador Addavox utiliza el mismo motor de localización, pero transfiere los recursos mixtos completos al flujo de descarga del proyecto, a menos que se indique lo contrario.
Usted proporciona
- URL del vídeo
- Idioma de origen
- Idiomas de destino (uno o más)
Nosotros nos encargamos
- Separación de audio/video
- Transcripción
- Traducción
- Control de calidad del LLM
- Síntesis de voz
- Alineación de tiempos
- Generación de subtítulos
- Renderizado de vídeo por idioma
Formato de salida
Vídeo, audio y subtítulos por idioma. También está disponible una descarga en formato ZIP con todos los idiomas. Los enlaces firmados caducan a las 24 horas.
Empleos multilingües
Una solicitud, varios idiomas. El proceso principal genera procesos secundarios para cada idioma. Consulte el estado del proceso principal para cada idioma. Valores de estado: en cola → en ejecución → completado | fallido.
Flujo de trabajo del revisor
Invite a revisores humanos a través del API . Cada revisor recibirá un correo electrónico con un enlace mágico para editar la localización en un editor web; no se necesita cuenta.
Ejemplos de código
Consentimiento y autorización
Todas las solicitudes API deben incluir un objeto de consentimiento y un campo de modo de nivel superior. Juntos, crean un registro de certificación por trabajo que confirma que usted posee los derechos necesarios y los consentimientos de los ponentes.
El campo "modo" determina la síntesis de voz: "voice_matched" utiliza la clonación de la voz del hablante, mientras que "standard" utiliza síntesis de voz sintética. Ambos modos tienen el mismo precio; la elección depende exclusivamente del consentimiento del usuario.
Modo de reconocimiento de voz: se requiere consentimiento total.
Modo estándar: solo derechos de contenido
Referencia de campo
| Campo | Tipo | Requerido | Descripción |
|---|---|---|---|
| mode | string | Nivel superior | voice_matched o standard |
| speaker_consent_obtained | boolean | solo coincidencia de voz | Consentimiento explícito de oradores identificables |
| content_rights_confirmed | boolean | Ambos modos | Propiedad o licencia válida del contenido |
| eula_accepted | boolean | Ambos modos | Acepta el CLUF (Acuerdo de Licencia de Usuario Final) Addavox |
| attested_by | string | Ambos modos | Correo electrónico o identificador de la parte responsable |
| attested_at | ISO 8601 | Ambos modos | Dentro de las 24 horas posteriores a la solicitud. |
Códigos de error de consentimiento
| HTTP | Código | Condición |
|---|---|---|
| 403 | CONSENT_MISSING | No hay objeto de consentimiento |
| 403 | CONSENT_INCOMPLETE | Falta attested_by o attested_at no es válido. |
| 403 | CONSENT_NOT_AFFIRMED | Derechos o CLUF no confirmados |
| 403 | CONSENT_EXPIRED | atestiguado hace más de 24 horas |
| 403 | SPEAKER_CONSENT_REQUIRED | Coincidencia de voz sin consentimiento del hablante |
| 400 | INVALID_MODE | Valor de modo no válido |
API Referencia
El esquema interactivo completo y los puntos finales adicionales están disponibles a través de Open API .
Puntos finales
| POST /localize | Localización de audio pretraducida / transcripción parcial |
| POST /localize-video | Doblaje completo del vídeo (multilingüe) |
| GET /jobs/{job_id} | Estado del empleo |
| GET /jobs/{job_id}/result | Entregables (URL, código postal) |
| GET /jobs | Lista de empleos |
| DELETE /jobs/{job_id} | Cancelar trabajo |
| GET /account | Información de la cuenta |
| GET /voices | Catálogo de voces TTS |
| GET /languages | Idiomas compatibles |
| POST /projects/{id}/reviewers | Invitar revisor |
| GET|POST /jobs/{id}/webhooks | Estado del webhook / reintento |
API Precios de los servicios
Tarifas por minuto según el plan de suscripción. Las tarifas que se muestran a continuación corresponden al precio anual del plan Business (20 % de descuento). Consulte la tabla completa para ver todos los planes y servicios.
Las tarifas del plan empresarial se muestran con el descuento anual aplicado.
Gratis
Doblaje de vídeo
Incluido (~min)
2 min
Tasa base (anual)
/min
Exceso
$4.00/min
API Servicios
Separación de audio
Pista de voz con reducción de ruido patentada
Tasa base
$0.03/min
Exceso
$0.04/min
Incluido (~min)
~— min
Detección de género
Clasificación de género a partir de la voz y el contexto.
Tasa base
$0.02/min
Exceso
$0.02/min
Incluido (~min)
~— min
Transcripción (STT)
Conversión de voz a texto con diarización de Deepgram
Tasa base
$0.05/min
Exceso
$0.06/min
Incluido (~min)
~— min
Traducción
Google Translate
Tasa base
$0.03/min
Exceso
$0.04/min
Incluido (~min)
~— min
Conversión de texto a voz
Google TTS + otros proveedores
Tasa base
$0.06/min
Exceso
$0.08/min
Incluido (~min)
~— min
Coincidencia de voz
Clonación de voz patentada (todo incluido)
Tasa base
$0.08/min
Exceso
$0.10/min
Incluido (~min)
~— min
Motor de arranque
Doblaje de vídeo
Incluido (~min)
10 min
Tasa base (anual)
$2.80/min
Exceso
$3.60/min
API Servicios
Separación de audio
Pista de voz con reducción de ruido patentada
Tasa base
$0.02/min
Exceso
$0.03/min
Incluido (~min)
~— min
Detección de género
Clasificación de género a partir de la voz y el contexto.
Tasa base
$0.02/min
Exceso
$0.02/min
Incluido (~min)
~— min
Transcripción (STT)
Conversión de voz a texto con diarización de Deepgram
Tasa base
$0.04/min
Exceso
$0.05/min
Incluido (~min)
~— min
Traducción
Google Translate
Tasa base
$0.02/min
Exceso
$0.03/min
Incluido (~min)
~— min
Conversión de texto a voz
Google TTS + otros proveedores
Tasa base
$0.05/min
Exceso
$0.06/min
Incluido (~min)
~— min
Coincidencia de voz
Clonación de voz patentada (todo incluido)
Tasa base
$0.08/min
Exceso
$0.10/min
Incluido (~min)
~— min
Creador
Doblaje de vídeo
Incluido (~min)
30 min
Tasa base (anual)
$2.64/min
Exceso
$3.20/min
API Servicios
Transcribir + Traducir + Audio de voz
Traducción completa API paquete
Tasa base
$0.11/min
Exceso
$0.13/min
Incluido (~min)
~— min
Traducción + Audio de voz
Paquete de traducción y audio de voz
Tasa base
$0.10/min
Exceso
$0.11/min
Incluido (~min)
~— min
Solo audio de voz
Paquete solo de audio de voz
Tasa base
$0.08/min
Exceso
$0.10/min
Incluido (~min)
~— min
Separación de audio
Pista de voz con reducción de ruido patentada
Tasa base
$0.02/min
Exceso
$0.02/min
Incluido (~min)
~— min
Detección de género
Clasificación de género a partir de la voz y el contexto.
Tasa base
$0.01/min
Exceso
$0.02/min
Incluido (~min)
~— min
Transcripción (STT)
Conversión de voz a texto con diarización de Deepgram
Tasa base
$0.03/min
Exceso
$0.04/min
Incluido (~min)
~— min
Traducción
Google Translate
Tasa base
$0.02/min
Exceso
$0.03/min
Incluido (~min)
~— min
Conversión de texto a voz
Google TTS + otros proveedores
Tasa base
$0.04/min
Exceso
$0.05/min
Incluido (~min)
~— min
Coincidencia de voz
Clonación de voz patentada (todo incluido)
Tasa base
$0.06/min
Exceso
$0.08/min
Incluido (~min)
~— min
Pro
Doblaje de vídeo
Incluido (~min)
120 min
Tasa base (anual)
$1.99/min
Exceso
$2.80/min
API Servicios
Transcribir + Traducir + Audio de voz
Traducción completa API paquete
Tasa base
$0.10/min
Exceso
$0.11/min
Incluido (~min)
~— min
Traducción + Audio de voz
Paquete de traducción y audio de voz
Tasa base
$0.08/min
Exceso
$0.10/min
Incluido (~min)
~— min
Solo audio de voz
Paquete solo de audio de voz
Tasa base
$0.06/min
Exceso
$0.08/min
Incluido (~min)
~— min
Separación de audio
Pista de voz con reducción de ruido patentada
Tasa base
$0.02/min
Exceso
$0.02/min
Incluido (~min)
~— min
Detección de género
Clasificación de género a partir de la voz y el contexto.
Tasa base
$0.01/min
Exceso
$0.01/min
Incluido (~min)
~— min
Transcripción (STT)
Conversión de voz a texto con diarización de Deepgram
Tasa base
$0.02/min
Exceso
$0.03/min
Incluido (~min)
~— min
Traducción
Google Translate
Tasa base
$0.02/min
Exceso
$0.02/min
Incluido (~min)
~— min
Conversión de texto a voz
Google TTS + otros proveedores
Tasa base
$0.03/min
Exceso
$0.04/min
Incluido (~min)
~— min
Coincidencia de voz
Clonación de voz patentada (todo incluido)
Tasa base
$0.05/min
Exceso
$0.06/min
Incluido (~min)
~— min
Negocio
Doblaje de vídeo
Incluido (~min)
500 min
Tasa base (anual)
$1.60/min
Exceso
$2.40/min
API Servicios
Transcribir + Traducir + Audio de voz
Traducción completa API paquete
Tasa base
$0.08/min
Exceso
$0.10/min
Incluido (~min)
~— min
Traducción + Audio de voz
Paquete de traducción y audio de voz
Tasa base
$0.06/min
Exceso
$0.08/min
Incluido (~min)
~— min
Solo audio de voz
Paquete solo de audio de voz
Tasa base
$0.05/min
Exceso
$0.06/min
Incluido (~min)
~— min
Separación de audio
Pista de voz con reducción de ruido patentada
Tasa base
$0.01/min
Exceso
$0.02/min
Incluido (~min)
~— min
Detección de género
Clasificación de género a partir de la voz y el contexto.
Tasa base
$0.01/min
Exceso
$0.01/min
Incluido (~min)
~— min
Transcripción (STT)
Conversión de voz a texto con diarización de Deepgram
Tasa base
$0.02/min
Exceso
$0.03/min
Incluido (~min)
~— min
Traducción
Google Translate
Tasa base
$0.02/min
Exceso
$0.02/min
Incluido (~min)
~— min
Conversión de texto a voz
Google TTS + otros proveedores
Tasa base
$0.02/min
Exceso
$0.03/min
Incluido (~min)
~— min
Coincidencia de voz
Clonación de voz patentada (todo incluido)
Tasa base
$0.03/min
Exceso
$0.05/min
Incluido (~min)
~— min
Los minutos mostrados son equivalentes: tu saldo de créditos se comparte entre todos los servicios. Usar un servicio de menor costo consume menos créditos por minuto.