开发者API
将Addavox本地化集成到您的工作流程中。选择翻译API以获取独立的翻译音频,或选择视频配音API以获取包含时间轴、质量保证和字幕的完整视频本地化。
API键
在Addavox应用中生成API密钥。每个密钥都使用与您的帐户相同的套餐和包含的通话时长。
管理API键基本 URL:
https://api.addavox.com/api/v1
身份验证标头:
X-__ API __-键:您的键
服务概述
两个API ,满足不同的本地化需求。
翻译API
单一端点:POST /api/v1/localize — 从源内容生成独立的翻译音频。
Web 应用与此API的区别:当您在浏览器中使用Addavox产品时,片段编辑和本地化作业会在每个片段上保留预览音频,并将完整的混合节目延迟到您从项目页面下载素材后才会生成。这些 v1 端点会在作业过程中构建拼接输出,因此API客户端无需单独的导出步骤即可获取结果。
工作原理
输出格式
API会生成一个独立的顺序音频文件。每个翻译片段都会按顺序生成并拼接在一起,片段之间有短暂的停顿。输出文件与原始音频在时间上没有对齐——它是一个全新的音频文件,旨在独立播放。
为什么要提供源音频和时间戳?
源音频和分段时间戳(start_time,end_time)用于识别和匹配原始录音中每个说话者的声音。这使得生成的音频听起来像原始说话者的声音。这些时间戳不控制输出时序。
没有质量保证或持续时间匹配
与视频配音不同,翻译API不进行文本重写、语速调整或时间对齐。因此,它速度更快、价格更实惠。如果您需要音频与原始视频帧级同步,请使用视频配音API 。
代码示例
视频配音API表_0__
端点:POST /api/v1/localize-video — 完整的视频本地化,包括时间轴、质量保证和字幕。
通过此API启动的任务会在工作完成后生成每种语言的交付物。浏览器内Addavox应用程序使用相同的本地化引擎,但除非另有说明,否则会将完整的混合资源延迟到项目下载流程中。
您提供
- 视频网址
- 源语言
- 目标语言(一种或多种)
我们处理
- 音频/视频分离
- 转录
- 翻译
- 法学硕士质量保证
- 语音合成
- 时序对齐
- 字幕生成
- 按语言进行视频渲染
输出格式
提供多种语言的视频、音频和字幕。另提供包含所有语言的压缩包下载。签名链接将在 24 小时后失效。
多语言工作
一个请求,多种语言。主作业会根据语言生成子作业。轮询主作业以获取每种语言的状态。状态值:已排队 → 运行中 → 已完成 | 失败。
审阅者工作流程
通过API邀请人工审校人员。每位审校人员都会收到一封包含神奇链接的电子邮件,用于在网页编辑器中编辑本地化内容——无需注册帐户。
代码示例
同意与授权
所有API请求都必须包含一个同意对象和一个顶级模式字段。这些字段共同构成一份针对每个作业的证明记录,确认您拥有必要的权利和发言人同意。
模式字段决定语音合成方式:“voice_matched”使用说话人语音克隆,“standard”使用合成文本转语音(TTS)。两种模式价格相同——选择完全取决于用户意愿。
语音匹配模式——需获得完全同意
标准模式——仅限内容权限
字段参考
| 场地 | 类型 | 必需的 | 描述 |
|---|---|---|---|
| mode | string | 顶级 | voice_matched 或者 standard |
| speaker_consent_obtained | boolean | 仅语音匹配 | 获得可识别发言者的明确同意 |
| content_rights_confirmed | boolean | 两种模式 | 对内容的拥有权或有效许可 |
| eula_accepted | boolean | 两种模式 | 接受Addavox最终用户许可协议 |
| attested_by | string | 两种模式 | 负责人的电子邮件地址或标识符 |
| attested_at | ISO 8601 | 两种模式 | 请求发出后24小时内 |
同意错误代码
| HTTP | 代码 | 健康)状况 |
|---|---|---|
| 403 | CONSENT_MISSING | 无同意对象 |
| 403 | CONSENT_INCOMPLETE | 缺少 attested_by 或 attested_at 无效 |
| 403 | CONSENT_NOT_AFFIRMED | 权利或最终用户许可协议未得到确认。 |
| 403 | CONSENT_EXPIRED | attested_at 超过 24 小时 |
| 403 | SPEAKER_CONSENT_REQUIRED | 未经说话人同意的语音匹配 |
| 400 | INVALID_MODE | 无效的模式值 |
API参考
完整的交互式架构和其他端点可通过 Open API获取。
终点
| POST /localize | 预翻译/部分转录音频本地化 |
| POST /localize-video | 完整视频配音(多语言) |
| GET /jobs/{job_id} | 职位状态 |
| GET /jobs/{job_id}/result | 交付物(URL、压缩包) |
| GET /jobs | 职位列表 |
| DELETE /jobs/{job_id} | 取消工作 |
| GET /account | 账户信息 |
| GET /voices | TTS语音目录 |
| GET /languages | 支持的语言 |
| POST /projects/{id}/reviewers | 邀请审稿人 |
| GET|POST /jobs/{id}/webhooks | Webhook 状态/重试 |
API服务定价
按订阅套餐计费,每分钟收费标准不同。以下价格为商务套餐年费(享八折优惠)。查看完整表格了解所有套餐和服务详情。
所示商业计划价格已包含年度折扣。
自由的
视频配音
包含(约分钟)
2 min
基准利率(年利率)
/min
超重
$4.00/min
API服务
音频分离
专有降噪语音轨道
基准利率
$0.03/min
超重
$0.04/min
包含(约分钟)
~— min
性别检测
根据语音和语境进行性别分类
基准利率
$0.02/min
超重
$0.02/min
包含(约分钟)
~— min
转录(STT)
Deepgram语音转文本功能(带语音分割)
基准利率
$0.05/min
超重
$0.06/min
包含(约分钟)
~— min
翻译
谷歌翻译
基准利率
$0.03/min
超重
$0.04/min
包含(约分钟)
~— min
文本转语音
Google TTS 及其他服务提供商
基准利率
$0.06/min
超重
$0.08/min
包含(约分钟)
~— min
语音匹配
专有语音克隆(全功能)
基准利率
$0.08/min
超重
$0.10/min
包含(约分钟)
~— min
起动机
视频配音
包含(约分钟)
10 min
基准利率(年利率)
$2.80/min
超重
$3.60/min
API服务
音频分离
专有降噪语音轨道
基准利率
$0.02/min
超重
$0.03/min
包含(约分钟)
~— min
性别检测
根据语音和语境进行性别分类
基准利率
$0.02/min
超重
$0.02/min
包含(约分钟)
~— min
转录(STT)
Deepgram语音转文本功能(带语音分割)
基准利率
$0.04/min
超重
$0.05/min
包含(约分钟)
~— min
翻译
谷歌翻译
基准利率
$0.02/min
超重
$0.03/min
包含(约分钟)
~— min
文本转语音
Google TTS 及其他服务提供商
基准利率
$0.05/min
超重
$0.06/min
包含(约分钟)
~— min
语音匹配
专有语音克隆(全功能)
基准利率
$0.08/min
超重
$0.10/min
包含(约分钟)
~— min
创作者
视频配音
包含(约分钟)
30 min
基准利率(年利率)
$2.64/min
超重
$3.20/min
API服务
转录+翻译+语音音频
完整翻译API包
基准利率
$0.11/min
超重
$0.13/min
包含(约分钟)
~— min
翻译 + 语音音频
翻译 + 语音音频包
基准利率
$0.10/min
超重
$0.11/min
包含(约分钟)
~— min
仅语音音频
仅语音音频包
基准利率
$0.08/min
超重
$0.10/min
包含(约分钟)
~— min
音频分离
专有降噪语音轨道
基准利率
$0.02/min
超重
$0.02/min
包含(约分钟)
~— min
性别检测
根据语音和语境进行性别分类
基准利率
$0.01/min
超重
$0.02/min
包含(约分钟)
~— min
转录(STT)
Deepgram语音转文本功能(带语音分割)
基准利率
$0.03/min
超重
$0.04/min
包含(约分钟)
~— min
翻译
谷歌翻译
基准利率
$0.02/min
超重
$0.03/min
包含(约分钟)
~— min
文本转语音
Google TTS 及其他服务提供商
基准利率
$0.04/min
超重
$0.05/min
包含(约分钟)
~— min
语音匹配
专有语音克隆(全功能)
基准利率
$0.06/min
超重
$0.08/min
包含(约分钟)
~— min
专业版
视频配音
包含(约分钟)
120 min
基准利率(年利率)
$1.99/min
超重
$2.80/min
API服务
转录+翻译+语音音频
完整翻译API包
基准利率
$0.10/min
超重
$0.11/min
包含(约分钟)
~— min
翻译 + 语音音频
翻译 + 语音音频包
基准利率
$0.08/min
超重
$0.10/min
包含(约分钟)
~— min
仅语音音频
仅语音音频包
基准利率
$0.06/min
超重
$0.08/min
包含(约分钟)
~— min
音频分离
专有降噪语音轨道
基准利率
$0.02/min
超重
$0.02/min
包含(约分钟)
~— min
性别检测
根据语音和语境进行性别分类
基准利率
$0.01/min
超重
$0.01/min
包含(约分钟)
~— min
转录(STT)
Deepgram语音转文本功能(带语音分割)
基准利率
$0.02/min
超重
$0.03/min
包含(约分钟)
~— min
翻译
谷歌翻译
基准利率
$0.02/min
超重
$0.02/min
包含(约分钟)
~— min
文本转语音
Google TTS 及其他服务提供商
基准利率
$0.03/min
超重
$0.04/min
包含(约分钟)
~— min
语音匹配
专有语音克隆(全功能)
基准利率
$0.05/min
超重
$0.06/min
包含(约分钟)
~— min
商业
视频配音
包含(约分钟)
500 min
基准利率(年利率)
$1.60/min
超重
$2.40/min
API服务
转录+翻译+语音音频
完整翻译API包
基准利率
$0.08/min
超重
$0.10/min
包含(约分钟)
~— min
翻译 + 语音音频
翻译 + 语音音频包
基准利率
$0.06/min
超重
$0.08/min
包含(约分钟)
~— min
仅语音音频
仅语音音频包
基准利率
$0.05/min
超重
$0.06/min
包含(约分钟)
~— min
音频分离
专有降噪语音轨道
基准利率
$0.01/min
超重
$0.02/min
包含(约分钟)
~— min
性别检测
根据语音和语境进行性别分类
基准利率
$0.01/min
超重
$0.01/min
包含(约分钟)
~— min
转录(STT)
Deepgram语音转文本功能(带语音分割)
基准利率
$0.02/min
超重
$0.03/min
包含(约分钟)
~— min
翻译
谷歌翻译
基准利率
$0.02/min
超重
$0.02/min
包含(约分钟)
~— min
文本转语音
Google TTS 及其他服务提供商
基准利率
$0.02/min
超重
$0.03/min
包含(约分钟)
~— min
语音匹配
专有语音克隆(全功能)
基准利率
$0.03/min
超重
$0.05/min
包含(约分钟)
~— min
显示的分钟数是等效的——您的积分池在所有服务中共享。使用费用较低的服务,每分钟消耗的积分也会减少。