นักพัฒนา API
ผสานการแปล Addavox เข้ากับขั้นตอนการทำงานของคุณ เลือกการแปล API สำหรับเสียงที่แปลแล้วแบบเดี่ยวๆ หรือเลือกการพากย์วิดีโอ API สำหรับการแปลวิดีโอแบบเต็มรูปแบบ พร้อมการกำหนดเวลา การตรวจสอบคุณภาพ และคำบรรยาย
API คีย์
สร้างคีย์ API ในแอป Addavox แต่ละคีย์ใช้แพ็กเกจและจำนวนนาทีเดียวกับบัญชีของคุณ
จัดการคีย์ APIURL พื้นฐาน:
https://api.addavox.com/api/v1
ส่วนหัวการตรวจสอบสิทธิ์:
X- API -Key: YOUR_KEY
ภาพรวมบริการ
มีคำศัพท์สองคำ API ) สำหรับความต้องการในการแปลภาษาที่แตกต่างกัน
- จุดสิ้นสุด
POST /api/v1/localize- เอาต์พุต
- เสียงแบบเรียงลำดับแบบแยกอิสระ
- ภาษา
- ต่อคำขอหนึ่งครั้ง
- การตรวจสอบคุณภาพ
- ไม่มี
จาก $0.05/นาที
ดูรายละเอียดเพิ่มเติม ↓- จุดสิ้นสุด
POST /api/v1/localize-video- เอาต์พุต
- วิดีโอ + เสียง + คำบรรยายแต่ละภาษา
- ภาษา
- หลายรายการต่อคำขอ
- การตรวจสอบคุณภาพ
- รวมถึง LLM QA ด้วย
- ทบทวน
- เชิญผู้รีวิวผ่านลิงก์วิเศษ
จาก $1.60นาทีต่อภาษา
อัตราค่าบริการรายปีสำหรับธุรกิจ
ดูรายละเอียดเพิ่มเติม ↓คำแปล API
จุดเชื่อมต่อเดียว: POST /api/v1/localize — สร้างไฟล์เสียงแปลแบบแยกต่างหากจากเนื้อหาต้นฉบับของคุณ
แอปพลิเคชันบนเว็บเทียบกับ API นี้: เมื่อคุณใช้ผลิตภัณฑ์ Addavox ในเบราว์เซอร์ งานตัดต่อและแปลภาษาจะเก็บเสียงตัวอย่างไว้ในแต่ละส่วน และเลื่อนการผสมโปรแกรมทั้งหมดออกไปจนกว่าคุณจะดาวน์โหลดไฟล์จากหน้าโครงการ ปลายทาง v1 เหล่านี้สร้างเอาต์พุตที่เชื่อมต่อกันเป็นส่วนหนึ่งของงาน ดังนั้นไคลเอนต์ API จึงสามารถดึงผลลัพธ์ได้โดยไม่ต้องมีขั้นตอนการส่งออกแยกต่างหาก
คุณให้ข้อมูล
- เสียงต้นฉบับ
- ภาษาต้นฉบับ + ภาษาเป้าหมาย
เราจัดการ
- การถอดเสียง
- การแปล
- เสียงพูดที่ตรงกับผู้พูด
- การเย็บแบบเรียงลำดับ
จาก $0.08/นาที
อัตราค่าบริการสำหรับแผนธุรกิจ ดูราคา →
คุณให้ข้อมูล
- เสียงต้นฉบับ
- การถอดเสียงพร้อมระบุเวลาในแต่ละส่วน
- ภาษาต้นฉบับ + ภาษาเป้าหมาย
เราจัดการ
- การแปล
- เสียงพูดที่ตรงกับผู้พูด
- การเย็บแบบเรียงลำดับ
จาก $0.06/นาที
อัตราค่าบริการสำหรับแผนธุรกิจ ดูราคา →
คุณให้ข้อมูล
- เสียงต้นฉบับ
- การถอดเสียงและการแปล พร้อมระบุเวลาในแต่ละส่วน
เราจัดการ
- เสียงพูดที่ตรงกับผู้พูด
- การเย็บแบบเรียงลำดับ
จาก $0.05/นาที
อัตราค่าบริการสำหรับแผนธุรกิจ ดูราคา →
วิธีการทำงาน
รูปแบบเอาต์พุต
โปรแกรม API สร้างไฟล์เสียงแบบเรียงลำดับที่เป็นอิสระ แต่ละส่วนที่แปลแล้วจะถูกสร้างขึ้นและเชื่อมต่อกันตามลำดับโดยมีช่วงหยุดสั้นๆ ระหว่างแต่ละส่วน ผลลัพธ์ที่ได้จะไม่ตรงกับเวลาของไฟล์ต้นฉบับ แต่เป็นไฟล์เสียงใหม่ที่ออกแบบมาให้ฟังได้โดยอิสระ
เหตุใดจึงต้องระบุไฟล์เสียงต้นฉบับและช่วงเวลา?
ข้อมูลเสียงต้นฉบับและเวลาเริ่มต้น (start_time, end_time) จะถูกใช้เพื่อระบุและจับคู่เสียงของผู้พูดแต่ละคนในบันทึกต้นฉบับ これにより、ユーザーはリンドのユーザーのユーザーになります。 เวลาเหล่านี้ไม่ได้ควบคุมจังหวะเวลาของการส่งออกเสียง
ไม่มีการตรวจสอบคุณภาพหรือการจับคู่ระยะเวลา
แตกต่างจากการพากย์เสียงวิดีโอ การแปล API จะไม่ทำการแก้ไขข้อความ ปรับจังหวะ หรือจัดตำแหน่งเวลาให้ตรงกัน นี่คือสิ่งที่ทำให้การแปลนี้เร็วขึ้นและประหยัดกว่า หากคุณต้องการให้เสียงซิงค์กับวิดีโอต้นฉบับโดยกำหนดเวลาในระดับเฟรม ให้ใช้การพากย์เสียงวิดีโอ API
ตัวอย่างโค้ด
การพากย์เสียงวิดีโอ API
จุดเชื่อมต่อ: POST /api/v1/localize-video — การแปลวิดีโอแบบเต็มรูปแบบพร้อมการกำหนดเวลา คุณภาพ และคำบรรยาย
งานที่เริ่มต้นผ่าน API นี้จะสร้างผลลัพธ์แยกตามภาษาเมื่อการทำงานเสร็จสมบูรณ์ แอป Addavox ในเบราว์เซอร์ใช้กลไกการแปลเดียวกัน แต่จะเลื่อนการส่งไฟล์ผสมทั้งหมดไปยังขั้นตอนการดาวน์โหลดของโครงการ เว้นแต่จะระบุไว้เป็นอย่างอื่น
คุณให้ข้อมูล
- ลิงก์วิดีโอ
- ภาษาต้นฉบับ
- ภาษาเป้าหมาย (หนึ่งภาษาขึ้นไป)
เราจัดการ
- การแยกเสียง/วิดีโอ
- การถอดเสียง
- การแปล
- การประกันคุณภาพ LLM
- การสังเคราะห์เสียง
- การจัดเรียงเวลา
- การสร้างคำบรรยาย
- การแสดงผลวิดีโอตามภาษา
รูปแบบเอาต์พุต
วิดีโอ เสียง และคำบรรยายแยกตามแต่ละภาษา สามารถดาวน์โหลดไฟล์ซิปที่มีทุกภาษาได้เช่นกัน ลิงก์ URL ที่ลงชื่อแล้วจะหมดอายุภายใน 24 ชั่วโมง
งานที่ต้องใช้หลายภาษา
คำขอเดียว รองรับหลายภาษา งานหลักจะสร้างงานย่อยสำหรับแต่ละภาษา ตรวจสอบสถานะของงานหลักสำหรับแต่ละภาษา ค่าสถานะ: เข้าคิว → กำลังทำงาน → เสร็จสมบูรณ์ → ล้มเหลว
ขั้นตอนการทำงานของผู้ตรวจสอบ
เชิญผู้ตรวจสอบจากภายนอกผ่านทาง API ผู้ตรวจสอบแต่ละคนจะได้รับอีเมลลิงก์พิเศษเพื่อแก้ไขการแปลในโปรแกรมแก้ไขเว็บ — ไม่จำเป็นต้องมีบัญชีผู้ใช้
ตัวอย่างโค้ด
ความยินยอมและการอนุญาต
คำขอ API ทั้งหมดต้องมีออบเจ็กต์ความยินยอมและฟิลด์โหมดระดับบนสุด เมื่อรวมกันแล้วจะสร้างบันทึกการรับรองต่องานเพื่อยืนยันว่าคุณมีสิทธิ์ที่จำเป็นและความยินยอมจากผู้พูด
ช่องโหมดจะกำหนดระบบสังเคราะห์เสียง: "voice_matched" ใช้การจำลองเสียงของผู้พูด ส่วน "standard" ใช้ระบบสังเคราะห์เสียงพูด (TTS) ทั้งสองโหมดมีราคาเท่ากัน การเลือกโหมดขึ้นอยู่กับความยินยอมของผู้ใช้เท่านั้น
โหมดจับคู่เสียง — ต้องได้รับความยินยอมอย่างเต็มรูปแบบ
โหมดมาตรฐาน — เฉพาะสิทธิ์ในเนื้อหา
การอ้างอิงภาคสนาม
| สนาม | พิมพ์ | ที่จำเป็น | คำอธิบาย |
|---|---|---|---|
| mode | string | ระดับสูงสุด | voice_matched หรือ standard |
| speaker_consent_obtained | boolean | จับคู่เสียงเท่านั้น | ได้รับความยินยอมอย่างชัดแจ้งจากผู้พูดที่สามารถระบุตัวตนได้ |
| content_rights_confirmed | boolean | ทั้งสองโหมด | กรรมสิทธิ์หรือใบอนุญาตที่ถูกต้องในเนื้อหา |
| eula_accepted | boolean | ทั้งสองโหมด | ยอมรับข้อตกลงการใช้งาน Addavox |
| attested_by | string | ทั้งสองโหมด | อีเมลหรือข้อมูลระบุตัวตนของผู้รับผิดชอบ |
| attested_at | ISO 8601 | ทั้งสองโหมด | ภายใน 24 ชั่วโมงหลังจากเวลาที่ร้องขอ |
รหัสข้อผิดพลาดการยินยอม
| ทศนิยม | รหัส | เงื่อนไข |
|---|---|---|
| 403 | CONSENT_MISSING | ไม่มีผู้คัดค้านการยินยอม |
| 403 | CONSENT_INCOMPLETE | ขาดข้อมูล attested_by หรือ at ไม่ถูกต้อง |
| 403 | CONSENT_NOT_AFFIRMED | สิทธิ์หรือข้อตกลงการใช้งานไม่ได้ถูกยืนยัน |
| 403 | CONSENT_EXPIRED | ได้รับการรับรองเมื่อนานกว่า 24 ชั่วโมง |
| 403 | SPEAKER_CONSENT_REQUIRED | จับคู่เสียงโดยไม่ได้รับความยินยอมจากผู้พูด |
| 400 | INVALID_MODE | ค่าโหมดไม่ถูกต้อง |
API อ้างอิง
แผนผังเชิงโต้ตอบแบบเต็มรูปแบบและจุดเชื่อมต่อเพิ่มเติมสามารถเข้าถึงได้ผ่านทาง Open API
จุดสิ้นสุด
| POST /localize | การแปลล่วงหน้า / การถอดเสียงบางส่วนสำหรับไฟล์เสียง |
| POST /localize-video | พากย์เสียงวิดีโอเต็มรูปแบบ (หลายภาษา) |
| GET /jobs/{job_id} | สถานะงาน |
| GET /jobs/{job_id}/result | สิ่งที่ต้องส่งมอบ (URL, ไฟล์ซิป) |
| GET /jobs | รายชื่อตำแหน่งงาน |
| DELETE /jobs/{job_id} | ยกเลิกงาน |
| GET /account | ข้อมูลบัญชี |
| GET /voices | แคตตาล็อกเสียง TTS |
| GET /languages | ภาษาที่รองรับ |
| POST /projects/{id}/reviewers | เชิญผู้ตรวจสอบ |
| GET|POST /jobs/{id}/webhooks | สถานะ Webhook / ลองใหม่ |
API การกำหนดราคาบริการ
อัตราค่าบริการต่อนาทีขึ้นอยู่กับแผนการสมัครสมาชิก อัตราด้านล่างเป็นราคาต่อปีของแผนธุรกิจ (ส่วนลด 20%) ดูตารางเต็มสำหรับทุกแผนและบริการ
อัตราค่าบริการสำหรับแผนธุรกิจที่แสดงนี้รวมส่วนลดประจำปีแล้ว
ฟรี
การพากย์เสียงวิดีโอ
รวมอยู่ด้วย (~นาที)
2 min
อัตราดอกเบี้ยพื้นฐาน (รายปี)
/min
ส่วนเกิน
$4.00/min
API บริการ
การแยกเสียง
แทร็กเสียงที่ลดเสียงรบกวนด้วยเทคโนโลยีเฉพาะ
อัตราพื้นฐาน
$0.03/min
ส่วนเกิน
$0.04/min
รวมอยู่ด้วย (~นาที)
~— min
การตรวจจับเพศ
การจำแนกเพศจากเสียงและบริบท
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.02/min
รวมอยู่ด้วย (~นาที)
~— min
การถอดเสียง (STT)
Deepgram แปลงเสียงเป็นข้อความพร้อมระบบแยกเสียงพูด
อัตราพื้นฐาน
$0.05/min
ส่วนเกิน
$0.06/min
รวมอยู่ด้วย (~นาที)
~— min
การแปล
Google Translate
อัตราพื้นฐาน
$0.03/min
ส่วนเกิน
$0.04/min
รวมอยู่ด้วย (~นาที)
~— min
การแปลงข้อความเป็นเสียงพูด
Google TTS + ผู้ให้บริการอื่นๆ
อัตราพื้นฐาน
$0.06/min
ส่วนเกิน
$0.08/min
รวมอยู่ด้วย (~นาที)
~— min
การจับคู่เสียง
เทคโนโลยีการโคลนเสียงที่เป็นกรรมสิทธิ์ (แบบครบวงจร)
อัตราพื้นฐาน
$0.08/min
ส่วนเกิน
$0.10/min
รวมอยู่ด้วย (~นาที)
~— min
สตาร์ทเตอร์
การพากย์เสียงวิดีโอ
รวมอยู่ด้วย (~นาที)
10 min
อัตราดอกเบี้ยพื้นฐาน (รายปี)
$2.80/min
ส่วนเกิน
$3.60/min
API บริการ
การแยกเสียง
แทร็กเสียงที่ลดเสียงรบกวนด้วยเทคโนโลยีเฉพาะ
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.03/min
รวมอยู่ด้วย (~นาที)
~— min
การตรวจจับเพศ
การจำแนกเพศจากเสียงและบริบท
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.02/min
รวมอยู่ด้วย (~นาที)
~— min
การถอดเสียง (STT)
Deepgram แปลงเสียงเป็นข้อความพร้อมระบบแยกเสียงพูด
อัตราพื้นฐาน
$0.04/min
ส่วนเกิน
$0.05/min
รวมอยู่ด้วย (~นาที)
~— min
การแปล
Google Translate
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.03/min
รวมอยู่ด้วย (~นาที)
~— min
การแปลงข้อความเป็นเสียงพูด
Google TTS + ผู้ให้บริการอื่นๆ
อัตราพื้นฐาน
$0.05/min
ส่วนเกิน
$0.06/min
รวมอยู่ด้วย (~นาที)
~— min
การจับคู่เสียง
เทคโนโลยีการโคลนเสียงที่เป็นกรรมสิทธิ์ (แบบครบวงจร)
อัตราพื้นฐาน
$0.08/min
ส่วนเกิน
$0.10/min
รวมอยู่ด้วย (~นาที)
~— min
ผู้สร้าง
การพากย์เสียงวิดีโอ
รวมอยู่ด้วย (~นาที)
30 min
อัตราดอกเบี้ยพื้นฐาน (รายปี)
$2.64/min
ส่วนเกิน
$3.20/min
API บริการ
ถอดเสียง + แปล + บันทึกเสียง
ชุดคำแปลฉบับเต็ม API
อัตราพื้นฐาน
$0.11/min
ส่วนเกิน
$0.13/min
รวมอยู่ด้วย (~นาที)
~— min
แปล + เสียงพากย์
แพ็กเกจแปล + เสียง
อัตราพื้นฐาน
$0.10/min
ส่วนเกิน
$0.11/min
รวมอยู่ด้วย (~นาที)
~— min
เฉพาะเสียงพูด
แพ็กเกจเสียงเท่านั้น
อัตราพื้นฐาน
$0.08/min
ส่วนเกิน
$0.10/min
รวมอยู่ด้วย (~นาที)
~— min
การแยกเสียง
แทร็กเสียงที่ลดเสียงรบกวนด้วยเทคโนโลยีเฉพาะ
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.02/min
รวมอยู่ด้วย (~นาที)
~— min
การตรวจจับเพศ
การจำแนกเพศจากเสียงและบริบท
อัตราพื้นฐาน
$0.01/min
ส่วนเกิน
$0.02/min
รวมอยู่ด้วย (~นาที)
~— min
การถอดเสียง (STT)
Deepgram แปลงเสียงเป็นข้อความพร้อมระบบแยกเสียงพูด
อัตราพื้นฐาน
$0.03/min
ส่วนเกิน
$0.04/min
รวมอยู่ด้วย (~นาที)
~— min
การแปล
Google Translate
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.03/min
รวมอยู่ด้วย (~นาที)
~— min
การแปลงข้อความเป็นเสียงพูด
Google TTS + ผู้ให้บริการอื่นๆ
อัตราพื้นฐาน
$0.04/min
ส่วนเกิน
$0.05/min
รวมอยู่ด้วย (~นาที)
~— min
การจับคู่เสียง
เทคโนโลยีการโคลนเสียงที่เป็นกรรมสิทธิ์ (แบบครบวงจร)
อัตราพื้นฐาน
$0.06/min
ส่วนเกิน
$0.08/min
รวมอยู่ด้วย (~นาที)
~— min
โปร
การพากย์เสียงวิดีโอ
รวมอยู่ด้วย (~นาที)
120 min
อัตราดอกเบี้ยพื้นฐาน (รายปี)
$1.99/min
ส่วนเกิน
$2.80/min
API บริการ
ถอดเสียง + แปล + บันทึกเสียง
ชุดคำแปลฉบับเต็ม API
อัตราพื้นฐาน
$0.10/min
ส่วนเกิน
$0.11/min
รวมอยู่ด้วย (~นาที)
~— min
แปล + เสียงพากย์
แพ็กเกจแปล + เสียง
อัตราพื้นฐาน
$0.08/min
ส่วนเกิน
$0.10/min
รวมอยู่ด้วย (~นาที)
~— min
เฉพาะเสียงพูด
แพ็กเกจเสียงเท่านั้น
อัตราพื้นฐาน
$0.06/min
ส่วนเกิน
$0.08/min
รวมอยู่ด้วย (~นาที)
~— min
การแยกเสียง
แทร็กเสียงที่ลดเสียงรบกวนด้วยเทคโนโลยีเฉพาะ
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.02/min
รวมอยู่ด้วย (~นาที)
~— min
การตรวจจับเพศ
การจำแนกเพศจากเสียงและบริบท
อัตราพื้นฐาน
$0.01/min
ส่วนเกิน
$0.01/min
รวมอยู่ด้วย (~นาที)
~— min
การถอดเสียง (STT)
Deepgram แปลงเสียงเป็นข้อความพร้อมระบบแยกเสียงพูด
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.03/min
รวมอยู่ด้วย (~นาที)
~— min
การแปล
Google Translate
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.02/min
รวมอยู่ด้วย (~นาที)
~— min
การแปลงข้อความเป็นเสียงพูด
Google TTS + ผู้ให้บริการอื่นๆ
อัตราพื้นฐาน
$0.03/min
ส่วนเกิน
$0.04/min
รวมอยู่ด้วย (~นาที)
~— min
การจับคู่เสียง
เทคโนโลยีการโคลนเสียงที่เป็นกรรมสิทธิ์ (แบบครบวงจร)
อัตราพื้นฐาน
$0.05/min
ส่วนเกิน
$0.06/min
รวมอยู่ด้วย (~นาที)
~— min
ธุรกิจ
การพากย์เสียงวิดีโอ
รวมอยู่ด้วย (~นาที)
500 min
อัตราดอกเบี้ยพื้นฐาน (รายปี)
$1.60/min
ส่วนเกิน
$2.40/min
API บริการ
ถอดเสียง + แปล + บันทึกเสียง
ชุดคำแปลฉบับเต็ม API
อัตราพื้นฐาน
$0.08/min
ส่วนเกิน
$0.10/min
รวมอยู่ด้วย (~นาที)
~— min
แปล + เสียงพากย์
แพ็กเกจแปล + เสียง
อัตราพื้นฐาน
$0.06/min
ส่วนเกิน
$0.08/min
รวมอยู่ด้วย (~นาที)
~— min
เฉพาะเสียงพูด
แพ็กเกจเสียงเท่านั้น
อัตราพื้นฐาน
$0.05/min
ส่วนเกิน
$0.06/min
รวมอยู่ด้วย (~นาที)
~— min
การแยกเสียง
แทร็กเสียงที่ลดเสียงรบกวนด้วยเทคโนโลยีเฉพาะ
อัตราพื้นฐาน
$0.01/min
ส่วนเกิน
$0.02/min
รวมอยู่ด้วย (~นาที)
~— min
การตรวจจับเพศ
การจำแนกเพศจากเสียงและบริบท
อัตราพื้นฐาน
$0.01/min
ส่วนเกิน
$0.01/min
รวมอยู่ด้วย (~นาที)
~— min
การถอดเสียง (STT)
Deepgram แปลงเสียงเป็นข้อความพร้อมระบบแยกเสียงพูด
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.03/min
รวมอยู่ด้วย (~นาที)
~— min
การแปล
Google Translate
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.02/min
รวมอยู่ด้วย (~นาที)
~— min
การแปลงข้อความเป็นเสียงพูด
Google TTS + ผู้ให้บริการอื่นๆ
อัตราพื้นฐาน
$0.02/min
ส่วนเกิน
$0.03/min
รวมอยู่ด้วย (~นาที)
~— min
การจับคู่เสียง
เทคโนโลยีการโคลนเสียงที่เป็นกรรมสิทธิ์ (แบบครบวงจร)
อัตราพื้นฐาน
$0.03/min
ส่วนเกิน
$0.05/min
รวมอยู่ด้วย (~นาที)
~— min
จำนวนนาทีที่แสดงนั้นเท่ากัน — เครดิตของคุณจะถูกใช้ร่วมกันในทุกบริการ การใช้บริการที่มีราคาต่ำกว่าจะใช้เครดิตต่อนาทีน้อยกว่า