Skip to Content

异步语音克隆

异步语音克隆 API 专为处理需要更多时间生成的长文本内容而设计。这种方法非常适合:

  • 长篇内容:文章、书籍或大量文档
  • 大规模处理:多个音频文件或批量操作
  • 后台处理:用户可以继续其他活动的任务

工作原理

异步 API 遵循三步流程:

  1. 创建任务:提交您的音频样本和文本进行处理
  2. 监控进度:定期检查任务状态
  3. 下载结果:完成后检索生成的音频

API 端点

端点用途描述
创建任务提交处理请求上传音频和文本开始语音克隆
查询状态监控进度检查当前状态和预计完成时间
获取结果下载音频检索生成的语音克隆

何时使用异步 API

推荐用于:

  • 超过 1000 个字符的文本
  • 高质量音频生成
  • 批量处理多个文本
  • 可以处理延迟结果的应用程序

处理时间:

  • 短文本(1000-5000 字符):2-5 分钟
  • 中等文本(5000-15000 字符):5-10 分钟
  • 长文本(15000+ 字符):10-20 分钟

开始使用

要开始使用异步 API:

  1. 准备内容:确保您的文本超过 1000 个字符
  2. 上传音频样本:提供 5-30 秒的语音样本
  3. 提交任务:使用 创建任务 端点
  4. 监控进度:轮询 查询状态 端点
  5. 下载结果:通过 获取结果 检索音频

对于较短的文本,考虑使用 同步 API 获取即时结果。

异步处理流程概述

异步语音克隆包含以下三个步骤:

  1. 创建任务 - 提交语音克隆任务
  2. 查询状态 - 监控任务进度
  3. 获取结果 - 下载生成的音频

适用场景

  • 文本长度大于1000字符
  • 需要处理多个语音克隆任务
  • 对响应时间要求不高的场景

基本工作流程

使用建议

  • 文本长度: 适合处理大于1000字符的长文本
  • 轮询间隔: 建议每30秒查询一次任务状态
  • 超时处理: 任务超过10分钟未完成请联系技术支持
  • 结果下载: 任务完成后及时下载音频文件

错误处理

常见的异步任务错误:

  • 音频文件格式不支持
  • 文本内容包含不支持的字符
  • API密钥无效或已过期
  • 服务器处理能力不足

创建语音克隆任务

启动一个语音克隆任务。您可以直接上传音频文件,也可以提供现有音频文件的 URL。

请求信息

  • 方法: POST
  • 端点: /api/instant/create-task
  • 内容类型: multipart/form-data

请求参数

参数类型必需描述
audio文件 (二进制)是*用于语音克隆的音频文件。支持的格式包括 WAV、MP3 和 M4A。您必须提供 audioaudio_url 之一。
audio_urlstring是*用于语音克隆的公开可访问的音频文件 URL (WAV, MP3, M4A)。您必须提供 audioaudio_url 之一。
textstring您希望以克隆语音合成的文本。
api_keystring您的唯一 API 密钥,用于认证和访问。此密钥用于验证您的请求并将其链接到您的用户帐户。
voice_idstring可选的语音ID参数

*注意:audioaudio_url 参数二选一,至少提供其中一个。

响应

成功响应

{ "task_id": "1406bf34-735c-4b21-98ac-a135b2afb1c8", "status": "pending" }

错误响应

  • 400 Bad Request: 缺少必需参数(例如 api_key,或 audio/audio_url 均未提供)

示例请求

使用音频文件

curl -X POST https://aivoiceclonefree.com/api/instantcreate-task \ -F "[email protected]" \ -F "text=这是一段很长的文本,适合使用异步接口处理..." \ -F "api_key=your_api_key_here"

使用音频URL

curl -X POST https://aivoiceclonefree.com/api/instant/create-task \ -F "audio_url=https://example.com/sample.mp3" \ -F "text=这是一段很长的文本,适合使用异步接口处理..." \ -F "api_key=your_api_key_here"

任务状态说明

状态描述
pending任务已提交,等待处理
processing任务正在处理中
completed任务已完成
failed任务处理失败

使用建议

  • 适合处理大于1000字符的长文本
  • 建议每30秒查询一次任务状态
  • 任务完成后及时下载音频文件
Last updated on